服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - PHP教程 - PHP 中关于ord($str)0x80的详细说明

PHP 中关于ord($str)0x80的详细说明

2020-01-12 17:45PHP教程网 PHP教程

为了识别双字节的字符,比如汉字或日文韩文等都是占两字节的,每字节高位为1,而一般西文字符只有一个字节,七位有效编码,高位为0而0x80对应的二进制代码为1000 0000,最高位为一,代表汉字.汉字编码格式通称为10格式. 一个汉字占

GBK简体字符集的编码是同时用1个字节和2个字节来表示的。当高位是0x00~0x7f时,为一个字节,高位为0x80以上时用2个字节表示" 

注:括号里面都是2进制 

当你发现一个字节的内容大于0x7f,那它肯定是个(跟另外一个字节拼凑成一个)汉字,如何判断肯定大于0x7f呢? 
0x7f(1111111)后面一个数就是0x80(10000000),所以想要大于0x7f,这个字节的最高位都肯定是1,我们只需要判断这个最高位是否为1就行了。 

判断方法: 

位与(相同的位都是1的才为1,否则为0): 
如:要判断一个数的第三位是否是1,只要跟4(100)位与,判断一个数的第2位是否为1就跟2(10)位与. 
同理判断第八位是否为1只要跟(10000000)也就是0x80位与了. 

这里为什么不用>0x7f,php可能还行,但在其他强类型语言里面,1个字节的最高位用来标示负数,一个负数肯定不可能大于0x7f(最大的整数) 

再举个例子: 
a的assic码是97(1100001) 
A的assic码是65(1000001) 

b的assic码是98(1100010) 
b的assic码是66(1000010) 

发现一个规律:一个a-z的字母,只要是小写字母,第六位肯定是1,我们可以用这个来判断大小写: 
这时候只要跟用以个字母跟0x20(100000)来位与判断: 

order-top: 1px solid rgb(0, 153, 204); border-right: 1px solid rgb(0, 153, 204); border-left: 1px solid rgb(0, 153, 204); border-image: initial; border-bottom: none; font-family: tahoma, arial, "Microsoft YaHei";"> 复制代码代码如下:


if(ord($a)&0x20){ 
//大写 


如何把所有字母改成大写?第六位的1改成0就行了: 

复制代码代码如下:


$a='a'; 
$a = chr(ord($a)&(~0x20)); 
echo $a; 

延伸 · 阅读

精彩推荐