服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - PHP教程 - PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]

PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]

2019-12-19 15:04PHP教程网 PHP教程

在PHP中,使substr函数截取字符串末位会出现乱码,因为中文UTF-8编码,每个汉字占3字节,而GB2312占2字节,英文占1字节,截取位不准确,造成断开的字符会把其后的..拉过来一起做一个字,所以出现了乱码。

substr --- 取得部份字符串 
语法 : string substr (string string, int start [, int length]) 
说明 : 
substr( )传回 string的一部份字符串,由参数 start和 length指定。 
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", 1); // returns "bcdef" 
$rest = substr ("abcdef", 1, 3); // returns "bcd" 
?> 


如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", -1); // returns "f" 
$rest = substr ("abcdef", -2); // returns "ef" 
$rest = substr ("abcdef", -3, 1); // returns "d" 
?> 


如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。 
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", 1, -1); // returns "bcde" 
?> 


dongyue,2005-01-07 11:10:41 
substr --- 取得部份字符串 
语法 : string substr (string string, int start [, int length]) 
说明 : 
substr( )传回 string的一部份字符串,由参数 start和 length指定。 
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", 1); // returns "bcdef" 
$rest = substr ("abcdef", 1, 3); // returns "bcd" 
?> 


如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", -1); // returns "f" 
$rest = substr ("abcdef", -2); // returns "ef" 
$rest = substr ("abcdef", -3, 1); // returns "d" 
?> 


如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。 
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。 
Example : 

复制代码代码如下:


<?php 
$rest = substr ("abcdef", 1, -1); // returns "bcde" 
?> 


Utf-8、gb2312都支持的汉字截取函数 

复制代码代码如下:


//截取中文字符串 
/* 
Utf-8、gb2312都支持的汉字截取函数 
cut_str(字符串, 截取长度, 开始长度, 编码); 
编码默认为 utf-8 
开始长度默认为 0 
*/function cut_str($string, $sublen, $start = 0, $code = 'UTF-8') 

if($code == 'UTF-8') 

$pa ="/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; 
preg_match_all($pa, $string, $t_string); if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen)); 
return join('', array_slice($t_string[0], $start, $sublen)); 

else 

$start = $start*2; 
$sublen = $sublen*2; 
$strlen = strlen($string); 
$tmpstr = ''; for($i=0; $i<$strlen; $i++) 

if($i>=$start && $i<($start+$sublen)) 

if(ord(substr($string, $i, 1))>129) 

$tmpstr.= substr($string, $i, 2); 

else 

$tmpstr.= substr($string, $i, 1); 


if(ord(substr($string, $i, 1))>129) $i++; 

if(strlen($tmpstr)<$strlen ) $tmpstr.= ""; 
return $tmpstr; 


$str="服务器之家一个不错的网站"; 
echo cut_str($str, 8, 5, 'gb2312'); 

延伸 · 阅读

精彩推荐