php字符串截取函数substr:
string substr ( string $string , int $start [, int $length ] )
返回string中从start位置开始长度为length的字符串
substr函数在截取字符,是按字节来截取的,中文字符在GB2312编码时为2个字节,utf-8编码时为3个字节,所以截取指定长度的字符串时如果截断了汉字,那么返回的结果显示出来便会出现乱码。
下面提供二个解决方法,供大家参考。
1,改用mb_substr函数
string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )
类似substr()函数,只是计数按字符数来计,保证字符安全
使用mb_substr()函数可保证不会出现乱码。
缺点:长度统计变成了字符数统计,而不是按字节数统计。用于显示时,同样长度的中文结果和英文结果会出现较大的显示长度的差别。
2,自建函数增强substr功能
中文字符按2个长度单位来计算,使得中英文混用环境下字符串截取结果最后的显示长度接近;
舍弃最后一个不完整字符,保证不会出现显示上的乱码;且兼容了中文字符常用的utf-8编码和GB2312编码,有很好的通用性。
完整代码如下(用到了strtolower()函数):
<?php /** * 增强型字符串截取函数 * 截取中文字符无乱码 * edit www. */ function getstr($string, $length, $encoding = 'utf-8') { $string = trim($string); if($length && strlen($string) > $length) { //截断字符 $wordscut = ''; if(strtolower($encoding) == 'utf-8') { //utf8编码 $n = 0; $tn = 0; $noc = 0; while ($n < strlen($string)) { $t = ord($string[$n]); if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) { $tn = 1; $n++; $noc++; } elseif(194 <= $t && $t <= 223) { $tn = 2; $n += 2; $noc += 2; } elseif(224 <= $t && $t < 239) { $tn = 3; $n += 3; $noc += 2; } elseif(240 <= $t && $t <= 247) { $tn = 4; $n += 4; $noc += 2; } elseif(248 <= $t && $t <= 251) { $tn = 5; $n += 5; $noc += 2; } elseif($t == 252 || $t == 253) { $tn = 6; $n += 6; $noc += 2; } else { $n++; } if ($noc >= $length) { break; } } if ($noc > $length) { $n -= $tn; } $wordscut = substr($string, 0, $n); } else { for($i = 0; $i < $length - 1; $i++) { if(ord($string[$i]) > 127) { $wordscut .= $string[$i].$string[$i + 1]; $i++; } else { $wordscut .= $string[$i]; } } } $string = $wordscut; } return trim($string); } // 示例 echo getstr("0一二三四五六七",1).'<br />'; // 0 echo getstr("0一二三四五六七",2).'<br />'; // 0 echo getstr("0一二三四五六七",3).'<br />'; // 0一 echo getstr("0一二三四五六七",4).'<br />'; // 0一 echo getstr("0一二三四五六七",5).'<br />'; // 0一二 echo getstr("0一a二b三四五六七",1).'<br />'; // 0 echo getstr("0一a二b三四五六七",2).'<br />'; // 0 echo getstr("0一a二b三四五六七",3).'<br />'; // 0一 echo getstr("0一a二b三四五六七",4).'<br />'; // 0一a echo getstr("0一a二b三四五六七",5).'<br />'; // 0一a //此函数由UCHome 1.5中的getstr()函数修改而来。 ?>
您可能感兴趣的文章:
php substr截断中文半个汉字乱码问题的解决方法
php乱码问题 utf8乱码杂谈
php截取中文字符串乱码如何解决呢
php分割GBK中文乱码的解决方法
解决php截取utf-8中文字符串时乱码的问题
如何解决php中文字符乱码,中文字符入库乱码的问题
php中文字符串截断且无乱码的解决方法
有关php中文乱码的解决方法
php utf8 一半乱码的问题
本文是对php大小写是否敏感的一点总结。
不过,推荐始终坚持“大小写敏感”,遵循统一的代码规范。
一、大小写敏感
1,变量名区分大小写
<?php /** * 大小写敏感 * edit www. */ $abc ='abcd'; echo $abc; //输出 'abcd' echo $aBc; //无输出 echo $ABC; //无输出 ?>
2,常量名默认区分大小写,通常都写为大写
(但没找到能改变这个默认的配置项,求解)
<?php define("ABC","Hello World"); echo ABC; //输出 HelloWorld echo abc; //输出abc ?>
3,php.ini配置项指令区分大小写
如 file_uploads = 1 不能写成 File_uploads = 1
二、大小写不敏感
1,函数名、方法名、类名 不区分大小写,但推荐使用与定义时相同的名字
2,魔术常量不区分大小写,推荐大写
包括:__LINE__、__FILE__、__DIR__、__FUNCTION__、__CLASS__、__METHOD__、__NAMESPACE__。
<?php echo __line__; //输出 2 echo __LINE__; //输出 3 //by www. ?>
3,NULL、TRUE、FALSE不区分大小写,以下用到了php函数var_dump。
<?php $a =null; $b =NULL; $c =true; $d =TRUE; $e =false; $f =FALSE; var_dump($a ==$b);//输出 boolean true var_dump($c ==$d);//输出 boolean true var_dump($e ==$f);//输出 boolean true //by www. ?>
PHP获取当前url路径及服务器变量:
$path = /var/www/../ect/abcd;
echo $_SERVER['DOCUMENT_ROOT']."<br>"; //获得服务器文档根变量(取决于http.conf中的配置)
echo $_SERVER['PHP_SELF']."<br>"; //获得执行该代码的文件的路径,与http.conf中的配置有关系。
echo __FILE__."<br>"; //获得文件的文件系统绝对路径的变量
echo dirname(__FILE__); //获得文件所在的文件夹路径的函数
echo realpath($pah);
?>
输出结果:
/alias/aa.php
/var/www/htdocs/kamap/aa.php
/var/www/htdocs/kamap/
/usr/etc/abcd