iconv函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库。
1、下载libiconv函数库http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.9.2.tar.gz;
2、解压缩
tar -zxvf libiconv-1.9.2.tar.gz;
3、安装libiconv
#make
#make install
4、重新编译php
增加编译参数--with-iconv=/usr/local/iconv
windows下iconv在转换字符"—"到gb2312时会出错,会少一部分内容。
在需要转成的编码后加 "//IGNORE" 也就是iconv函数第二个参数后即可。
iconv("UTF-8","GB2312//IGNORE",$data)
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。
iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。
windows下修改php.ini文件,将extension=php_iconv.dll前的";"去掉,同时要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)
在linux环境下,用静态安装的方式,在configure时加多一项 --with-iconv就可以了,phpinfo看得到iconv的项。
下载:ftp://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.8.tar.gz
安装:
#tar zxvf lib*
#./configure --prefix=/usr/local/libiconv
#make
#make install
编译php
#./configure --prefix=/usr/local/php4.3.2 --with-iconv=/usr/local/libiconv/
例子:
echo iconv("gb2312","ISO-8859-1","我们");
?>
1、iconv()函数
iconv函数可以实现字符集间的相互转换。例如:从GB2312转换为UTF-8。
iconv函数在php5中内置,GB字符集默认打开。
2、iconv()错误
iconv在转换字符”—”到gb2312时会出错,此时在需要转成的编码后加 “//IGNORE”,也就是iconv函数第二个参数后。
例如:
ignore忽略转换时的错误,不加ignore参数,所有该字符后面的字符串都无法被保存。这点要注意。
3、以下为大家举几个应用iconv函数的例子。
例1:
echo $str= ‘你好,这里是卖咖啡!';
echo '<br />';
echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8
echo '<br />';
echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符个数截取而非字节
print_r(iconv_get_encoding()); //得到当前页面编码信息
echo iconv_strlen($str, 'UTF-8'); //得到设定编码的字符串长度
?>
例2:
UTF-8编码时可以正确输出:
$str='我爱';
$utf='';
for ($i=0;$i<strlen($str);$i++) $utf.=sprintf()("%%%02X",ord(substr($str,$i,1)));
echo $utf;
?>
GB编码时,可以正确输出:
$str='我爱';
$str=iconv("GBK", "UTF-8", $str);
$utf='';
for ($i=0;$i<strlen($str);$i++) $utf.=sprintf("%%%02X",ord(substr($str,$i,1)));
echo $utf;
?>
上面两个小例子,会输出如下的内容:
%E6%88%91%E7%88%B1%E7%99%BE%E5%BA%A6
有关php中iconv函数应用于字符串编码转换的例子,就介绍完了,希望对大家有所帮助。
好好学习,天天上,嘎嘎。
当字符短较短时,mb_detect_encoding会出现误判的情况发生,有遇到此问题的朋友,可以参考下本文的解决方法。
例如:
$encode = mb_detect_encoding($keytitle, array("ASCII",'UTF-8′,"GB2312′,"GBK",'BIG5′));
if ($encode == “UTF-8″){
$keytitle = iconv("UTF-8″,"GBK",$keytitle);
}
检测字符串的编码是否UTF-8,是的话就则转换为GBK。
可是当 $keytitle = '%D0%BE%C6%AC'; 时。
检测结果却是UTF-8,这其实不算是bug,我们不应当过于依赖mb_detect_encoding,当字符串较短时,检测结果产生偏差的可能性很大。
解决方法:
参数解释:
被检测的输入变量
编码方式的检测顺序(为真时自动忽略后面的)
strict模式
适时调整编码检测的顺序,将最大可能性放在前面,可以减少转换出错的机会。
好的习惯是:当有GBK和UTF-8时,先排gb2312,即将最常用的安排在前面。