php中计算中文字符串长度、截...-php数据结构算法(PHP描述) 简...-php的urlencode()URL编码函数浅析

当前位置: 编程技术>php

本页文章导读:

▪php中计算中文字符串长度、截取中文字符串的函数代码在PHP中，我们都知道有专门的mb_substr和mb_strlen函数，可以对中文进行截取和计算长度，但是，由于这些函数并非PHP的核心函数，所以，它们常常有可能没有开启。当然，如果是用的自己的服.........

▪php数据结构算法(PHP描述) 简单选择排序 simple selection sort 代码如下: <?php /** * 简单选择排序 simple selection sort * * 原理: 一次选定数组中的每一个数，记下当前位置并假设它是从当前位置开始后面数中的最小数min=i，从这个数的下一个数开始扫描直.........

▪php的urlencode()URL编码函数浅析 URLEncode的方式一般有两种，一种是传统的基于GB2312的Encode（Baidu、Yisou等使用），另一种是基于UTF-8的Encode（Google、Yahoo等使用）。本工具分别实现两种方式的Encode与Decode：中文 -> GB2312的E.........

[1]php中计算中文字符串长度、截取中文字符串的函数代码

来源: 互联网发布时间: 2013-11-30

在PHP中，我们都知道有专门的mb_substr和mb_strlen函数，可以对中文进行截取和计算长度，但是，由于这些函数并非PHP的核心函数，所以，它们常常有可能没有开启。当然，如果是用的自己的服务器，则只要在php.ini中开启即可。如果是用的虚拟主机，而服务器又没有开启这方面的函数的话，那就需要我们自己写出点适合咱国情的函数来了。
以下几个函数用起来颇为顺手的。不过要知道，得在utf-8环境下使用。

代码如下:

header('Content-type:text/html;charset=utf-8');
/**
* 可以统计中文字符串长度的函数
* @param $str 要计算长度的字符串
* @param $type 计算长度类型，0(默认)表示一个中文算一个字符，1表示一个中文算两个字符
*
*/
function abslength($str)
{
if(empty($str)){
return 0;
}
if(function_exists('mb_strlen')){
return mb_strlen($str,'utf-8');
}
else {
preg_match_all("/./u", $str, $ar);
return count($ar[0]);
}
}
$str = '我们都是中国人啊，ye！';
$len = abslength($str);
var_dump($len); //return 12
$len = abslength($str,'1');
echo '<br />'.$len; //return 22
/*
utf-8编码下截取中文字符串,参数可以参照substr函数
@param $str 要进行截取的字符串
@param $start 要进行截取的开始位置，负数为反向截取
@param $end 要进行截取的长度
*/
function utf8_substr($str,$start=0) {
if(empty($str)){
return false;
}
if (function_exists('mb_substr')){
if(func_num_args() >= 3) {
$end = func_get_arg(2);
return mb_substr($str,$start,$end,'utf-8');
}
else {
mb_internal_encoding("UTF-8");
return mb_substr($str,$start);
}
}
else {
$null = "";
preg_match_all("/./u", $str, $ar);
if(func_num_args() >= 3) {
$end = func_get_arg(2);
return join($null, array_slice($ar[0],$start,$end));
}
else {
return join($null, array_slice($ar[0],$start));
}
}
}
$str2 = 'wo要截取zhongwen';
echo '<br />';
echo utf8_substr($str2,0,-4); //return wo要截取zhon

支持gb2312,gbk,utf-8,big5 中文截取方法

代码如下:

/*
* 中文截取，支持gb2312,gbk,utf-8,big5
*
* @param string $str 要截取的字串
* @param int $start 截取起始位置
* @param int $length 截取长度
* @param string $charset utf-8|gb2312|gbk|big5 编码
* @param $suffix 是否加尾缀
*/
public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
if(function_exists("mb_substr"))
{
if(mb_strlen($str, $charset) <= $length) return $str;
$slice = mb_substr($str, $start, $length, $charset);
}
else
{
$re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
$re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
$re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
$re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
preg_match_all($re[$charset], $str, $match);
if(count($match[0]) <= $length) return $str;
$slice = join("",array_slice($match[0], $start, $length));
}
if($suffix) return $slice."…";
return $slice;
}

[2]php数据结构算法(PHP描述) 简单选择排序 simple selection sort

来源: 互联网发布时间: 2013-11-30

代码如下:

<?php
/**
* 简单选择排序 simple selection sort
*
* 原理: 一次选定数组中的每一个数，记下当前位置并假设它是从当前位置开始后面数中的最小数min=i，从这个数的下一个数开始扫描直到最后一个数，并记录下最小数的位置min，扫描结束后如果min不等于i，说明假设错误，则交换min与i位置上数。
*/
function sort_simple_selection($list)
{
$len = count($list);
if(empty($len)) return $list;
for($i = 0;$i < $len; $i++)
{
$min = $i;
for($j = $i + 1; $j < $len; $j++)
{
//if($list[$j] > $list[$min]) // 从大到小
if($list[$j] < $list[$min]) // 从小到大
{
$min = $j;
}
echo implode(',',$list)."#pos=".($min + 1)." min=".$list[$min]."<br/>";
}
if($min != $i)
{
$temp = $list[$i];
$list[$i] = $list[$min];
$list[$min] = $temp;
}
echo "-------------------------<br/>";
}
}
$list = array(4,3,2,1,5,7,3,7);
$list = sort_simple_selection($list);

[3]php的urlencode()URL编码函数浅析

来源: 互联网发布时间: 2013-11-30

URLEncode的方式一般有两种，一种是传统的基于GB2312的Encode（Baidu、Yisou等使用），另一种是基于UTF-8的Encode（Google、Yahoo等使用）。

本工具分别实现两种方式的Encode与Decode：

中文 -> GB2312的Encode -> %D6%D0%CE%C4

中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87

Html中的URLEncode：

编码为GB2312的html文件中：http://s./中文.rar -> 浏览器自动转换为 -> http://s./%D6%D0%CE%C4.rar

注意：Firefox对GB2312的Encode的中文URL支持不好，因为它默认是UTF-8编码发送URL的，但是ftp://协议可以，我试过了，我认为这应该算是Firefox一个bug。

编码为UTF-8的html文件中：http://s./中文.rar -> 浏览器自动转换为 -> http://s./%E4%B8%AD%E6%96%87.rar

PHP中的URLEncode：

代码如下:

<?php
//GB2312的Encode
echo urlencode("中文-_. ")."\n"; //%D6%D0%CE%C4-_.+
echo urldecode("%D6%D0%CE%C4-_. ")."\n"; //中文-_.
echo rawurlencode("中文-_. ")."\n"; //%D6%D0%CE%C4-_.%20
echo rawurldecode("%D6%D0%CE%C4-_. ")."\n"; //中文-_.
?>

除了“-_.”之外的所有非字母数字字符都将被替换成百分号“%”后跟两位十六进制数。

urlencode和rawurlencode的区别：urlencode将空格编码为加号“+”，rawurlencode将空格编码为加号“%20”。

如果要使用UTF-8的Encode，有两种方法：

一、将文件存为UTF-8文件，直接使用urlencode、rawurlencode即可。

二、使用mb_convert_encoding函数：

代码如下:

<?php
$url = 'http://s./中文.rar';
echo urlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."\n";
echo rawurlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."\n";
//http%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar
?>

实例：

代码如下:

<?php
function parseurl($url="")
{
$url = rawurlencode(mb_convert_encoding($url, 'gb2312', 'utf-8'));
$a = array("%3A", "%2F", "%40");
$b = array(":", "/", "@");
$url = str_replace($a, $b, $url);
return $url;
}
$url="ftp://ud03:password@s./中文/中文.rar";
echo parseurl(/blog_article/$url/index.html);
//ftp://ud03:password@s./%D6%D0%CE%C4/%D6%D0%CE%C4.rar
?>

JavaScript中的URLEncode：

如：%E4%B8%AD%E6%96%87-_.%20%E4%B8%AD%E6%96%87-_.%20

encodeURI不对下列字符进行编码：“:”、“/”、“;”、“?”、“@”等特殊字符。

如：http://s./%E4%B8%AD%E6%96%87.rarhttp%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar