首先需要声明的是,其实我对正则的应用也不是特别地熟练,只不过是在工作中“被逼无奈”才一步步地对正则有了一些了解。随着对正则的了解越多,越来越发现正则表达式真的是一个很强有力的工具,使用正则,很多时候都可以事半功倍。
网上流传着很多通用的正则,比如说查找电话号码的正则,查找email的正则。相信也有很多朋友跟我一样,学习正则是从这些流行的正则开始的,当体会到了正则的强大,而这些流行的正则不再合用时,就有了学习正则的动力。其实正则的基本规则很简单,入门很容易,但入门之后怎么来使用却就是各有千秋了。目前PHP支持的正则共有两种:POSIX 扩展的正则表达式和perl兼容的正则表达式。很多PHP的教材上用的都是POSIX扩展的正则表达式,但我却更喜欢perl兼容的正则表达式,一来是因为可以有更好的兼容性,二来是我觉得perl兼容的正则表达式看上去更清晰。
先来假设一个工作环境:有一个包含用户信息的文件,共有一万行,每行记录一个用户的信息,格式如下:
username,010-12345678,firstname.lastname,05/21/2007
下面的文章里,我将以这个假设的工作环境来介绍PHP中perl兼容的正则表达式的查找和替换。
查找
最常用的查找是preg_match(),函数说明如下:
int preg_match_all ( string pattern, string subject, array matches [, int flags]
对正则表达式的语法就不多说了,我假设阅读这篇文章的朋友都有一定的正则基础。其实正则表达的查找用处并不是很大,不是太复杂的查找通过可以通过strstr()函数来现实,而且效率更高一些。使用正则的查找通常是一些用strstr()无法实现的比较复杂的查找。例如,我要查找电话号码的区号是010且lastname是bill的一行记录,就可以这么写
preg_match('/^[^,]*,010[^\.]*\.bill.*$/i',$line);
其中$line的意思是文件的一行数据。假如$line中的区号是010,lastname又正好是bill,上面的语句就会返回一个非零的正整数,通常我们并不关心这个数的值,而是只关心是否有匹配。又假如我们想找出lastname是bill的用户在2007年的记录,可以用下面的语句
preg_match('/^[^,]*,[^,]*,[^\.]*\.bill,[^\/]*\/[^\/]*\/2007/i',$line);
用到正则表达式的替换的地方通常是在需要匹配两个或两个以上的关键字,且这两个关键字不相邻。这个时候无法用正常的查找函数来实现,就用到正则。
替换
相对于查找,我认为替换才是正则表达式最强大、最有用的地方。假设我们现在需要把文件中一万条记录的日期格式换成yyyy/mm/dd,你会怎么做呢?你会发现,普通的查找替换是达不到这个目的了。也许你会说可以把一行的记录分解,进行分析后再重组。我承认这确实是一个解决的办法,可是这并不是最好的解决办法,让我们看一下用正则是怎么来达到我们的要求的:
$line = preg_replace('/([^,]*,[^,]*,[^,]*,)([0-9]*)\/([0-9]*)\/([0-9]*)/i',"\${1}\${4}\${2}\${3}",$line);
这里我们使用了正则表达式里的“子模式”,细心观察就可以发现,preg_replace函数的第一个参数里一共有四对‘()’,每一对‘()’里的内容就是一个“子模式”,在第二个参数里可以通过\${1}、\${2}这样的格式来随便组合这些子模式。如我想删除数据里的电话号码,可以这样来写:
$line = preg_replace('/([^,]*,)([^,]*,)[^,]*,)([0-9]*)\/([0-9]*)\/([0-9]*)/i',"\${1}\${4}\${2}\${3}",$line);
这里为了介绍子模式而使用了比较复杂的写法,实际上还有一种更简单的方法:
$line = preg_replace('/,[\d]+\-[\d]+/i','',$line);
有一句话,忘了是别人说的还是自己原创的,反正在我脑子里好久了:正则表达式不是技术,而是技巧:)正则的入门实际上是相当简单的,用上一两次就能掌握基本的语法,要让这把剑发挥出多大的威力,就看个人的修行了。需要说明的一点是,这把剑实际上也是一把双刃剑:正则的执行效率实际上要比strstr,strpos之类的函数低,所以,当你的查找很简单的时候,就没必要再合用正则了。
只要安装一些第三方的库文件并具有一定的几何知识,就可以利用PHP来创建和处理图像了。PHP创建动态图像是相当容易的一件事情。
在使用基本的图像创建函数之前,需要安装GD库文件。如果要使用与JPEG有关的图像创建函数,还需要安装jpeg-6b,如果要在图像中使用Type 1型字体,则必须安装t1lib。
在建立图像创建环境之前,还需要做一些准备工作。首先,安装t1lib接着安装jpeg-6b,然后再安装GD库文件。在安装时一定要按这里给定的顺序进行安装,因为在编译GD入库时会用到jpeg-6b,如果没有安装jpeg-6b,在编译时就会出错。
在安装完这三个组件后,还需要重新配置一次PHP,这也是你对采用DSO方式安装PHP感到庆幸的地方之一。运行make clean,然后在当前的配置中添加下面的内容:
--with-gd=[/path/to/gd]
--with-jpeg-dir=[/path/to/jpeg-6b]
--with-t1lib=[/path/to/t1lib]
完成添加后执行make命令,然后再执行make install命令,重新启动Apache后运行phpinfo()来检查一下新的设置是否生效了。现在,我们就可以开始图像创建工作了。
根据所安装的GD库文件的版本将决定你是否能创建GIF或PNG格式的图形文件。如果安装的是gd-1.6或以前的版本,可以使用GIF格式的文件但不能创建PNG格式,如果安装的是gd-1.6以后的版本,可以创建PNG文件但不能创建GIF格式的文件。
创建一幅简单的图像也需要用到许多的函数,我们将一步一步地进行说明。
在下面的例子中,我们将创建一个PNG格式的图像文件,下面的代码是一个包含所创建的图像的MIME类型的头部:
使用ImageCreate()创建一个代表空白图像的变量,这个函数要求以像素为单位的图像大小的参数,其格式是ImageCreate(x_size, y_size)。如果要创建一个大小为250×250的图像,就可以使用下面的语句:
$newImg = ImageCreate(250,250);
由于图像还是空白的,因此你可能会希望用一些彩色来填充它。你需要首先使用ImageColorAllocate()函数用其RGB值为这种颜色指定一个名字,这一函数的格式为ImageColorAllocate([image], [red], [green], [blue])。如果要定义天蓝色,可以使用如下的语句:
接下来,需要使用ImageFill()函数用这种颜色填充这个图像,ImageFill()函数有几个版本,例如ImageFillRectangle()、ImageFillPolygon()等。为简单起见,我们通过如下的格式使用ImageFill()函数:
ImageFill($newImg,0,0,$skyblue);
最后,在图像建立后释放图像句柄和所占用的内存:
ImageDestroy($newImg); ?>
这样,创建图像的全部代码如下所示:
$newImg = ImageCreate(250,250);
$skyblue = ImageColorAllocate($newImg,136,193,255);
ImageFill($newImg,0,0,$skyblue);
ImagePNG($newImg);
ImageDestroy($newImg);
?>
如果把这个脚本文件保存为skyblue.php,并用浏览器访问它,我们会看到一个天蓝色的250×250的PNG格式的图像。
我们还可以使用图像创建函数对图像进行处理,例如把一个较大图像作成一个小图像:
假设你有一幅图像,想从中裁剪出一个35×35大小的图像。你所需要作的是创建一个35×35大小的空白图像,创建一个包含原来图像的图像流,然后把一个经过调整大小的原来的图像放到新的空白图像中。
要完成这一任务的关键函数是ImageCopyResized(),它要求的格式如下所示:ImageCopyResized([new image handle],[original image handle],[new image X], [new Image Y], [original image X], [original image Y], [new image X], [new image Y], [original image X], [original image Y])。
header("Content-type: image/png");
/*建立保存新图像高度和宽度的变量*/
$newWidth = 35;
$newHeight = 35;
/*建立给定高度和宽度的新的空白图像*/
$newImg = ImageCreate($newWidth,$newHeight);
/*从原来较大的图像中得到数据*/
$origImg = ImageCreateFromPNG("test.png");
/*拷贝调整大小后的图像,使用ImageSX()、ImageSY()得到原来的图像在X、Y方面上的大小*/
ImageCopyResized($newImg,$origImg,0,0,0,0,$newWidth,$newHeight,ImageSX($origImg),ImageSY($origImg));
/*创建希望得到的图像,释放内存*/
ImagePNG($newImg);
ImageDestroy($newImg); ?>
如果把这一小段脚本保存为resized.php,然后用浏览器对它进行访问,就会看到一个35×35大小的PNG格式的图像。
服务器环境是APACHE+PHP,在配置Squid后会产生一个问题:
原先使用PHP预定义变量$_SERVER['REMOTE_ADDR']获取客户端的IP地址,现在这个变量的值是Squid代理的IP地址,比如假设Squid和Apache装在同一服务器上的话,现在$_SERVER['REMOTE_ADDR']是127.0.0.1。
为了取得真实的客户端IP地址,可以使用$_SERVER['HTTP_X_FORWARDED_FOR']来透过代理,这个变量在PHP的官方手册里的保留字列表|预定义变量|$_SERVER部分里没有提到,但在相应评论里可以找到。
'HTTP_X_FORWARDED_FOR'是HTTP协议头中的一部分,也就是说客户端可以伪造,使用时需要进行相应检测防止被利用,例如网站有封IP的功能,恶意用户可以伪造IP,使网站误封正常用户的IP。
PHP手册用户注释中提供了一个办法:
if ($_SERVER["HTTP_CLIENT_IP"]) {
$proxy = $_SERVER["HTTP_CLIENT_IP"];
} else {
$proxy = $_SERVER["REMOTE_ADDR"];
}
$ip = $_SERVER["HTTP_X_FORWARDED_FOR"];
} else {
if ($_SERVER["HTTP_CLIENT_IP"]) {
$ip = $_SERVER["HTTP_CLIENT_IP"];
} else {
$ip = $_SERVER["REMOTE_ADDR"];
}
}
echo "Your IP $ip";
if (isset()($proxy)) {
echo "Your proxy IP is $proxy";
}