1 修饰符:好象没有讲
2 匹配模式好象有些少
比如<?php
$cp = preg_replace( "@<script(.*?)</script>@is", "", $cp );
$cp = preg_replace( "@<iframe(.*?)</iframe>@is", "", $cp );
$cp = preg_replace( "@<style(.*?)</style>@is", "", $cp );
?>出现"@<script(.*?)</script>@我就迷糊
希望得到帮助,多谢
"@<script(.*?)</script>@
非贪婪模式,意思是匹配<script之后第一个<之间的东西,等价于@<script([^>]*)</script>@
有时候需要[^>]+?获取精确匹配。
做PHP项目中需要用到URL重定向技术,基本上的需求就是把比如 /user/heiyeluren 重定向到 /user.php?uid=heiyeluren 之类的URL上,当然,你也可以把 /article/200707291011.html重定向到 /article.php?id=200507291011 之类的,模拟好像是静态页面,能够隐藏URL真实地址,有助于雨鞋基本的安全防范等等。那么好像rewrite是个很好的解决办法。
要在Apache里运行rewrite的话,必须先安装mod_rewrite的组件,就是一个mod_rewrite.c文件,然后必须在./configure的时候要放上mod_rewrite就能安装。
一般配置rewrite的话,可以在httpd.conf里面配置,也能在网页当前目录的.htaccess文件里进行定义来决定重定向去那个文件,那样的话,就非常具有灵活性了,同样也能够适合虚拟主机用户来做。
我们看一个.htaccess文件的例子:
1 <IfModule mod_rewrite.c>
2 RewriteEngine On
3 RewriteBase /
4 RewriteCond %{REQUEST_FILENAME} -f [OR]
5 RewriteCond %{REQUEST_FILENAME} -d
6 RewriteRule ^.*$ - [S=42]
7
8 #RewriteRule ^share/$ /share.php [QSA,L]
9 RewriteRule ^tag/([^/]+)/?$ /user_tags.php?tag=$1 [QSA,L]
10 RewriteRule ^city/([^/]+)/?$ /user_city.php?tag=$1 [QSA,L]
11 #RewriteRule ^([^/]+)/day/([^/]+)/?$ /user_share.php?id=$1&s=1&selTime=$2 [QSA,L]
12 #RewriteRule ^([^/]+)/day/([^/]+)/?$ /user_share.php?id=$1&s=1&selTime=$2 [QSA,L]
13
14 RewriteRule ^([^/]+)/day/([^/]+)/?$ /user_share.php?id=$1&s=1&selTime=$2 [QSA,L]
15 RewriteRule ^([^/]+)/week/([^/]+)/?$ /user_share.php?id=$1&s=2&selTime=$2 [QSA,L]
16 RewRiteRule ^([^/]+)/month/([^/]+)/?$ /user_share.php?id=$1&s=3&selTime=$2 [QSA,L]
17
18 RewriteRule ^([^/]+)/day/?$ /user_share.php?id=$1&s=1 [QSA,L]
19 RewriteRule ^([^/]+)/week/?$ /user_share.php?id=$1&s=2 [QSA,L]
20 RewriteRule ^([^/]+)/month/?$ /user_share.php?id=$1&s=3 [QSA,L]
21
22 RewriteRule ^([^/]+)/?$ /user_share.php?id=$1 [QSA,L]
23 </IfModule>
比较长吧,我们就简单关注一下关键的内容。<IfModule></IfModule>之间就是定义的内容,RewriteEngine就是确定是否运行URL重写功能,RewriteBase就是基本的路径是什么,最关键的就是下面的RewriteRule,就是我们需要重写的规则了,这里应用了兼容Perl规则的正则表达式:
Text:
. 匹配任意单个字符
[chars] 匹配当前字符
[^chars] 不匹配当前字符
text1|text2 包含text1或者text2任何一个
Quantifiers:
? 零个或者一个?号前的字符
* 零个或者任意个任意长度的任意字符
+ 一个或者任意个任意长度的字符
Grouping:
(text) Grouping of text
(either to set the borders of an alternative or
for making backreferences where the Nth group can
be used on the RHS of a RewriteRule with $N)
Anchors:
^ 匹配内容开始标记
$ 匹配内容结束标记
Escaping:
\char 使用\来进行特殊字符的转义,包括".[]()"等字符的转义
基本规则如上,比如下面的正则表达式:^/([^/]+)/~([^/]+)/(.*)$ 就是能够匹配象 /Language/~ Realname/.../File 这样的路径。
那么从这个角度去看上面的内容就比较容易理解了。我们简单看一下RewriteRule指令的规则:
RewriteRule 访问的路径 需要指向的真实路径
这样就很清楚了,比如说我要把/user/heiyeluren重定向到/user.php?uid=heiyeluren那么我的规则就必须这样:
RewriteRule ^user/([^/]+)$ ^/user.php?uid=$2 [QSA,L]
举一反三,就很容易理解规则如何去写,也就能够理解上面规则脚本的内容了。
没有清楚的,请参考附上的链接,更深入的了解具体内容。写的不好请见谅。
附:
Apache Rewrite 技术 http://www.yujs.com/recommendation/004.htm
Apache模块 mod_rewrite http://linux.dalouis.com/doc/apache2.0/mod/mod_rewrite.html
URL重写指南 http://linux.dalouis.com/doc/apache2.0/misc/rewriteguide.html
Apache HTTP服务器 2.0版本文档 http://linux.dalouis.com/doc/apache2.0/
本节内容:
一例php小偷程序
例子:
<?php
//目标站网址
$url="http://www.";
//当前文件名
$thisname='index.php';
header("Content-type: text/html; charset=GBK");
$server_url = preg_replace("/(http|https|ftp|news):\/\//i", "", $url);
$server_url = preg_replace("/\/.*/", "", $server_url);
$server_url = 'http://'.$server_url;
$getid=$_SERVER["REQUEST_URI"];
$scriptname=$_SERVER["SCRIPT_NAME"];
$thisurl="http://".$_SERVER['HTTP_HOST'].$_SERVER['PHP_SELF'];
if( preg_match('#(http|https|ftp|news):#iUs',$getid) ){
header("Location:".$scriptname);
exit;
}
if( preg_match('#'.$scriptname.'\/#iUs',$getid) ){
$url=$server_url.'/'.str_ireplace($scriptname."/",'',stristr($getid,$scriptname."/"));
}
$thismulu=str_ireplace(stristr($_SERVER['PHP_SELF'],$thisname),'',$thisurl);
function curl_get($url){
if(function_exists('curl_init') && function_exists('curl_exec')){
$ch = curl_init();
$user_agent = "Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html)";
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_REFERER, "http://www.baidu.com/s?wd=%CA%B2%C3%B4");
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
$data = curl_exec($ch);
curl_close($ch);
}else{
for($i=0;$i<3;$i++){
$data = @file_get_contents($url);
if($data) break;
}
}
return $data;
}
function filter($str){
global $server_url;
$str=preg_replace("/<base[^>]+>/si","",$str);
$str=preg_replace("/\s+/", " ", $str);
$str=preg_replace("/<\!--.*?-->/si","",$str);
$str=preg_replace("/<(script.*?)>(.*?)<(\/script.*?)>/si","",$str);
$str=preg_replace("/<(\/?script.*?)>/si","",$str);
$str=preg_replace("/javascript/si","Javascript",$str);
$str=preg_replace("/vbscript/si","Vbscript",$str);
$str=preg_replace("/on([a-z]+)\s*=/si","On\\1=",$str);
return $str;
}
function urlchange($str) {
global $server_url,$scriptname,$thismulu;
$str = preg_replace('/src=(["|\']?)\//', 'src=\\1'.$server_url.'/', $str);
$str = preg_replace('/<(link[^>]+)href=(["|\']?)\/?/', '<\\1href=\\2'.$server_url.'/', $str);
$str = preg_replace('/<(a[^>]+)href=(["|\']?)\/?/', '<\\1href=\\2'.$scriptname.'/', $str);
$str=str_ireplace('/javascript:;','#',$str);
$str=str_ireplace('"'.$scriptname.'/"',$scriptname,$str);
return $str;
}
function charset($str){
if(preg_match('#<meta[^>]*charset\s*=\s*utf-8#iUs',$str)){
$str=preg_replace('/charset\s*=\s*utf-8/i','charset=gb2312',$str);
$str=iconv("UTF-8", "GB2312//IGNORE", $str);
}
return $str;
}
$body=urlchange(filter(charset(curl_get($url))));
//-------------替换开始----------------------
$body=preg_replace('#>精品推荐</a>(.*)</a></p></div><div ><p>" #si',"",$body);
//正则替换
//PS:可写多个
$body=str_ireplace('action="/v/index.html"','action="/blog_article/index.php/v/index.html"',$body);
//$body=str_ireplace('您要替换的内容','你想替换成的内容',$body);
//PS:可写多个
//------------替换结束------------------------
echo $body;
?>
您可能感兴趣的文章:
PHP采集器的简单示例代码
phpQuery采集网页的实例分享
php采集远程图片的思路与实现代码
php采集程序代码(入门)
一个php文本采集类