最全的用正则批量去除Teleport Pro整站下载文件冗余代码
本文导语: tppabs html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以...
tppabs
html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。
如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。
方法如下:
使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可
匹配javascript代码:
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if(confirm('htt[^"]*"
替换:href=/tech-program-other/www.xxx.com
勾选:使用正则表达式
点替换全部按钮
注:如果该表达式中含有不同的网址,可使用if(confirm('htt[^"]*)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。
css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:/*tpa=http://[^s]*/
替换:空
勾选:使用正则表达式
点替换全部按钮
n 换行符。
r 回车符。
s 任何单个空白字符,包括空格、制表符、换页符或换行符。 sbook 匹配“blue book”中的“book”,但在“notebook”中没有任何匹配项 S 任何单个非空白字符。 Sbook 匹配“notebook”中的“book”,但在“blue book”中没有任何匹配项 t 制表符。
w 任何字母数字字符,包括下划线。等效于 [A-Za-z0-9_]。 bw* 匹配“the barking dog”中的“barking”以及“the big black dog”中的“big”和“black” W 任何非字母数字字符。等效于 [^A-Za-z0-9_]。 W 匹配“Jake&Mattie”中的