当前位置: 编程技术>其它
<font color=blue>关于表格的正则表达式讨论(表格)
来源: 互联网 发布时间:2014-10-12
本文导语: 看过许多UBB代码,包括JS,ASP,JSP的,一直没发现表格的UBB,虽然可以直接用HTML模式实现相同表格功能,但对于某些开放的站点来说开放HTML模式终究是不合适的,故一直想实现表格的UBB。 我的设想是在HTML编辑器(HTML...
看过许多UBB代码,包括JS,ASP,JSP的,一直没发现表格的UBB,虽然可以直接用HTML模式实现相同表格功能,但对于某些开放的站点来说开放HTML模式终究是不合适的,故一直想实现表格的UBB。
我的设想是在HTML编辑器(HTML,FRONTPAGE,DW)中作好表格,把替换为],直接复制HTML并提交发布。
可惜经过实践,发现很难。因为表格的HTML标记和其他元素的HTML标记差别很明显,主要原因TD,TR,特别是TABLE都能嵌套。其实我遇到的关键问题在于我不会写 不包含某个单词或语句(非单字符)的正则 ,譬如下面标记
QUOTE:
[TABLE][TR] [TD]哈哈[TABLE][TR][TD]的[/TD][/TR][/TABLE][/TD][/TR][/TABLE]
你要匹配正确[TD]*[/TD]你就得必须保证*不包括[TABLE][TR][TD]等,注意不能用[^[]*?啊,因为用他无法匹配正确的[/TD]的,所以问题在与我怎么保证这个*不包括[TABLE][TR][TD]呢,(我不会写)。所以我:
退一步,先用[td[^]]*?][^[]*?[table找到最后一个(其实最内层的)表格,然后把最内层的表格转为HTML标记,然后循环从头开始再来一次,一直到所有标记被替换。这个理论上是可以实现的。我用JSP正在实验,需要时间,希望有兴趣朋友用ASP,PHP实验一下。
因为我急用,所以我又退了一步,就是直接查找][TABLE]等标记然后替换,有4个表达式,[TABLE][TR][TD]、[/TD][/TR][TR][TD]、[/TD][TD]、[/TD][/TR][TABLE] ,大家知道,UBB需要把/R/N替换成
的,于是我用上面作出的正则查找并替换掉所有[TABLE]和[TR]和[TD]和[/TD]和[/TR]和[/TABLE]中的换行。其实这个表达式比下面表达式就多了这个替换换行功能,其不足之处是很明显的,就是不能完善的剔除非配套的标记,必须保证所有TABLE标记是正确配套的(有TBODY的再改改就是了),否则乱套。总 这一步我实践还不错。
再退一步,其实没法退了,就是直接单个查找替换[TABLE]等标记,这是最苯的方法了,也是效果最不好的,因为大家知道在HTML编辑器里的表格标记中好多换行的,而UBB是为换行转为
的,所以这个方法实现了会发现好多空行的,而且这个方法和上面那一步一个共同缺点就是更不能剔除非配套标记。
附我写的退一步后的正则:(我用JSP)
QUOTE:
\[(table)([^\[]*?)\][^\[]*?\[tr\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[\/tr\][^\[]*?\[tr\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[\/tr\][^\[]*?\[\/table\]
我想如果是管理员发布信息什么的,能保证表格标记的正确的话用这个还可以的。其实如果有人想捣乱的话,再严谨的UBB也不能防止的啊。
欢迎有兴趣者来此讨论,提出更好建议,打造最好最全的UBB。
我的设想是在HTML编辑器(HTML,FRONTPAGE,DW)中作好表格,把替换为],直接复制HTML并提交发布。
可惜经过实践,发现很难。因为表格的HTML标记和其他元素的HTML标记差别很明显,主要原因TD,TR,特别是TABLE都能嵌套。其实我遇到的关键问题在于我不会写 不包含某个单词或语句(非单字符)的正则 ,譬如下面标记
QUOTE:
[TABLE][TR] [TD]哈哈[TABLE][TR][TD]的[/TD][/TR][/TABLE][/TD][/TR][/TABLE]
你要匹配正确[TD]*[/TD]你就得必须保证*不包括[TABLE][TR][TD]等,注意不能用[^[]*?啊,因为用他无法匹配正确的[/TD]的,所以问题在与我怎么保证这个*不包括[TABLE][TR][TD]呢,(我不会写)。所以我:
退一步,先用[td[^]]*?][^[]*?[table找到最后一个(其实最内层的)表格,然后把最内层的表格转为HTML标记,然后循环从头开始再来一次,一直到所有标记被替换。这个理论上是可以实现的。我用JSP正在实验,需要时间,希望有兴趣朋友用ASP,PHP实验一下。
因为我急用,所以我又退了一步,就是直接查找][TABLE]等标记然后替换,有4个表达式,[TABLE][TR][TD]、[/TD][/TR][TR][TD]、[/TD][TD]、[/TD][/TR][TABLE] ,大家知道,UBB需要把/R/N替换成
的,于是我用上面作出的正则查找并替换掉所有[TABLE]和[TR]和[TD]和[/TD]和[/TR]和[/TABLE]中的换行。其实这个表达式比下面表达式就多了这个替换换行功能,其不足之处是很明显的,就是不能完善的剔除非配套的标记,必须保证所有TABLE标记是正确配套的(有TBODY的再改改就是了),否则乱套。总 这一步我实践还不错。
再退一步,其实没法退了,就是直接单个查找替换[TABLE]等标记,这是最苯的方法了,也是效果最不好的,因为大家知道在HTML编辑器里的表格标记中好多换行的,而UBB是为换行转为
的,所以这个方法实现了会发现好多空行的,而且这个方法和上面那一步一个共同缺点就是更不能剔除非配套标记。
附我写的退一步后的正则:(我用JSP)
QUOTE:
\[(table)([^\[]*?)\][^\[]*?\[tr\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[\/tr\][^\[]*?\[tr\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[td([^\[]*)\]|\[\/(td)\][^\[]*?\[\/tr\][^\[]*?\[\/table\]
我想如果是管理员发布信息什么的,能保证表格标记的正确的话用这个还可以的。其实如果有人想捣乱的话,再严谨的UBB也不能防止的啊。
欢迎有兴趣者来此讨论,提出更好建议,打造最好最全的UBB。
[TABLE]
[TR]
[TD]
哈哈
[TABLE]
[TR]
[TD]
的
[TABLE]
[TR]
[TD]
的
[TABLE]
[TR]
[TD]
的
[/TD]
[/TR]
[/TABLE]
[/TD]
[/TR]
[/TABLE]
[/TD]
[/TR]
[/TABLE]
[/TD]
[/TR]
[/TABLE]
[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]
[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]