php使HTML标签自动补全闭合函...-php 魔术方法使用说明-php实现html标签自动补全的代码

当前位置: 编程技术>php

本页文章导读:

▪php使HTML标签自动补全闭合函数的代码一个不错的自动补全闭合函数，可以根据你的html内容自己补全闭合，确保HTMl代码正确。感兴趣的朋友可以参考下。简单解释：第一个 ~(<[^>]+?>)~si 这个正则是匹配<………>中的.........

▪php 魔术方法使用说明本文为大家介绍PHP的魔术方法（函数），经常用到哦，希望大家牢固掌握哦。 1.__construct() 当实例化一个对象的时候，这个对象的这个方法首先被调用。 class Test { function __construct() { echo "before.........

▪php实现html标签自动补全的代码经常遇到截取html字符串问题，比如博客文章列表页面截取一部分正文、文章正文翻页截取等。一般情况下先用PHP的 strip_tags() 函数去掉所有html标签，再去掉空格等，然后再用substr或.........

[1]php使HTML标签自动补全闭合函数的代码

来源: 互联网发布时间: 2013-12-24

一个不错的自动补全闭合函数，可以根据你的html内容自己补全闭合，确保HTMl代码正确。感兴趣的朋友可以参考下。
简单解释：
第一个 ~(<[^>]+?>)~si
这个正则是匹配<………>中的内容。简单说是所有的<标签>。
第二个 ~<([a-z0-9]+)[^/>]*?/>~si
这个正则是匹配<……/>中的内容。是单闭合标签如<br />
第三个 ~</([a-z0-9]+)[^/>]*?>~si
这个正则是匹配</......>中的内容。也就是结束标签如</a>
第四个 ~<([a-z0-9]+)[^/>]*?>~si
匹配<......>中的内容。这和第一个是不一样的，这一个是真正的html标签，因为html标签只有数字和字母，如：<h1></h1>
第五个 ~~si
不用解释了，HTMl的注释
函数的完整代码如下：

代码如下:

<?php
/**
* 取HTML,并自动补全闭合
*
* param $html
*
* param $length
*
* param $end
*/
function subHtml($html, $length=50) {
$result = '';
$tagStack = array();
$len = 0;
$contents = preg_split("~(<[^>]+?>)~si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);
foreach($contents as $tag) {
if (trim($tag) == "") continue;
if (preg_match("~<([a-z0-9]+)[^/>]*?/>~si", $tag)) {
$result .= $tag;
} else if (preg_match("~</([a-z0-9]+)[^/>]*?>~si", $tag, $match)) {
if ($tagStack[count($tagStack)-1] == $match[1]) {
array_pop($tagStack);
$result .= $tag;
}
} else if (preg_match("~<([a-z0-9]+)[^/>]*?>~si", $tag, $match)) {
array_push($tagStack, $match[1]);
$result .= $tag;
} else if (preg_match("~~si", $tag)) {
$result .= $tag;
} else {
if ($len + mstrlen($tag) < $length) {
$result .= $tag;
$len += mstrlen($tag);
} else {
$str = msubstr($tag, 0, $length - $len + 1);
$result .= $str;
break;
}
}
} while (!empty($tagStack)) {
$result .= '</' . array_pop($tagStack) . '>';
}
return $result;
}
/**
* 取中文字符串
*
* param $string 字符串
*
* param $start 起始位
*
* param $length 长度
*
* param $charset 编码
*
* param $dot 附加字串
*/
function msubstr($string, $start, $length, $dot = '', $charset = 'UTF-8') {
$string = str_replace()(array('&', '"', '<', '>', ' '), array('&', '"', '<', '>', ' '), $string);
if (strlen($string) <= $length) {
return $string;
}
if (strtolower()($charset) == 'utf-8') {
$n = $tn = $noc = 0;
while ($n < strlen($string)) {
$t = ord($string[$n]);
if ($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {
$tn = 1;
$n++;
} elseif (194 <= $t && $t <= 223) {
$tn = 2;
$n += 2;
} elseif (224 <= $t && $t <= 239) {
$tn = 3;
$n += 3;
} elseif (240 <= $t && $t <= 247) {
$tn = 4;
$n += 4;
} elseif (248 <= $t && $t <= 251) {
$tn = 5;
$n += 5;
} elseif ($t == 252 || $t == 253) {
$tn = 6;
$n += 6;
} else {
$n++;
}
$noc++;
if ($noc >= $length) {
break;
}
}
if ($noc > $length) {
$n -= $tn;
}
$strcut = substr($string, 0, $n);
} else {
for($i = 0; $i < $length; $i++) {
$strcut .= ord($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i];
}
}
return $strcut . $dot;
}
/**
* 得字符串的长度，包括中英文。
*/
function mstrlen($str, $charset = 'UTF-8') {
if (function_exists('mb_substr')) {
$length = mb_strlen($str, $charset);
} elseif (function_exists('iconv_substr')) {
$length = iconv_strlen($str, $charset);
} else {
preg_match_all("/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-f][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/", $text, $ar);
$length = count($ar[0]);
}
return $length;
}
$str = "<div><table>x<tr>1s<td>测试<td>124";
echo subHtml($str);
?>

您可能感兴趣的文章：
php去除HTML标签的二种方法
php 去除多余的HTML标签
php用strip_tags完整去除所有html标签的实例分享
php过滤html标记的函数strip_tags用法举例(图文)
php删除html标签的三种方法分享
php删除html标签及字符串中html标签的代码
php获取html网页内容的多个方法
去掉内容中 html 标签的代码
提取html标签的php代码
php正则过滤html标签、空格、换行符等的代码示例
php去除html标签获得输入纯文本文档strip_tags
php实现html标签自动补全的代码
thinkPHP的Html模板标签的使用方法

[2]php 魔术方法使用说明

来源: 互联网发布时间: 2013-12-24

本文为大家介绍PHP的魔术方法（函数），经常用到哦，希望大家牢固掌握哦。

1.__construct() 当实例化一个对象的时候，这个对象的这个方法首先被调用。
class Test { function __construct() { echo "before"; } } $t = new Test();
class Test { function __construct() { echo "before"; } } $t = new Test();
输出是：
start
我们知道php5对象模型和类名相同的函数是类的构造函数，那么如果我们同时定义构造函数和__construct()方法的话,php5会默认调用构造函数而不会调用__construct()函数，所以__construct()作为类的默认的构造函数

2.__destruct() 当删除一个对象或对象操作终止的时候，调用该方法。
class Test { function __destruct() { echo "end"; } } $t = new Test();将会输出end
class Test { function __destruct() { echo "end"; } } $t = new Test();将会输出end
我们就可以在对象操作结束的时候进行释放资源之类的操作

3.__get() 当试图读取一个并不存在的属性的时候被调用。

如果试图读取一个对象并不存在的属性的时候，PHP就会给出错误信息。如果在类里添加__get方法，并且我们可以用这个函数实现类似java中反射的各种操作。
class Test { public function __get($key) { echo $key . " 不存在"; } } $t = new Test(); echo $t->name; 就会输出：name 不存在
class Test { public function __get($key) { echo $key . " 不存在"; } } $t = new Test(); echo $t->name; 就会输出：name 不存在

4.__set() 当试图向一个并不存在的属性写入值的时候被调用。
class Test { public function __set($key,$value) { echo '对'.$key . "附值".$value; } } $t = new Test(); $t->name = "aninggo"; 就会输出：对 name 附值 aninggo
class Test { public function __set($key,$value) { echo '对'.$key . "附值".$value; } } $t = new Test(); $t->name = "aninggo"; 就会输出：对 name 附值 aninggo

5.__call() 当试图调用一个对象并不存在的方法时，调用该方法。
class Test { public function __call($Key, $Args) { echo "您要调用的 {$Key} 方法不存在。你传入的参数是：" . print_r($Args, true); } } $t = new Test(); $t->getName(aning,go);
class Test { public function __call($Key, $Args) { echo "您要调用的 {$Key} 方法不存在。你传入的参数是：" . print_r($Args, true); } } $t = new Test(); $t->getName(aning,go);

程序将会输出：
您要调用的 getName 方法不存在。参数是：Array
(
[0] => aning
[1] => go
)
您要调用的 getName 方法不存在。参数是：Array
(
[0] => aning
[1] => go
)

6.__toString() 当打印一个对象的时候被调用

这个方法类似于java的toString方法，当我们直接打印对象的时候回调用这个函数
class Test { public function __toString() { return "打印 Test"; } } $t = new Test(); echo $t;
运行echo $t;的时候，就会调用$t->__toString();从而输出
打印 Test

7.__clone() 当对象被克隆时，被调用
class Test { public function __clone() { echo "我被复制了！"; } }$t = new Test(); $t1 = clone $t;程序输出：我被克隆了！

[3]php实现html标签自动补全的代码

来源: 互联网发布时间: 2013-12-24

经常遇到截取html字符串问题，比如博客文章列表页面截取一部分正文、文章正文翻页截取等。
一般情况下先用PHP的 strip_tags() 函数去掉所有html标签，再去掉空格等，然后再用substr或者自己实现的cn_substr函数来实现截取。因为如果不先去掉html标签，直接截取出来的字符串就会有没有闭合的标签出现，有时甚至会截取在标签上面比如：
</di ...

今天遇到一个内容翻页截取问题：正文是用富文本编辑器写入的，编辑器上有个分页按钮，点击之后就往当前光标位置插入一个蓝色的
<hr />

横线。然后php直接存入数据库。显示的时候，用 explode() 函数根据这个
<hr />

标记来分成一个数组，然后根据当前页码来显示某个片段。但是有个严重的问题，比如富文本编辑器写入：
<div >
content of page 1
<hr />
page 2 content
</div>

如果用explode函数分开后，
第一页的内容是
<div >

content of page 1
第二页的内容是：
page 2 content
</div>

这样就产生了没有闭合的标签，直接显示到页面上面就会破坏页面布局。。。
想了很久，也找了网上很多 closetag函数。但是发现都针对第一页那种没有闭合的标签的闭合。对于第二种没有开头的标签就没办法了。

针对第一页那种没有闭合的标签的闭合的closetags方法是：

代码如下:

后来想了一个办法，利用浏览器自己的html解释引擎来帮助补全有问题的html片段。具体做法如下：

代码如下:

原理：先把html片段写入到一个空的div里面，然后再从这个div里面读取出来。别看写入和读取的属性都是innerHTML，写入的内容和得到的内容是不一样的噢。如果写入不完整的html片段，浏览器会自动补全修正。读取出来的时候就已经是完整的html dom 片段了。

注意：这样有个弊端，由于是Js加载内容信息的，会对搜索引擎优化不好。