在php编程语言中,Ctype函数是PHP内置的字符串体测函数。
主要包括如下几种:
ctype_alnum -- Check for alphanumeric character(s)
检测是否是只包含[A-Za-z0-9]
ctype_alpha -- Check for alphabetic character(s)
检测是否是只包含[A-Za-z]
ctype_cntrl -- Check for control character(s)
检查是否是只包含类是“\n\r\t”之类的字 符控制字符
ctype_digit -- Check for numeric character(s)
检查时候是只包含数字字符的字符串(0-9)
ctype_graph -- Check for any printable character(s) except space
检查是否是只包含有可以打印出来的字符(除了空格)的字符串
ctype_lower -- Check for lowercase character(s)
检查是否所有的字符都是英文字母,并且都是小写的
ctype_print -- Check for printable character(s)
检查是否是只包含有可以打印出来的字符的字符串
ctype_punct -- Check for any printable character which is not whitespace or an alphanumeric character
检查是否是只包含非数字/字符/空格的可打印出来的字符
ctype_space -- Check for whitespace character(s)
检查是否是只包含类是“ ”之类的字符和空格
ctype_upper -- Check for uppercase character(s)
检查是否所有的字符都是英文字母,并且都是大写的
ctype_xdigit -- Check for character(s) representing a hexadecimal digit
检查是否是16进制的字符串,只能包括 “0123456789abcdef”
IP地址库QQWry.Data文件的内容结构及解读方式。
一、文件结构
文件主要分三个结构
1、文件头,8个字节;
2、数据记录区,不定长度;
3、索引区,长度为 7 的整数倍;
二、文件头
文件头的8个字节分两部分,每个部分4个字节,分别指定了索引区的开始地址和结束地址。所以可以通过两个地址的差值 除 7 后 加 1 可以计算出总的记录数。
二、记录区
记录区的数据需要通过索引区的数据来获得各个数据的起始位置;本区数据记录了IP地址的结束地址和地区字符串;所有地区字符串都以 0×00 为结束。
三、索引区
检索IP对应的地区,关键就是找到IP起始地址对应的索引内容。一个IP索引数据包含7个字节,前4个字节是IP地址起始值,后3个字节是对应的IP数据 记录在文件内的偏移地址;IP数据记
录中,前 4 个字节是IP结束地址;紧跟的数据有两种模式: 0×01 模式 和 0×02 模式。
0×01模式,即在IP数据的第5个字节是 0×01,则在后面的 3 个字节是国家地区数据的偏移地址;国家地区数据包括国家和地区这两个字符串。即
4字节 | 3字节 重定向 0x NN NN NN -> 国家地区数据的文件偏移地址
0×02模式,即在IP数据的第5个字节是 0×02,则在后面的 3 个字节是国家数据的偏移地址,地区数据是再往后的字符串,以 0×00 截至。即
4字节 | 3字节 重定向 0x NN NN NN -> 国家数据的文件偏移地址 | 地区字符串 | 0×00
对于 0×01 模式所得到的 国家地区数据中,它可能又带有一个重定向结构,即
国家字符串 | 0×00 | 地区字符串 | 0×00
或
国家字符串 | 0×00 | 0×02 | 3字节 0x NN NN NN -> 地区字符串的文件偏移地址
对于前一种情况,比较简单,直接读出两个字符串数据就可以了;
对于后一种情况,需要再次重定向到地区字符串的偏移地址,然后读取到 0×00 为字符串结尾。
对于这种采取地址映射实际字符串值的方式,主要作用是避免重复记录字符串值。
在整个IP地址库文件中,有太多相同字符串记录了,采用 3 字节的映射地址要比重复记录字符串值节省太多空间了。
读取操作QQWry.dat文件的代码,如下:
<?php /** * 读取QQWry.dat IP地址库 * edit by www. */ function bin2ip($bin){ $ip = ''; $bd = str_split($bin, 1); for($i = 4; $i > 0; $i--){ $ip .= "." . sprintf("%03d", implode('', unpack('s', $bd[$i-1] . chr(0)))); } return substr($ip, 1); } //--------- $f = fopen('QQWry.Dat', 'r'); $c = fread($f, 4); $d = fread($f, 4); $index_begin = implode('', unpack('L', $c)); $index_end = implode('', unpack('L', $d)); if($index_begin < 0) $index_begin += pow(2, 32); if($index_end < 0) $index_end += pow(2, 32); $ip_num = ($index_end - $index_begin) / 7 + 1; echo "index begin at: $index_begin\n"; echo "index end at: $index_end\n"; echo "ip data count : $ip_num\n"; $output = ''; for($i = 0; $i < $ip_num; $i++){ //文件指针指到每个IP数据文件的索引取得索引数据(7字节)上 fseek($f, $i * 7 + $index_begin); $ip4 = fread($f, 4); //IP起始地址 if(strlen($ip4) < 4) exit('data file error'); $ip3 = fread($f, 3); //IP记录偏移地址 if(strlen($ip3) < 3) exit('data file error'); $dataseek = implode('', unpack('L', $ip3 . chr(0))); if($dataseek < 0) $index_ip_record += pow(2, 32); //指向记录区 $dataseek 位置查找记录 fseek($f, $dataseek); $ipdata = fread($f, 4); //IP结束地址 if(strlen($ipdata) < 4) exit('data file error'); $area = ''; $country = ''; //读一个标记位 $flag = fread($f, 1); if($flag == chr(1)){ //国家名偏移标记位 模式一 0x01 $area1seek = fread($f, 3); if(strlen($area1seek) < 3) exit('data file error'); $area1seek = implode('', unpack('L', $area1seek . chr(0))); fseek($f, $area1seek); $flag = fread($f, 1); //可能又是标记位 } if($flag == chr(2)){ //国家地区 重定向 $area1seek = fread($f, 3); if(strlen($area1seek) < 3) exit('data file error'); $area1seek = implode('', unpack('L', $area1seek . chr(0))); $flag = fread($f, 1); if($flag == chr(2)){ $area2seek = fread($f, 3); $area2seek = implode('', unpack('L', $area2seek . chr(0))); fseek($f, $area2seek); }else{ fseek($f, -1, SEEK_CUR); } while(($c = fread($f, 1)) != chr(0)) $area .= $c; fseek($f, $area1seek); while(($c = fread($f, 1)) != chr(0)) $country .= $c; }else{ fseek($f, -1, SEEK_CUR); while(($c = fread($f, 1)) != chr(0)) $country .= $c; $flag = fread($f, 1); //如果地区是重定向的 if($flag == chr(2)){ $area2seek = fread($f, 3); $area2seek = implode('', unpack('L', $area2seek . chr(0))); fseek($f, $area2seek); }else{ fseek($f, -1, SEEK_CUR); } while(($c = fread($f, 1)) != chr(0)) $area .= $c; } $adata = trim($country) . trim($area); //$country是国家字符串 , $area 是地区字符串 } fclose($f); ?>
演示例子1,
首先是首页,包含一个文本输入和一个显示聊天内容的iframe,还有一个隐藏iframe用来提交form表单:
//chat.php
header('cache-control: private');
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<script type="text/javascript">
function submitChat(obj) {
obj.submit();
document.getElementsByName('content')[0].value = '';
}
</script>
<iframe src="/blog_article/chat_content.html" height="300" width="100%"></iframe>
<iframe name="say" height="0" width="0"></iframe>
<form method="POST" target="say" action="/blog_article/say.html" onsubmit="submitChat(this)">
<input type="text" size="30" name="content" /> <input type="button" value="say"onclick="submitChat(this.form)" />
</form>
</html>
保存用户提交的聊天内容
简易版本:
$content = trim($_POST['content']);
if ($content) {
$fp = fopen('./chat.txt', 'a');
fwrite($fp, $content . "\n");
fclose($fp);
clearstatcache();
}
?>
主要的HTTP长连接部分,chat_content.php文件:
<?php
header('cache-control: private');
header('Content-Type: text/html; charset=utf-8');
//测试设置30秒超时,一般会设置比较长时间。
set_time_limit(30);
//这一行是为了搞定IE这个BT
echo str_repeat(' ', 256);
ob_flush();
flush();
$fp = new SplFileObject('./chat.txt', 'r+');
$line = 0;
$totalLine = 0;
while (!$fp->eof()) {
$fp->current();
$totalLine++;
$fp->next();
}
$fp->seek($totalLine);
$i = $totalLine - 1;
while (true) {
if (!$fp->eof()) {
if ($content = trim($fp->current())) {
echo '<div>';
echo htmlspecialchars()($content);
echo "</div>";
flush();
$fp->next();
$i++;
}
} else {
$fp->seek($i - 1);
$fp->next();
}
{
//这里可以添加心跳检测后退出循环
}
usleep(1000);
}
?>
代码说明:
06. 设置一个超时时间,由于要保持HTTP长连接,这个时间肯定要比较长,可能要几个小时吧,上面提到的文章里也有说明,这种HTTP长连接只能打开两个,由于浏览器的限制。另外
其实即使你设置了一个永不超时,其实上服务器部分(如Apache)的配置文件也可能对HTTP请求设置了最长等待时间,所以也可能效果会不是你想的,一般默认可能都是15分钟超时。如果
有兴趣可以自己尝试修改。
09. 这里输出了一段空白,主要是手册上已经说明了,IE浏览器在前面256个字符是不会直接输出的,所以我们先随便输出些空白,以便让后面的内容输出来,可能其他浏览器也有其他
浏览器的设置,具体可以查看PHP手册的frush函数的说明。接下去11、12行就是强制把这些空白符丢给浏览器输出。
13. ~ 20. 这里主要是为了计算文件行数,以便从这一行后面开始读内容。
接下去的while循环就是一个死循环了,就是循环输出文件内容,每次判断是否到达文件末尾,如果有用户写入文件,则当前检测肯定不是文件末尾,就将该行读取出来输出,否则将指
针往前移动一行,继续循环,每次等待1000微秒,
39. 如果一直保持长连接,那么即使客户端断开,服务端也不一定能知道客户端已经断开,所以这里可能还需要做一些心跳记录,比如每个用户保持一个心跳flag,每格几秒更新一下
最后心跳时间,当检测最后时间很久没更新后,推出这个死循环,关闭这个HTTP连接。
演示示例2:
传统的B/S结构的应用程序,都是采用\"客户端拉\"结束来实现客户端和服务器端的数据交换。
本文将通过结合Ticks,来实现一个服务器推的PHP聊天室简单构想。
PHPer,尤其是用过set_cookie, header的,一定见过这样的提示信息:\"Warning: Cannot modify header information - headers already sent by.....\", 这是因为通过HTTP协议通信
,数据包会包含俩个部分,一个是Header,一个是data。
一般来说,都是先Header部分,在Heaer部分指明了Data部分的长度,然后使用\\r\\n\\r\\n来表示header部分结束,接下来是Data部分。
当有任何输出时,Header部分就发送了,此时,再想header函数来改变一些Header部分的域信息,就会得到上面的提示信息。
一个简单的办法就是使用output_buffering。让它来缓存服务器的输出,不要太早将Header部分发给客户端。
那么,如果不使用output_buffering,是不是就可以实现,每当服务器有输出,就立即发送给客户端呢?
做个如下试验:
//设置php.ini中output_buffering=0 或者使用ob_end_flush()关闭缓存
set_time_limit(0);
for($i=0;$i<10;$i++){
echo \"Now Index is :\". $i;
sleep(1);
}
?>
结果发现,还是要等到脚本全部执行完以后,才能一次看到所有的结果。为什么呢?
这是因为只是解决了缓存问题,但是还有一个缓冲问题,PHP会缓冲程序的输出。
所以,此时还需要调用,flush(), 来强制使得PHP将所有的程序输出发送给客户端。
<?php
//设置php.ini中output_buffering=0
ob_end_flush();//关闭缓存
set_time_limit(0);
for($i=0;$i<10;$i++){
echo \"Now Index is :\". $i;
flush();
sleep(1);
}
?>
现在是不是看到了,不断有服务器的数据显示出来?
有几个概念之间的关系,这里补充下:
在代码中使用ob_start(), 就相当于在php.ini中使用output_buffering=on一样,使用服务器缓存。
在代码中使用ob_end_flush() 就相当于在php.ini中使用output_buffering = false一样,关闭服务器缓存。