执行、获取远程代码返回:file_...-PHP 冒泡排序二分查找顺序查...-使用php判断网页是否gzip压缩

当前位置: 编程技术>php

本页文章导读:

▪执行、获取远程代码返回:file_get_contents 超时处理的问题详解天气终于晴了，但问题来了。在实现两个站点间用户数据同步，当使用php函数 file_get_contents抓取执行远程页面时，如果连接超时将会输出一个Fatal Error或相当的慢，结果导致下面的代码不能.........

▪PHP 冒泡排序二分查找顺序查找二维数组排序算法函数的详解数据结构很重要，算法+数据结构+文档=程序使用PHP描述冒泡排序算法，对象可以是一个数组代码如下://冒泡排序（数组排序）function bubble_sort($array) {$count = count($array);if ($count <= 0)return fals.........

▪使用php判断网页是否gzip压缩昨天晚上群里有朋友采集网页时发现file_get_contents 获得的网页保存到本地为乱码,响应的header 里 Content-Encoding:gzip但在浏览器里看是正常的。因为我有过相关经验马上发现是网站开启了gzip而fi.........

[1]执行、获取远程代码返回:file_get_contents 超时处理的问题详解

来源: 互联网发布时间: 2013-11-30

天气终于晴了，但问题来了。在实现两个站点间用户数据同步，当使用php函数 file_get_contents抓取执行远程页面时，如果连接超时将会输出一个Fatal Error或相当的慢，结果导致下面的代码不能运行。先了解一下PHP file_get_contents() 函数
定义和用法
file_get_contents() 函数把整个文件读入一个字符串中。
和 file() 一样，不同的是 file_get_contents() 把文件读入一个字符串。
file_get_contents() 函数是用于将文件的内容读入到一个字符串中的首选方法。如果操作系统支持，还会使用内存映射技术来增强性能。
语法
file_get_contents(path,include_path,context,start,max_length)参数描述
path 必需。规定要读取的文件。
include_path 可选。如果也想在 include_path 中搜寻文件的话，可以将该参数设为 "1"。
context 可选。规定文件句柄的环境。
context 是一套可以修改流的行为的选项。若使用 null，则忽略。
start 可选。规定在文件中开始读取的位置。该参数是 PHP 5.1 新加的。
max_length 可选。规定读取的字节数。该参数是 PHP 5.1 新加的。
说明
对 context 的支持是 PHP 5.0.0 添加的。
针对超时或页面过慢，一般可采取两个解决方案：

一. 利用file_get_contents()第三个参数

代码如下:

$url = "http://zhoz.com/zhoz.php";
$ctx = stream_context_create(array(
‘http' => array(‘timeout' => 10)
    )
    );
$result = @file_get_contents($url, 0, $ctx);
if($result){
        var_dump($result);
    }else{
echo " Buffer is empty";
    }
?>

此方法1，我经测试在本地反映良好，但如果在外网测试（环境：中国→美国服务器间）基本都是超时的情况。
测试了TimeOut基本没有用了，建议以下方式

二. 使用curl扩展库

代码如下:

$url = "http://zhoz.com/zhoz.php";
try {
echo date(‘Y-m-d h:i:s');
echo "";
//$buffer = file_get_contents($url);
$buffer = zhoz_get_contents($url);
echo date(‘Y-m-d h:i:s');
if(emptyempty($buffer)) {
echo " Buffer is empty";
        } else {
echo " Buffer is not empty";
        }
    } catch(Exception $e) {
echo "error ";
    }
function zhoz_get_contents($url, $second = 5) {
$ch = curl_init();
        curl_setopt($ch,CURLOPT_URL,$url);
        curl_setopt($ch,CURLOPT_HEADER,0);
        curl_setopt($ch,CURLOPT_TIMEOUT,$second);
        curl_setopt($ch,CURLOPT_RETURNTRANSFER, true);
$content = curl_exec($ch);
        curl_close($ch);
return $content;
    }
?>

综述，根据系统环境来选择到底应用哪种方法：

代码如下:

[2]PHP 冒泡排序二分查找顺序查找二维数组排序算法函数的详解

来源: 互联网发布时间: 2013-11-30

数据结构很重要，算法+数据结构+文档=程序
使用PHP描述冒泡排序算法，对象可以是一个数组

代码如下:

//冒泡排序（数组排序）
function bubble_sort($array) {
$count = count($array);
if ($count <= 0)
return false;
for($i=0; $i<$count; $i++){
for($j=$count-1; $j>$i; $j–){
if ($array[$j] < $array[$j-1]){
$tmp = $array[$j];
$array[$j] = $array[$j-1];
$array[$j-1] = $tmp;
}
}
}
return $array; }

使用PHP描述顺序查找和二分查找（也叫做折半查找）算法，顺序查找必须考虑效率，对象可以是一个有序数组

代码如下:

//二分查找（数组里查找某个元素）
function bin_sch($array, $low, $high, $k){
if ($low <= $high){
$mid = intval(($low+$high)/2);
if ($array[$mid] == $k){
return $mid;
}elseif ($k < $array[$mid]){
return bin_sch($array, $low, $mid-1, $k);
}else{
return bin_sch($array, $mid+1, $high, $k);
}
}
return -1;
}
//顺序查找（数组里查找某个元素）
function seq_sch($array, $n, $k){
$array[$n] = $k;
for($i=0; $i<$n; $i++){
if($array[$i]==$k){
break;
}
}
if ($i<$n){
return $i;
}else{
return -1;
}
}

写一个二维数组排序算法函数，能够具有通用性，可以调用php内置函数

代码如下:

//二维数组排序， $arr是数据，$keys是排序的健值，$order是排序规则，1是升序，0是降序
function array_sort($arr, $keys, $order=0) {
if (!is_array($arr)) {
return false;
}
$keysvalue = array();
foreach($arr as $key => $val) {
$keysvalue[$key] = $val[$keys];
}
if($order == 0){
asort($keysvalue);
}else {
arsort($keysvalue);
}
reset($keysvalue);
foreach($keysvalue as $key => $vals) {
$keysort[$key] = $key;
}
$new_array = array();
foreach($keysort as $key => $val) {
$new_array[$key] = $arr[$val];
}
return $new_array;
}

[3]使用php判断网页是否gzip压缩

来源: 互联网发布时间: 2013-11-30

昨天晚上群里有朋友采集网页时发现file_get_contents 获得的网页保存到本地为乱码,响应的header 里 Content-Encoding:gzip
但在浏览器里看是正常的。
因为我有过相关经验马上发现是网站开启了gzip而file_get_contents 获得的是压缩过的页面，而不是解压过的页面（不知道是不是要file_get_conttents 请求网页时带上相应的参数，直接获得没有被gzip压缩过的网页？）
刚好我前不久刚看到可以用读取文件的前2个字节判断文件类型。群里面的朋友也说gzip压缩过的网页(gbk编码)前2字节是 1F 8B 于是就可以判断网页是否gzip压缩过。
代码如下：

代码如下:

//米尔军事网采用 gzip压缩网页
//file_get_contents 直接获得的网页是乱码。
header('Content-Type:text/html;charset=utf-8' );
$url = 'http://www.miercn.com';
$file = fopen($url, "rb");
//只读2字节如果为(16进制)1f 8b (10进制)31 139则开启了gzip ;
$bin = fread($file, 2);
fclose($file);
$strInfo = @unpack("C2chars", $bin);
$typeCode = intval($strInfo['chars1'].$strInfo['chars2']);
$isGzip = 0;
switch ($typeCode)
{
    case 31139:
      //网站开启了gzip
        $isGzip = 1;
        break;
    default:
        $isGzip = 0;
}
$url = $isGzip ? "compress.zlib://".$url:$url; // 三元表达式
$mierHtml = file_get_contents($url); //获得米尔军事网数据
$mierHtml = iconv("gbk","utf-8",$mierHtml);
echo $mierHtml;