使用PHP遍历文件夹与子目录的...-抓取并下载CSS中所有图片文件...-新浪微博API开发简介之用户授权(PHP基础篇)

当前位置: 编程技术>php

本页文章导读:

▪使用PHP遍历文件夹与子目录的函数代码我们要使用的函数有 Scandir，它的作用是列出指定路径中的文件和目录，就像 Dir 一样。 > 与更强力的 Glob() 函数，作用是以数组的形式返回与指定模式相匹配的文件名或目录。 > 友情.........

▪抓取并下载CSS中所有图片文件的php代码这篇文章的亮点是，正则式更加复杂鸟，╮(-_-)╭，再就是 Copy 函数的灰常强大的一个用法。 > 话说刚才听 NsYta 说小邪的主题太白了，杯具。最近太忙，没有空，不然就自己搞一个新主题.........

▪新浪微博API开发简介之用户授权(PHP基础篇) 现在玩微博的人越来越多了，而关于微博的第三方应用开发也越来越多，自己在偶然间开始接触了新浪微博API开发，新浪微博API开发的资源比较多，新浪微博提供了一个开发者的平台，网址.........

[1]使用PHP遍历文件夹与子目录的函数代码

来源: 互联网发布时间: 2013-11-30

我们要使用的函数有 Scandir，它的作用是列出指定路径中的文件和目录，就像 Dir 一样。

> 与更强力的 Glob() 函数，作用是以数组的形式返回与指定模式相匹配的文件名或目录。
> 友情提醒，千万别像小邪那样在电脑前面呆太长时间，否则就会像小邪一样得见鬼的高血糖。

一. 遍历单层文件夹：

> 在扫描单层文件夹的问题是，两个函数的结果虽有不同，不过表现是相差不大的。
> Scandir 函数会提供额外两行，分别是 “.” 和 “..” ，而 Glob 则是没有的。

代码如下:

二. 递归遍历文件树：

> 在递归扫描文件夹树的问题上，还是 Glob 函数的表现好一点，很准确的说。
> Scandir 函数会莫名其妙扫描两次 ../ 处的文件，也就是说如果小邪有俩文件。
> ../b.php 和 ../a.php，结果就会在扫描报告上面出现两次，很是奇怪。

代码如下:

//Update at 2010.07.25 - 以下代码作废
$path = '..';
function get_filetree_scandir($path){
$tree = array();
foreach(scandir($path) as $single){
if(is_dir('../'.$single)){
$tree = array_merge($tree,get_filetree($single));
}
else{
$tree[] = '../'.$single;
}
}
return $tree;
}
print_r(get_filetree_scandir($path));

//Update at 2010.07.25 - 以下为新代码
$path = './';
function get_filetree_scandir($path){
$result = array();
$temp = array();
if (!is_dir($path)||!is_readable($path)) return null; //检测目录有效性
$allfiles = scandir($path); //获取目录下所有文件与文件夹
foreach ($allfiles as $filename) { //遍历一遍目录下的文件与文件夹
if (in_array($filename,array('.','..'))) continue; //无视 . 与 ..
$fullname = $path.'/'.$filename; //得到完整文件路径
if (is_dir($fullname)) { //是目录的话继续递归
$result[$filename] = get_filetree_scandir($fullname); //递归开始
}
else {
$temp[] = $filename; //如果是文件，就存入数组
}
}
foreach ($temp as $tmp) { //把临时数组的内容存入保存结果的数组
$result[] = $tmp; //这样可以让文件夹排前面，文件在后面
}
return $result;
}
print_r(get_filetree_scandir($path));

> Glob 函数扫描灰常准确，并且会自动按照字母排好顺序，貌似是最佳方案。

代码如下:

$path = '..';
function get_filetree($path){
$tree = array();
foreach(glob($path.'/*') as $single){
if(is_dir($single)){
$tree = array_merge($tree,get_filetree($single));
}
else{
$tree[] = $single;
}
}
return $tree;
}
print_r(get_filetree($path));

[2]抓取并下载CSS中所有图片文件的php代码

来源: 互联网发布时间: 2013-11-30

这篇文章的亮点是，正则式更加复杂鸟，╮(-_-)╭，再就是 Copy 函数的灰常强大的一个用法。
> 话说刚才听 NsYta 说小邪的主题太白了，杯具。最近太忙，没有空，不然就自己搞一个新主题。

一. 抓取 CSS 中的图片：
> 1. 首先做好准备工作：
> 第一步，先把 CSS 原本的路径存到 $url 变量里，然后把 CSS 的内容保存在 abc.css 中。
> 因为考虑到经常碰到多个 CSS 文件的状况，所以小邪没有直接填一个 CSS 路径。
> 而是把几个 CSS 文件的内容合并到一起，全部塞到 abc.css 文件里面即可，嘎嘎嘎。

$data = file_get_contents('abc.css');

> 接着读取 CSS 文件的内容到 $data 变量中，然后用正则式把域名给取出来。
> 因为这里考虑到很多图片文件用到了相对根路径，比方说 /img/1.gif 和 img/1.gif。
> 然后 CSS 原地址在 http://www./css/ 那么上面的两个文件位置是不同的。

> 第一个文件在 /upload/201109/20110926143903807.gif，因为它的路径用到了相对根路径。
> 而第二个在 /upload/201109/20110926143903169.gif，它的路径只是普通的相对路径。

代码如下:

$url = 'http://www./css/'; preg_match('/(.*\/\/.*?)\//',$url,$host);
//这里用正则式把 http://www./ 给取出来，后端不要忘记加斜杠喔。
//.*? 是懒惰匹配，也就是能匹配得越少就匹配越少的内容，这样就不会取过头了。
$host = $host[1];

2. 把图片存储文件夹建好：
> 小邪这里用了 is_dir 来确定文件夹是否存在，存在的话，就不用再建立第二遍了。
> 呵呵，顺便说下，is_file 函数可以确定此文件是否为正常文件，也可以确定是否存在。
> 但 file_exists() 优越一点，因为某次看到有人在 Webmasterworld.com 上面讨论过。

if (!is_dir('img')) { mkdir('img'); }

> 3. 用正则式把图片相对地址取出来：

$regex = '/url$\'{0,1}\"{0,1}(.*?)\'{0,1}\"{0,1}$/';
//这里用正则式匹配出图片地址，要考虑三种情况，即 url(/blog_article/1.gif) url('1.gif') url("1.gif")。
//这三种写法都是可以使用的，所以咱们就用上面的正则把里面的 1.gif 取出来。
//\'{0,1} 表示单引号可能出现1次或0次，\" 则表示双引号可能出现1次或0次。
//中间必须使用懒惰匹配，不然取出来的就是 1.gif" 而不是 1.gif 鸟，O(∩_∩)P。
preg_match_all($regex,$data,$result);

> 4. 处理这些图片：

> 首先使用一个循环，把上面是用正则提取出来的第一分支内容数组给处理一下。
> 额，这里的第一分支表示正则式里面的第一个括号来着，呵呵，以此类推。

foreach ($result[1] as $val) { }

> 然后是用正则式判定，因为还要考虑到这样 /upload/201109/20110926143903807.gif。
> 这样是使用了完整的路径了，而不是想其他的一样是 /img/1.gif 或者 img/1.gif。
> 所以单独判断一下，然后接着判断这两个，看看是 /img/1.gif 还是 img/1.gif。

代码如下:

if (preg_match('/^http.*/',$val)) { $target = $val; }
else if (preg_match('/^\/.*/',$val)) { $target=$host.$val; }
else { $target=$url.$val; }
echo $target."<br/>\r\n";

> 最后把文件名取出来，即 /img/1.gif 中的 1.gif，用于保存文件。

代码如下:

preg_match('/.*\/(.*\.\D+)$/',$val,$name);

> 然后咱们就可以开始下载了，这里要介绍一个强大的 Copy 函数用法。

代码如下:

if (!is_file('./img/'.$name[1])) {
$imgc = file_get_contents($target);
$handle = fopen('./img/'.$name[1],'w+');
fwrite($handle,$imgc);
fclose($handle);
}

> 上面那个是咱们的老方法了，嘎嘎，很麻烦。某次，小邪突然发现 Copy 的强大。
> Copy 居然也可以下载，所以可以轻松使用下面的代码来处理，上面的可以退休鸟。

代码如下:

if (!is_file('./img/'.$name[1])) {
copy($target,'./img/'.$name[1]);
}

> 5. 完整源代码：

> 使用的时候把 $url 填好即可，然后把所有 CSS 内容存到 abc.css 中即可。

代码如下:

<?php
$url = 'http://www./css/';
$data = file_get_contents('abc.css');
preg_match('/(.*\/\/.*?)\//',$url,$host);
$host = $host[1];
if (!is_dir('img')) { mkdir('img'); }
$regex = '/url$\'{0,1}\"{0,1}(.*?)\'{0,1}\"{0,1}$/';
preg_match_all($regex,$data,$result);
foreach ($result[1] as $val) {
if (preg_match('/^http.*/',$val)) { $target = $val; }
else if (preg_match('/^\/.*/',$val)) { $target=$host.$val; }
else { $target=$url.$val; }
echo $target."<br/>\r\n";
preg_match('/.*\/(.*\.\D+)$/',$val,$name);
if (!is_file('./img/'.$name[1])) {
copy($target,'./img/'.$name[1]);
}
}?>

[3]新浪微博API开发简介之用户授权(PHP基础篇)

来源: 互联网发布时间: 2013-11-30

现在玩微博的人越来越多了，而关于微博的第三方应用开发也越来越多，自己在偶然间开始接触了新浪微博API开发，新浪微博API开发的资源比较多，新浪微博提供了一个开发者的平台，网址是：http://open.weibo.com，它里面有很全面的新浪微博开发的资料，包括开发者的使用和介绍，各种语言的API函数介绍文档，SDK等多种资料。

自己在开发和学习的过程中，感觉虽然没有太大难度，但还是有一些问题是需要我们注意的，今天就我在开发和学习的过程中，简单的对利用PHP进行新浪微博API开发的内容进行一个整理和说明，

新浪微博API开发前的准备工作

首先到新浪微博开放平台下载基于PHP的SDK开发包，下载地址是：http://code.google.com/p/libweibo/downloads/detail?name=weibo-oauth-class-with-image-avatar-06-29.zip

下载完成后放到自己的开发环境中并解压，在其中也包含了demo演示程序，我们可以参考其样例程序进行编写。

新浪微博API开发最重要的用户授权过程

其实在开发过程中很多的问题都是集中在用户授权这个阶段，我开发的第三方应用，使用的是OAuth授权，关于OAuth授权的流程在新浪微博开放平台里有很清晰完整的介绍，我们可以到http://open.weibo.com/wiki/Oauth去查看，我这里从实例开发的角度进行介绍和说明。

1.首先获取未授权的Request Token

代码如下:

$o = new WeiboOAuth( WB_AKEY , WB_SKEY );
$keys = $o->getRequestToken();
//echo($keys['oauth_token'].' : '.$keys['oauth_token_secret']);

我们需要在新浪微博开放平台中注册一个帐号，或直接使用我们的新浪微博帐号登录，进入我的应用，然后按照提示创建属于我们自己的第三方应用，创建完成之后我们可以得到两个授权的App Key和App Secret值，这两个值就是我们开发应用的关键。
得到授权值后，我们就可以利用上面的代码获得未授权的Request Token值了，它们会保存在$key数组变量中。
2.然后请求用户授权Token

代码如下:

$_SESSION['keys'] = $keys;
aurl = $o->getAuthorizeURL( $keys['oauth_token'] ,false , 'http://localhost/callback.php');

得到未授权的Request Token值后，我们就利用上面的代码可以开始准备去新浪微博授权页面进行授权，$aurl就是授权链接页面，我们得到$aurl后就可以利用header()直接跳转到该授权页面，然后用户输入新浪微博帐号和密码进行授权，授权完成后，自动跳回你在最后一个参数里面设置的回调页面：http://localhost/callback.php，该链接你可以设置为上一个页面，这样授权完成之后就会自动又跳转回去了。
需要注意的是设置session的keys的值是必须的，它在下面获取到授权的Access Token中是需要用到的。很多的朋友可能会参考其开放平台上面的说明来进行授权时，可发现总是出错，一般都是这个问题，你并未设置session的keys值，在下面当然取不到Access Token的值了，这个一定要记住了。
3.最后得到用户授权的Access Token

代码如下:

$o = new WeiboOAuth( WB_AKEY ,
WB_SKEY ,
$_SESSION['keys']['oauth_token'] ,
$_SESSION['keys']['oauth_token_secret'] );
$last_key = $o->getAccessToken( $_REQUEST['oauth_verifier'] ) ;
echo($last_key['oauth_token']);

上面的代码就最终获得了用户授权的Access Token，共两个值，它们保存在$last_key数组变量里面，我们也可以看到，后面的两个参数就是前面我们设置的session值。到此就基本完成了，这就是新浪微博用户授权的一个完整的过程。
授权完成后的工作
在授权完成之后，我们就可以开始调用新浪微博提供的各类API函数接口进行实际应用的开发了，在这里我就获取最新微博记录这个接口进行一个简单说明，其他都类似。
获取最新新浪微博信息的API接口函数是：public_timeline()，样例代码看下面：

代码如下:

//获取前20条最新更新的公共微博消息
$c = new WeiboClient( WB_AKEY ,
WB_SKEY ,
$oauth_token ,
$oauth_token_secret );
$msg = $c->public_timeline();
if ($msg === false || $msg === null){
echo "Error occured";
return false;
}
if (isset($msg['error_code']) && isset($msg['error'])){
echo ('Error_code: '.$msg['error_code'].'; Error: '.$msg['error'] );
return false;
}
print_r($msg);

通常我们在得到用户授权的Access Token值之后，就把它们保存在我们的用户表中，与我们的应用中的帐号进行对应，之后我们在调用新浪微博各api接口时就不用每次都去认证了。
上面的代码很简单，实例化WeiboClient对象，然后直接调用接口函数public_timeline就可以得到返回的信息，如果没有错误的话。通常新浪微博api接口返回的数据格式一般为Json格式或xml格式，而我们在此是用php进行开发，则使用Json格式的数据就有先天的优势，如果返回Json格式数据的话，直接使用php函数json_decode()就可以转换为php常用的array数组格式了。
来源：红心草博客
原文地址：http://www.hongxincao.com/archives/579.html