当前位置:  编程技术>其它

PHP 正则表达式分析RSS

    来源: 互联网  发布时间:2014-10-15

    本文导语:  代码如下:$xmlfile = 'news/'.date('YmdH').'.xml'; $sourcexml = 'http://www.chinanews.com.cn/rss/scroll-news.xml'; if( !file_exists($xmlfile) ) { $str = @file($sourcexml) or die('加载文件时出错。'); $fp = fopen($xmlfile,'w') or die('写缓存失败!'); fputs($fp,$str); fclose($fp); 然...

代码如下:

$xmlfile = 'news/'.date('YmdH').'.xml';
$sourcexml = 'http://www.chinanews.com.cn/rss/scroll-news.xml';
if( !file_exists($xmlfile) ) {
$str = @file($sourcexml) or die('加载文件时出错。');
$fp = fopen($xmlfile,'w') or die('写缓存失败!');
fputs($fp,$str);
fclose($fp);

然后用simplexml读取并输出HTML
代码如下:

$xml = simplexml_load_file($xmlfile);
$c = $xml->channel;
$k = 0;
foreach($c->item as $v) {
$k ++;
echo "

";

后来遇到了一个问题,就是RSS中经常包含有一些GBK的繁体字。google了很多字符集转换方面的文章。得出一个解法:
代码如下:

$str = mb_convert_encoding( join('',$str), "gb2312", "GBK");

这个方法并不能繁体转为简体,会转成一个乱码,但至少能保证simplexml_load_file($xmlfile)执行成功。因为这些繁体字通常出现在描述里
,暂且接受。
再后来遇到另一个问题,描述里出现了形如“中新网12月30日电(闻育e?”的乱码,simplexml_load_file失败。
至此考虑用正则表达式获取标题和链接。(有文章说正则表达式效率可能更好,以后再验证)
代码如下:
代码如下:

$fp = fopen($xmlfile,'r');
if($fp)
{
$data = fread($fp,filesize($xmlfile));
fclose($fp);
preg_match_all(
"/(.*?)(.*?)/i",$data,$out,PREG_SET_ORDER);
foreach($out as $key => $v)
{
$v[1] = iconv('gbk','utf-8',$v[1]);
echo "

";
}
}

    
 
 

您可能感兴趣的文章:

  • PHP html标签正则替换并可自定义正则规则
  • php使用正则过滤js脚本代码实例
  • 正则表达式php函数库 ABNF to REGEX
  • php正则验证邮箱的函数
  • php利用正则表达式取出图片的URL
  • 一个正则的写法 php
  • php正则表达式转义字符的例子
  • PHP正则匹配图片并给图片加链接详解
  • php 正则 不包含某字符串的正则表达式
  • php password密码验证正则表达式(8位长度限制)
  • php正则表达式中的非贪婪模式匹配
  • PHP下ereg实现匹配ip的正则
  • php 手机号码验证正则表达式
  • PHP过滤★等特殊符号的正则
  • php正则表达式验证手机电话
  • PHP 正则表达式验证中文的问题
  • php正则过滤特殊字符的方法
  • php正则之函数 preg_replace()参数说明
  • php+正则将字符串中的字母数字和中文分割
  • php正则表达式匹配img中任意属性的方法
  • PHP把空格、换行符、中文逗号等替换成英文逗号的正则表达式
  • PHP匹配多行的正则表达式分析
  • 学习php中的正则表达式
  • PHP 正则表达式后面接的/isU, /is, /s含义
  • php下常用表单验证的正则表达式
  • php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符串
  • PHP中的递归正则表达式用法分享
  • PHP和javascript常用正则表达式及用法实例
  • 修改月光博客网站中PHP常用正则表达式中出现的错误
  • PHP 正则表达式特殊字符 [:alnum:] [:alpha:] 等
  • PHP正则表达式基本函数 修饰符 元字符和需转义字符说明
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • PHP 正则表达式函数库(两套)
  • [php]正则表达式的五个成功习惯
  • php 正则表达式学习笔记
  • CFC4N小试php正则表达式
  • PHP 正则表达式 推荐
  • php半小时精通正则表达式
  • PHP 正则表达式常用函数使用小结
  • PHP常用正则表达式集锦
  • php使用curl和正则表达式抓取网页数据示例
  • php中正则表达式中的特殊符号
  • php正则表达式的基本语法总结
  • PHP正则表达式的逆向引用与子模式分析
  • PHP和正则表达式教程集合之一第1/2页
  • php的正则表达式完全手册
  • 最常用的PHP正则表达式收集整理
  • PHP和正则表达式教程集合之二第1/2页
  • 修改配置真正解决php文件上传大小限制问题(nginx+php)
  • IIS7配置PHP图解(IIS7+PHP_5.2.17/PHP_5.3.5)
  • PHP 5.4.19 和 PHP 5.5.3 发布及下载地址
  • php输入流php://input使用示例(php发送图片流到服务器)
  • 修改配置真正解决php文件上传大小限制问题(apache+php)
  • PHP转换器 HipHop for PHP
  • PHP去除html标签,php标记及css样式代码参考
  • PHP 框架 Pop php
  • PHP 'ext/soap/php_xml.c'不完整修复存在多个任意文件泄露漏洞
  • PHP的JavaScript框架 PHP.JS
  • php通过socket_bind()设置IP地址代码示例
  • php服务器探针显示php服务器信息
  • php安装完成后如何添加mysql扩展
  • PHP缓存加速器 Alternative PHP Cache (APC)
  • IIS7配置PHP图解(IIS7+PHP_5.2.17/PHP_5.3.5) iis7站长之家


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3