'); (window.slotbydup = window.slotbydup || []).push({ id: "u4635961", container: s }); })(); 多条广告如下脚本只需引入一次 -- ----------------- baidu ad end --------------------->
当前位置:  编程技术>python

python操作xml文件示例

    来源: 互联网  发布时间:2014-10-04

    本文导语:  代码如下:def get_seed_data(filename):dom = minidom.parse(filename)root = dom.documentElementsystem_nodes = root.getElementsByTagName("system")k = 0seed_list = []for system_node in system_nodes:    #print system_node.nodeName+' id='+system_node.getAttribute('id')    system_id = system_no...

代码如下:

def get_seed_data(filename):
dom = minidom.parse(filename)
root = dom.documentElement
system_nodes = root.getElementsByTagName("system")
k = 0
seed_list = []
for system_node in system_nodes:
    #print system_node.nodeName+' id='+system_node.getAttribute('id')
    system_id = system_node.getAttribute("id")
    system_name = system_node.getAttribute("name")
    #print 'system_name:%s'%system_name
    section_nodes = system_node.getElementsByTagName("section")
    for section_node in section_nodes:
            section_id = section_node.getAttribute('id')
            section_name = section_node.getAttribute('name')
            #print ' '+section_node.nodeName+' id='+section_id+' name='+section_name
            crawl_cycle_node = section_node.getElementsByTagName("crawl_cycle")
            crawl_cycle = crawl_cycle_node[0].childNodes[0].nodeValue
            #print '  '+crawl_cycle_node[0].nodeName+'='+crawl_cycle
            seed_nodes = section_node.getElementsByTagName('seed')
            for seed_node in seed_nodes:
                seed = {}
                seed['crawl_cycle'] = crawl_cycle
                seed['system_id'] = int(system_id)
                seed['system_name'] = system_name
                seed['section_id'] = int(section_id)
                seed['section_name'] = section_name
                seed_id = seed_node.getAttribute('id')
                seed['seed_id'] = int(seed_id)
                #print '  '+seed_node.nodeName+' '+'id='+seed_id
                userblog_url_node = seed_node.getElementsByTagName('userblog_url')
                userblog_url = userblog_url_node[0].childNodes[0].nodeValue
                seed['userblog_url'] = userblog_url
                #print '   '+'userblog_url'+' '+userblog_url
                print '-------------------------------------------'
                print 'system_id:%d' % seed['system_id']
                print 'system_name:%s'%seed['system_name']
                print ' section_id:%d' % seed['section_id']
                print ' section_name:%s' % seed['section_name']
                print '  seed_id:%d' %seed['seed_id']
                print '  userblog_url:%s' %seed['userblog_url']
                print '========================='
                seed_list.append(seed)
                print seed_list[k]
                k += 1
                os.system('pause')
return seed_list

代码如下:



 
  
   
   
    http://aaa.com.cn/loveissuuny
   
   
    http://aaa.com.cn/loveissuuny
   
   
    http://aaa.com.cn/sanxiazaixian
   
  
  
   
   
    http://aaa.com.cn/twocold
   
   
    http://aaa.com.cn/u/1233526741
   
  
 


    
 
 

您可能感兴趣的文章:

  • Python获取网页编码的方法及示例代码
  • python读取csv文件示例(python操作csv)
  • python下xml解析库lxml最新版下载安装以及代码示例
  • python基础教程之python消息摘要算法使用示例
  • 数据结构:图(有向图,无向图),在Python中的表示和实现代码示例
  • python实现绘制树枝简单示例
  • 使用python删除nginx缓存文件示例(python文件操作)
  • python学习手册中的python多态示例代码
  • python调用windows api锁定计算机示例
  • python代码制作configure文件示例
  • python使用循环实现批量创建文件夹示例
  • python采用requests库模拟登录和抓取数据的简单示例
  • Python数组条件过滤filter函数使用示例
  • python获得图片base64编码示例
  • Python的print用法示例
  • python文件读写并使用mysql批量插入示例分享(python操作mysql)
  • Python pass 语句使用示例
  • python getopt 参数处理小示例
  • python的urllib模块显示下载进度示例
  • python list转dict示例分享
  • python求素数示例分享
  • 在Python3中使用urllib实现http的get和post提交数据操作
  • Python文件操作类操作实例详解
  • python字符串格式化输出及相关操作代码举例
  • python 布尔操作实现代码
  • python读文件,写文件操作以及目录操作
  • python 操作postgresql的pgdb库的问题
  • python赋值操作方法分享
  • python读写文件操作示例程序
  • Python 调用DLL操作抄表机
  • Python操作json数据的一个简单例子
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • python异常信息堆栈输出到日志文件
  • 用python代码做configure文件
  • python遍历文件夹并删除特定格式文件的示例
  • Python引用(import)文件夹下的py文件的方法
  • python安装问题,rpm命令显是缺少库文件
  • python 改文件名等问题
  • python 获取文件列表(或是目录例表)
  • Python批量修改文件后缀的方法
  • Python生成pdf文件的方法
  • python使用os模块的os.walk遍历文件夹示例
  • python逐行读取文件内容的三种方法
  • 用python分割TXT文件成4K的TXT文件
  • python 查找文件夹下所有文件 实现代码
  • Python MD5文件生成码
  • 用python实现的去除win下文本文件头部BOM的代码
  • Python获取远程文件大小的函数代码分享
  • python解析xml文件实例分享
  • python读写ini文件示例(python读写文件)
  • python练习程序批量修改文件名
  • 使用python装饰器验证配置文件示例
  • python调用Moxa PCOMM Lite通过串口Ymodem协议实现发送文件
  • Python GUI编程:tkinter实现一个窗口并居中代码
  • 让python同时兼容python2和python3的8个技巧分享
  • Python不使用print而直接输出二进制字符串
  • 使用setup.py安装python包和卸载python包的方法
  • Python中实现json字符串和dict类型的互转
  • 不小心把linux自带的python卸载了,导致安装一个依赖原python的软件不能安装,请问该怎么办?
  • python下用os.execl执行centos下的系统时间同步命令ntpdate
  • Python生成pdf文件的方法 iis7站长之家
  • Python namedtuple对象json序列化/反序列化及对象恢复
  • 新手该如何学python怎么学好python?


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3