`
天梯梦
  • 浏览: 13731714 次
  • 性别: Icon_minigender_2
  • 来自: 洛杉矶
社区版块
存档分类
最新评论

Python实例讲解 -- 解析xml

阅读更多

doc.xml

 

<?xml version="1.0" encoding="utf-8"?>
<info>
   <intro>信息</intro>
    <list id='001'>
        <head>auto_userone</head>
        <name>Jordy</name>
        <number>12345678</number>
        <age>20</age>
        <sex>Man</sex>
        <hobby>看电影</hobby>
    </list>

   <list id='002'>
        <head>auto_usertwo</head>
        <name>tester</name>
         <number>34443678</number>
         <age>18</age>
         <sex>Man</sex>
         <hobby>玩游戏</hobby>
     </list>

</info>
 

main.py

 

# -*- coding: utf-8 -*-

import xml.etree.ElementTree as et

#读取xml文件
def load_xml_file(fileName):
    root = et.parse(fileName).getroot()

    #获取文件描述
    intro = root.find('intro').text.encode('gb2312')
    print intro

    #获取所有list节点
    all_users = root.findall('list')
    #遍历list节点的子元素
    for user in all_users:
        #得到head节点的文本
        head = user.find('head').text
        #得到name节点的文本
        name = user.find('name').text
        #得到sex节点的文本
        sex = user.find('sex').text
        #得到age节点的文本
        age = user[3].text
        #得到hobby节点的文本
        hobby = user.find('hobby').text.encode('gb2312')
        print head,name,sex,hobby,age

if __name__ == '__main__':

    load_xml_file('doc.xml')
 

 

 

 

 

分享到:
评论
2 楼 天梯梦 2011-02-21  
lxml 只是听说过,没有实际用过,我刚学不久,谢谢您的建议,我会研究一下的,以备日后~  呵呵
1 楼 greatghoul 2011-02-21  
ElementTree  还是很方便的,不过就是对xpath的支持有点弱,解析点简单的东西,我都喜欢用这个,不过对于一些复杂的,主用lxml了。

相关推荐

    Jones, Drake -- Python and XML -- 2002.pdf

    - **解析XML文档**:介绍如何使用Python内置的解析器(如`ElementTree`)或第三方库来读取和解析XML文件。 - **生成XML文档**:教授如何利用Python创建新的XML文档,包括设置文档结构、添加元素和属性等。 - **修改...

    dive_into_python_zh-cn-5.4b

    5. **文件与I/O操作**:Python提供了强大的文件操作能力,包括读写文件、处理文件对象、序列化等,这些内容在书中都有详尽的实例解析。 6. **网络编程**:Python可以用于网络编程,如HTTP请求、套接字编程等,书中...

    Python源码实例-查票抢票.zip

    在本压缩包“Python源码实例-查票抢票.zip”中,主要包含了一个Python编程的实战案例,涉及到了多个IT领域的技术知识点。这个实例主要是关于如何利用Python进行自动化网络爬虫来查询和抢购车票,这在数据分析、自动...

    diveintopython-cn-5.4b

    9. **XML处理**:XML是一种常用的数据交换格式,Python提供了xml模块来解析和生成XML文档。书中将涵盖XML的基本操作,如读取、写入、查找和修改XML节点。 通过《Python深度探索》,读者不仅能全面了解Python的基础...

    Dive.Into.Python-zh-cn-5.4-with-code

    7. **XML处理**:Python提供了处理XML的库,如`ElementTree`,书中会讲解如何解析和创建XML文档,这对于处理结构化数据很有帮助。 8. **数据库编程**:Python与数据库的交互通常通过数据库API实现,如`sqlite3`库,...

    python解析xml文件实例分析

    本文实例讲述了python解析xml文件的方法。分享给大家供大家参考。具体如下: python解析xml非常方便。在dive into python中也有讲解。 如果xml的结构如下: &lt;?xml version="1.0" encoding="utf-8"?&gt; ...

    beginning-python-3ed-master_python教程_python教程_

    - 网络爬虫:利用Python抓取网页数据,解析HTML和XML文档,例如使用BeautifulSoup库。 - 数据分析:结合Pandas进行数据清洗、转换和统计分析。 - Web开发:使用Flask或Django框架构建Web应用。 - 自动化脚本:...

    python解析xml文件增删查找

    本教程将详细讲解如何使用Python解析XML文件,并进行添加、删除和查找操作。 首先,Python提供了几个库来处理XML,其中最常用的是`xml.etree.ElementTree`。这个模块提供了树形结构来表示XML文档,使得处理XML变得...

    Python爬虫实例讲解

    本实例将深入讲解Python爬虫的基本概念、常用库和实战技巧,旨在帮助初学者快速入门并能够实际操作。 首先,Python爬虫的基础是HTTP/HTTPS协议,这是互联网上数据交换的主要方式。了解HTTP请求方法(如GET和POST)...

    未来战士--XML网络编程实例

    本教程还会涉及XML与Java、Python等编程语言的集成,讲解如何在这些语言中创建和解析XML文档。例如,Java的JAXB库可以自动将对象序列化为XML,反之亦然,简化了开发流程。 最后,我们将探讨XML在网络编程中的安全性...

    Beginning Python Using Python 2.6 and Python 3.1 - 2010.pdf

    - **解析XML**:讲解如何使用Python的xml.etree.ElementTree模块解析和操作XML文档。 #### 网络编程(Chapter 16) - **网络协议**:介绍TCP/IP协议族,以及HTTP、FTP等常见网络协议的工作原理。 - **socket编程**...

    python教程-node-05-文本搜索命令.ev4.rar

    4. **文本处理库**:Python有众多库支持高级文本处理,如`nltk`(自然语言工具包)用于自然语言处理,`BeautifulSoup`或`lxml`用于HTML和XML文档解析。 5. **循环和条件语句**:在遍历文本和执行搜索操作时,`for`...

    2001_Programming Web Services with XML-RPC

    列举了一些公共可用的XML-RPC服务实例,供开发者参考。 ##### 6.3 设计考虑 讨论了设计XML-RPC应用时需要注意的关键因素。 ##### 6.4 超越XML-RPC 展望了XML-RPC之外的其他Web服务技术及其发展方向。 ##### 6.5...

    python学习笔记-excel用例输入借鉴.pdf

    这篇学习笔记主要讲解了一个接口自动化测试框架V2.0的优化,该框架利用Python读取Excel文件中的测试用例,通过requests库发送HTTP请求到接口,并使用正则表达式对返回的响应信息进行验证。最终,测试结果会生成一个...

    完整版精品Python网络爬虫教程 数据采集 信息提取课程 06-实例1-中国大学排名爬虫(共26页).pptx

    然后,课程详细讲解了BeautifulSoup库的使用,这是用于解析HTML和XML文档的强大工具。通过BeautifulSoup,我们可以方便地查找、遍历和提取网页中的信息。例如,在中国大学排名爬虫实例中,我们需要用BeautifulSoup...

    深入Python中文版zh-cn-5

    Python的标准库是其强大之处,本书会详细介绍一些常用模块,如正则表达式、日期和时间处理、JSON和XML解析、网络通信、线程和进程等。同时,也会讲解如何利用第三方库,如NumPy、Pandas和Matplotlib进行科学计算和...

    《零基础:21天搞定Python分布爬虫》课件

    这个课程的课件很可能包含了上述各个部分的详细讲解,配合实例代码和练习,使初学者能够逐步掌握Python爬虫技术。对于希望提升自己爬虫技能的人来说,这是一个非常有价值的学习资源。通过21天的学习,你将能够独立...

    Beginning Python Using Python 2.6 and Python 3.1 - James W. Payne.pdf )

    讲解XML解析和生成技术,适用于处理结构化文档和网络通信协议。 #### 第16章:网络编程 涉及网络套接字编程,包括客户端与服务器端的通信、HTTP请求与响应处理,是构建网络服务和爬虫程序的基础。 #### 第17章:...

    《XML编程原理与实例教程》电子教案

    通过实际操作,你可以学会创建XML文档,使用DOM和SAX解析XML,以及如何利用XML进行数据交换和存储。此外,还将介绍XML与其他技术的结合,如XPath(XML路径语言)用于查找XML元素,XSLT(XML样式表转换语言)用于转换...

    VOC-XML标准格式制作

    - MATLAB提供了`xmlread`函数来解析XML文件,返回一个XML DOM(Document Object Model)对象。可以遍历DOM树,提取所需信息。 - `xmlwrite`函数则用于生成XML文件。提供一个XML DOM对象和文件名,即可将数据写入...

Global site tag (gtag.js) - Google Analytics