`
bluecrystal
  • 浏览: 267888 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

python小例子之3 -- 解析xml文本

阅读更多
        主题: 解析xml文本
        环境: winxp pro + sp2 + python2.5
        备注: 请注意,凡是在源代码文件中使用了中文字符,请最好保存为utf-8格式
                     测试用例sample.xml也请用utf-8格式保存
        代码:
       
python 代码
 
  1. # parsexml.py  
  2. # 本例子参考自python联机文档,做了适当改动和添加  
  3.   
  4. import xml.parsers.expat  
  5.   
  6. # 控制打印缩进  
  7. level = 0  
  8.   
  9. # 获取某节点名称及属性值集合  
  10. def start_element(name, attrs):  
  11.     global level  
  12.     print '  '*level, 'Start element:', name, attrs  
  13.     level = level + 1  
  14.   
  15. # 获取某节点结束名称  
  16. def end_element(name):  
  17.     global level  
  18.     level = level - 1  
  19.     print '  '*level, 'End element:', name  
  20.       
  21. # 获取某节点中间的值  
  22. def char_data(data):  
  23.     if(data == '\n'):  
  24.         return  
  25.     if(data.isspace()):  
  26.         return  
  27.     global level  
  28.     print '  '*level, 'Character data:', data  
  29.   
  30. p = xml.parsers.expat.ParserCreate()  
  31.   
  32. p.StartElementHandler = start_element  
  33. p.EndElementHandler = end_element  
  34. p.CharacterDataHandler = char_data  
  35. p.returns_unicode = False  
  36.   
  37. f = file('sample.xml')  
  38. p.ParseFile(f)  
  39. f.close()  

        测试用例:
xml 代码:sample.xml
 
  1. xml version="1.0"?>  
  2. <contacts id="bluecrystal">  
  3. <item name="keen" fff="ddd">  
  4.     <telephone type="phone">222222222<!---->telephone>  
  5.     <telephone type="mobile">134567890<!---->telephone>  
  6. <!---->item>  
  7. <item name="bcm">  
  8.     <telephone type="phone">11111111<!---->telephone>  
  9.     <telephone type="mobile">15909878909<!---->telephone>  
  10. <!---->item>  
  11. <!---->contacts>  
       
        测试结果:
  1. Start element: contacts {'id': 'bluecrystal'}  
  2.   Start element: item {'fff': 'ddd', 'name': 'keen'}  
  3.     Start element: telephone {'type': 'phone'}  
  4.       Character data: 222222222  
  5.     End element: telephone  
  6.     Start element: telephone {'type': 'mobile'}  
  7.       Character data: 134567890  
  8.     End element: telephone  
  9.   End element: item  
  10.   Start element: item {'name': 'bcm'}  
  11.     Start element: telephone {'type': 'phone'}  
  12.       Character data: 11111111  
  13.     End element: telephone  
  14.     Start element: telephone {'type': 'mobile'}  
  15.       Character data: 15909878909  
  16.     End element: telephone  
  17.   End element: item  
  18. End element: contacts  

       
分享到:
评论

相关推荐

    基于Python实现的自动化生成XML解析类

    通过`ET.fromstring()`函数可以解析XML字符串,得到一个Element对象树,然后可以使用方法如`.find()`, `.findall()`, `.text`等来查询和操作元素。 现在,让我们深入探讨这个自动化XML解析类的实现。该类可能是通过...

    python教程-node-05-文本搜索命令.ev4.rar

    4. **文本处理库**:Python有众多库支持高级文本处理,如`nltk`(自然语言工具包)用于自然语言处理,`BeautifulSoup`或`lxml`用于HTML和XML文档解析。 5. **循环和条件语句**:在遍历文本和执行搜索操作时,`for`...

    Python-luthor简单的库来解析XML

    通过这种方式,我们可以轻松地解析XML文档并提取所需信息。 `luthor`库还支持XML命名空间的处理,这对于处理包含多个命名空间的复杂XML文档来说是非常有用的。此外,它还提供了处理XML注释、处理字符数据(CDATA)...

    xml的解析例子

    # 解析XML数据 with open('TestXml.xml', 'r') as file: parser.parse(file) ``` 在`TestXml.py`中,可能包含类似上述的DOM或SAX解析代码,用于处理XML数据。需要注意的是,实际应用中,可能还需要处理命名空间、...

    xml.rar_xml_xml 转 富文本_读取xml_读取解析XML

    本文将深入探讨如何将XML转换为富文本,以及如何读取和解析XML文件。 首先,XML文件是一种结构化数据的表示方式,通过自定义的标签来描述数据的结构和内容。例如: ```xml &lt;title lang="en"&gt;Harry Potter ...

    xml简单解析例子

    解析XML有两种主要方式:DOM(Document Object Model)和SAX(Simple API for XML)。 1. DOM解析:这是一种将整个XML文档加载到内存中并形成一棵树状结构的方法。每个节点代表XML文档的一部分,可以随时访问和修改...

    Python网络编程基础--源码

    《Foundations of Python Network Programming》这本书是Python网络编程的经典之作,包含了许多实用的例子和深入的解释。DJVU格式的电子书可能包含了完整的书籍内容,包括理论介绍、实例分析以及相关的编程练习。...

    Python读写XML文件实例

    在`read_xml.py`中,我们将学习如何读取和解析XML文件。以下是一个基本的读取示例: ```python import xml.etree.ElementTree as ET # 解析XML文件 tree = ET.parse("input.xml") root = tree.getroot() # 遍历...

    python爬虫数据可视化-05-定义别名.ev4.rar

    Python的数据可视化库,如Matplotlib、Seaborn、Plotly和Pandas自身提供的绘图功能,可以帮助我们把爬取到的数字、文本或时间序列数据转化为直观的图表。定义别名在这里同样重要,尤其是在处理多列数据时,将列名...

    c解析xml报文最精简的

    C语言虽然不像Python或Java那样内置了强大的XML处理库,但依然可以通过一些第三方库来解析XML报文。本篇文章将深入探讨如何在C语言中实现XML报文的最精简解析方法。 首先,我们需要了解XML的基本结构。XML文档由...

    Dive.Into.Python-zh-cn-5.4-with-code

    7. **XML处理**:Python提供了处理XML的库,如`ElementTree`,书中会讲解如何解析和创建XML文档,这对于处理结构化数据很有帮助。 8. **数据库编程**:Python与数据库的交互通常通过数据库API实现,如`sqlite3`库,...

    python轻量级爬虫-百科例子

    Python轻量级爬虫是针对网页数据抓取的一种简单易用的方法,尤其适合初学者入门。在Python中,有许多库可以用来构建轻量级爬虫,如BeautifulSoup、Scrapy等。本文将深入探讨这些库及其在构建百科类网站爬虫时的应用...

    使用Python类似pandas的方式读取xml文件的例子_pandas读取数据库

    其中,`parse()`函数解析XML文件并返回一个ElementTree对象,`getroot()`方法返回XML文档的根元素。 3. **创建数据结构**: 我们需要定义一个函数,将XML元素转换为字典,以便于pandas处理。 ```python def xml...

    Python爬虫-简单例子介绍-参考价值不大,需要的下.docx

    这个例子虽然可能不全面,但对于初学者来说,它提供了一个基本的Python爬虫流程,包括请求网页、解析HTML、提取数据和存储数据的完整过程。读者可以通过这个例子了解爬虫的基本工作原理,并根据自己的需求进行扩展和...

    详细解读Python中解析XML数据的方法

    ### Python中解析XML数据的方法详解 #### 一、引言 在现代软件开发中,XML(可扩展标记语言)作为一种标准的数据交换格式被广泛应用。Python作为一款强大的编程语言,提供了多种处理XML数据的方式。本文将重点介绍...

    python_-re.rar_python_python xml

    在这个例子中,我们解析了XML字符串,并遍历每个`item`元素,获取其`id`属性和`name`子元素的文本。 综上所述,Python结合`re`模块的正则表达式功能可以高效地处理字符串,而`xml.etree.ElementTree`则提供了强大的...

    python 100个小例子.rar_luck3eo_python_python小程序_python练手_suddenzuv

    "python 100个小例子.rar" 是一个压缩包,包含了100个Python编程的小练习,旨在帮助初学者深入理解和掌握Python语言的核心概念。这个资源由用户luck3eo分享,并被标签为"python小程序"和"python练手",表明它非常...

Global site tag (gtag.js) - Google Analytics