`

Python操作XML和TXT

 
阅读更多

Python代码:

# -*- coding: UTF-8 -*-
'''
Created on 2016年3月20日

@author: Administrator
'''
from xml.dom import minidom
import os

def listFiles(path):
    return os.listdir(path)    
    
    
def readXML(xmlPath):
    
    # 加载读取XML文件
    doc = minidom.parse(xmlPath)
      
    # 获取XML文档对象
    root = doc.documentElement
    bookList = root.getElementsByTagName("bookList")[0]
      
    # 获取book节点列表
    bookNodeList = bookList.getElementsByTagName("book")
      
      
    # 节点操作
    for node in bookNodeList: 
#         #读取节点属性为“id”的值
#         book_id = node.getAttribute("id")
        # 读取节点属性为“name”的值
        book_name = node.getAttribute("name")
        
        
        if book_name not in attributeValueList:
            
            attributeValueList.append(book_name)
#         books["id"]=book_id
#         books["name"]=book_name
         
        # 读取节点的文本内容。
#         value=node.childNodes[0].nodeValue
#         valueList["value"]=value


def compareXML(xmlPath):
    
    for tfile in listFiles(xmlPath):
        readXML(xmlPath + os.path.join(tfile))
        
def printList(tlist):
    for tl in tlist:
        print tl

def writeTxt(txtPath, argList):
#     if os.path.exists(txtPath):
#         os.remove(txtPath)
    f = open(txtPath, "w")
    for arg in sorted(argList):
        f.write(arg + "\n")
    f.close()

if __name__ == '__main__':
    
    attributeValueList = []
    
#     valueList={}
#     
#     books={}
    
#     flag=False
    
    xmlPath = "D:\\test\\"
    txtPath = "D:\\out\\out_file.txt"
    
    compareXML(xmlPath)
    
    printList(attributeValueList)
    
    writeTxt(txtPath,attributeValueList)
        
     

    
        
    
    

 

test.xml:

<?xml version="1.0" encoding="UTF-8"?>
<mybook id="mb001">
	<bookList>
		<book name="bookA" id="A">AAA</book>
		<book name="bookB" id="B">BBB</book>
		<book name="bookD" id="D">DDD</book>
		<book name="bookE" id="E">EEE</book>
	</bookList>
	<bc>
		<bookList>
			<book name="bcbookA" id="A">AAA</book>
			<book name="bcbookB" id="B">BBB</book>
		</bookList>
	</bc>
</mybook>

 

test2.xml

<?xml version="1.0" encoding="UTF-8"?>
<mybook id="mb001">
	<bookList>
		<book name="bookA" id="A">AAA</book>
		<book name="bookB" id="B">BBB</book>
		<book name="bookC" id="C">CCC</book>
	</bookList>
	<bc>
		<bookList>
			<book name="bcbookA" id="A">AAA</book>
			<book name="bcbookB" id="B">BBB</book>
		</bookList>
	</bc>
	<bcc>
		<bookList>
			<book name="bcbookA" id="A">AAA</book>
			<book name="bcbookB" id="B">BBB</book>
		</bookList>
	</bcc>
</mybook>

 

 

 

 

 

 

分享到:
评论

相关推荐

    tools_python;xml;mat文件_

    - 文件I/O:`convert_txt_mat.py`涉及到读取txt文件并将其数据保存到mat文件中,这需要用到Python内置的文件操作函数,如`open()`用于打开文件,`read()`或`readlines()`用于读取文件内容,`write()`用于写入数据。...

    python代码xml转txt实例

    1. **读取XML文件**:使用Python的`xml.etree.ElementTree`库来解析XML文件。 2. **提取关键信息**:遍历XML文档中的各个元素,提取出我们需要的信息,例如图像路径、对象名称、边界框坐标等。 3. **组织数据**:...

    python_elementt_xml.zip_python xml_xml解析 python

    在Python编程语言中,XML(eXtensible Markup Language)是一种常见的数据交换格式,用于存储结构化数据。...但基本的XML解析和操作都可以通过`ElementTree`模块完成,它是Python处理XML的一个强大工具。

    python xml命名空间

    本文将详细介绍Python中如何处理XML命名空间,包括理解命名空间的基本概念、如何定义和使用命名空间前缀以及如何在Python代码中操作带有命名空间的XML文档。 #### 一、命名空间简介 命名空间是XML文档中用来区分...

    python偷菜程序 python生成XML文件

    ### Python生成XML文件与字符编码理解 #### 一、Python生成XML文件 在现代Web开发中,XML(可扩展标记语言)是一种非常重要的数据交换格式。它被广泛应用于配置文件、数据传输等领域。使用Python来生成XML文件可以...

    python脚本,将labelImg标注完的txt文件转换为voc格式的xml文件(跟yolov3格式完全一样)

    只需要将python代码中包含图片的路径、包含txt的路径、所需要的类别名、需要生成xml文件的路径、临时存储的路径写入即可运行

    python脚本用于xml解析的源代码

    这些文件可能定义了函数或类,用于读取XML文件,遍历XML树,以及提取特定的元素或属性。例如,一个常见的做法是使用`ElementTree`库的`parse()`函数加载XML文件,然后通过`getroot()`方法获取根元素。之后,可以递归...

    python读取各种文件数据方法解析

    此函数读取XML文件中的多个节点,并将数据提取到不同的列表中。 **调用示例**: ```python a, b, c, d = read_xml() print(a) print(b) print(c) print(d) ``` #### 3. 读取 Excel 文件数据,并将其存入列表中 ...

    xml,TXT文件操作大全

    - **读取XML文件**:读取XML文件通常涉及解析文件并访问其元素和属性。解析后,可以通过XPath或XQuery来查询和提取数据。 - **修改XML文件**:XML文件的修改可能包括添加、删除或更新元素。这需要先解析文件,然后...

    txt数据转换为xml数据的小工具

    5. **文件I/O操作**:熟悉如何在程序中读取txt文件和写入xml文件。 6. **数据处理**:可能涉及到数据清洗、异常处理和格式转换等步骤,确保转换后的XML数据准确无误。 7. **调试和测试**:在修改代码后,需要进行...

    txt2xml-根据txt文件信息转换成xml文件

    样例文件通常包含一个或多个示例`.txt`文件和对应的期望输出XML文件,这对于测试和理解转换过程非常有用。开发者可以对比输入和输出,检查转换逻辑是否准确无误。这也可以帮助新用户快速了解工具的使用方法和预期...

    txt2xml_python_

    综上所述,这个名为"txt2xml.py"的Python脚本提供了从TXT到XML的转换功能,涉及到了文件操作、字符串解析、XML生成等多个Python编程的基础和进阶知识点。对于进行NLP研究或开发的人来说,掌握这些技能是非常有价值的...

    PYTHON读取文件测试

    在这个学习案例中,你将学会如何在Python中读取TXT文件,以及如何对文件内容进行基本的解析和处理。这只是一个起点,随着你对Python的深入学习,你将能够处理更复杂的文件格式和数据结构,例如JSON、XML、CSV等,...

    Python 读取通信达股票数据

    在Python编程环境中,读取和处理股票数据是数据分析和金融投资领域常见的任务。通信达(Tonghua Data)是一家提供股票市场数据的公司,其数据通常以特定的格式存储,如CSV、TXT或数据库文件。在本场景中,我们关注的...

    番茄小说txt免费下载python永久更新

    在Python中,实现这样的功能通常涉及到网络请求、数据解析和文件操作等技术。以下是一些相关的知识点: 1. **网络请求库**:Python中有许多库可以用来发送HTTP请求,如`requests`库是最常用的一个。通过它,我们...

    已经标记好的深度学习车辆类型数据集,xml和txt两种格式,1543张图片,共三个类别

    你可以使用Python的开源库,如OpenCV和Pandas来读取和处理XML和TXT标签,然后利用TensorFlow、PyTorch等深度学习框架构建和训练模型。在训练过程中,可能需要进行数据增强,如随机旋转、裁剪和颜色变换,以增加模型...

    手机中导出NV存储为XML,XML转TXT格式

    在这个场景中,我们关注的是XML(Extensible Markup Language)和TXT(纯文本)两种格式。XML是一种结构化数据表示语言,常用于存储和传输数据,而TXT文件则简单、通用,只包含纯文本,不包含任何格式或结构信息。...

    PB 读取XML文件 实例

    "说明.txt"可能包含了额外的操作指南或注意事项,而"1.xml"则是一个实际的XML文件,用于读取和操作的实例。 总之,PB 12.5通过PBDOM库为开发者提供了强大的XML处理能力,使得在PB应用中处理XML数据变得更加简单和...

    TXT转化XML

    4. **生成XML文件**:使用编程语言(如Python、Java或C#)编写脚本或利用现成的转换工具(如Apache POI、libxml2等),将解析和映射后的数据写入到符合XSD的XML文件中。 5. **验证和调试**:生成XML后,通过XSD进行...

Global site tag (gtag.js) - Google Analytics