Python代码:
# -*- coding: UTF-8 -*- ''' Created on 2016年3月20日 @author: Administrator ''' from xml.dom import minidom import os def listFiles(path): return os.listdir(path) def readXML(xmlPath): # 加载读取XML文件 doc = minidom.parse(xmlPath) # 获取XML文档对象 root = doc.documentElement bookList = root.getElementsByTagName("bookList")[0] # 获取book节点列表 bookNodeList = bookList.getElementsByTagName("book") # 节点操作 for node in bookNodeList: # #读取节点属性为“id”的值 # book_id = node.getAttribute("id") # 读取节点属性为“name”的值 book_name = node.getAttribute("name") if book_name not in attributeValueList: attributeValueList.append(book_name) # books["id"]=book_id # books["name"]=book_name # 读取节点的文本内容。 # value=node.childNodes[0].nodeValue # valueList["value"]=value def compareXML(xmlPath): for tfile in listFiles(xmlPath): readXML(xmlPath + os.path.join(tfile)) def printList(tlist): for tl in tlist: print tl def writeTxt(txtPath, argList): # if os.path.exists(txtPath): # os.remove(txtPath) f = open(txtPath, "w") for arg in sorted(argList): f.write(arg + "\n") f.close() if __name__ == '__main__': attributeValueList = [] # valueList={} # # books={} # flag=False xmlPath = "D:\\test\\" txtPath = "D:\\out\\out_file.txt" compareXML(xmlPath) printList(attributeValueList) writeTxt(txtPath,attributeValueList)
test.xml:
<?xml version="1.0" encoding="UTF-8"?> <mybook id="mb001"> <bookList> <book name="bookA" id="A">AAA</book> <book name="bookB" id="B">BBB</book> <book name="bookD" id="D">DDD</book> <book name="bookE" id="E">EEE</book> </bookList> <bc> <bookList> <book name="bcbookA" id="A">AAA</book> <book name="bcbookB" id="B">BBB</book> </bookList> </bc> </mybook>
test2.xml
<?xml version="1.0" encoding="UTF-8"?> <mybook id="mb001"> <bookList> <book name="bookA" id="A">AAA</book> <book name="bookB" id="B">BBB</book> <book name="bookC" id="C">CCC</book> </bookList> <bc> <bookList> <book name="bcbookA" id="A">AAA</book> <book name="bcbookB" id="B">BBB</book> </bookList> </bc> <bcc> <bookList> <book name="bcbookA" id="A">AAA</book> <book name="bcbookB" id="B">BBB</book> </bookList> </bcc> </mybook>
相关推荐
Python操作XML文件的知识点主要包括了解XML文件的基本概念、掌握Python中处理XML文件的基本模块与方法、具体的实例解析以及对XML文件数据的读取、修改和保存等操作。 1. XML文件的基本概念:XML(Extensible Markup...
1. 读取XML文件:通过`ET.parse()`函数读取XML文件,使用`tree.getroot()`获取根节点。 2. 遍历XML元素:通过遍历根节点,可以打印出每个元素的标签和属性。 3. 添加元素:使用`ET.SubElement()`方法向XML中添加...
首先需要导入xml.etree.ElementTree库,这是Python操作XML数据的基础。利用ET.parse()方法可以加载XML文件,并通过getroot()方法获取XML文件的根节点。 对于节点的操作,主要包括获取节点信息、添加节点、修改节点...
- 文件I/O:`convert_txt_mat.py`涉及到读取txt文件并将其数据保存到mat文件中,这需要用到Python内置的文件操作函数,如`open()`用于打开文件,`read()`或`readlines()`用于读取文件内容,`write()`用于写入数据。...
在Python编程中,操作XML文件是一个常见的需求。XML(可扩展标记语言)作为一种灵活的数据存储方式,被广泛应用于网络数据传输...通过学习这些库的使用,你可以更加高效地利用Python来进行XML数据的读取、写入和处理。
1. **读取XML文件**:使用Python的`xml.etree.ElementTree`库来解析XML文件。 2. **提取关键信息**:遍历XML文档中的各个元素,提取出我们需要的信息,例如图像路径、对象名称、边界框坐标等。 3. **组织数据**:...
在Python编程语言中,XML(eXtensible Markup Language)是一种常见的数据交换格式,用于存储结构化数据。...但基本的XML解析和操作都可以通过`ElementTree`模块完成,它是Python处理XML的一个强大工具。
本文将详细介绍Python中如何处理XML命名空间,包括理解命名空间的基本概念、如何定义和使用命名空间前缀以及如何在Python代码中操作带有命名空间的XML文档。 #### 一、命名空间简介 命名空间是XML文档中用来区分...
Python中的lxml库是一个强大的工具,它让处理XML数据变得简单。首先,lxml库能够帮助我们解析XML文件,提取信息,并进行数据操作。XML(可扩展标记语言)广泛用于存储和传输数据,具有良好的跨平台性能和易于阅读的...
本文将介绍如何使用Python操作Excel文件,并涉及如何将XML格式的数据导入到Excel文件中,以及将Excel数据导出为XML格式。 在Python中操作Excel文件,常用的库包括xlrd、xlwt和openpyxl。xlrd库是专门用于读取Excel...
接下来,我会详细介绍如何使用Python操作空的XML文件。 首先,需要安装`xml.etree.ElementTree`库。实际上,由于它是Python的标准库,通常不需要单独安装,直接在Python环境中导入即可使用。但是,如果你使用的是较...
### Python生成XML文件与字符编码理解 #### 一、Python生成XML文件 在现代Web开发中,XML(可扩展标记语言)是一种非常重要的数据交换格式。它被广泛应用于配置文件、数据传输等领域。使用Python来生成XML文件可以...
此函数读取XML文件中的多个节点,并将数据提取到不同的列表中。 **调用示例**: ```python a, b, c, d = read_xml() print(a) print(b) print(c) print(d) ``` #### 3. 读取 Excel 文件数据,并将其存入列表中 ...
这些文件可能定义了函数或类,用于读取XML文件,遍历XML树,以及提取特定的元素或属性。例如,一个常见的做法是使用`ElementTree`库的`parse()`函数加载XML文件,然后通过`getroot()`方法获取根元素。之后,可以递归...
只需要将python代码中包含图片的路径、包含txt的路径、所需要的类别名、需要生成xml文件的路径、临时存储的路径写入即可运行
样例文件通常包含一个或多个示例`.txt`文件和对应的期望输出XML文件,这对于测试和理解转换过程非常有用。开发者可以对比输入和输出,检查转换逻辑是否准确无误。这也可以帮助新用户快速了解工具的使用方法和预期...
5. **文件I/O操作**:熟悉如何在程序中读取txt文件和写入xml文件。 6. **数据处理**:可能涉及到数据清洗、异常处理和格式转换等步骤,确保转换后的XML数据准确无误。 7. **调试和测试**:在修改代码后,需要进行...
- **读取XML文件**:读取XML文件通常涉及解析文件并访问其元素和属性。解析后,可以通过XPath或XQuery来查询和提取数据。 - **修改XML文件**:XML文件的修改可能包括添加、删除或更新元素。这需要先解析文件,然后...
综上所述,这个名为"txt2xml.py"的Python脚本提供了从TXT到XML的转换功能,涉及到了文件操作、字符串解析、XML生成等多个Python编程的基础和进阶知识点。对于进行NLP研究或开发的人来说,掌握这些技能是非常有价值的...
在这个学习案例中,你将学会如何在Python中读取TXT文件,以及如何对文件内容进行基本的解析和处理。这只是一个起点,随着你对Python的深入学习,你将能够处理更复杂的文件格式和数据结构,例如JSON、XML、CSV等,...