今天用python解析xml文件,出现异常信息如下:
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 13, column 31
解决方式:
将文件重新编码成utf-8格式就可以了。
在linux下一种取巧的解决方式:
对于中文,这里选了一种取巧的方法。即先通过iconv命令将xml文件变成utf-8格式,然后将xml中指定编码格式的内容去掉即可。
可参考如下代码:
cmd = "iconv " + filename + " -t \"utf-8\" >utf.tmp"
os.system(cmd)
utf_filename = "utf.tmp"
f = open(utf_filename)
data = f.read()
f.close()
os.system("rm -f utf.tmp")
#----delete the encode type in xml file-----
#result = re.sub(regex, newstring, subject)
data = data.replace('encoding="GB2312"', '')
data = data.replace('encoding="gb2312"', '')
#self.dom.unlink
self.dom = xml.dom.minidom.parseString( data )
- 浏览: 402316 次
- 性别:
- 来自: 北京
最新评论
-
hopana:
不用下插件,用JSON.stringify(cmd)就可以了
spring mvc 接收前台传来的json对象(转) -
libankling:
很好很强大,谢谢分享
jquery datatables api (转) -
liuweihug:
推荐这个博客看看。Jquery DataTable基于Twit ...
jquery datatables api (转) -
岛田无涯:
不错,下次试试
MinGW -
javaeye官理员:
import sys, tracebacktry: f ...
python 异常处理
相关推荐
在Python中解析XML文件是一种常见的需求,特别是在处理配置文件、数据交换格式以及其他需要结构化数据的应用场景中。本文将详细介绍如何使用两种流行的方法——`MiniDom`和`ElementTree`来解析XML文件。 #### 1. ...
使用`lxml`库中的`etree`模块来解析XML文件。首先,打开XML文件并将其解析为ElementTree对象。 ```python from lxml import etree def parse_xml(file_path): tree = etree.parse(file_path) root = tree....
首先,我们来了解如何使用ElementTree解析XML。ElementTree库包含两个主要部分:`xml.etree.ElementTree` 和 `xml.etree.cElementTree`。前者是纯Python实现,后者是优化过的C版本,速度更快。基本的使用流程如下: ...
本文将介绍深入解读利用Python语言解析XML文件的几种方式,并以笔者推荐使用的ElementTree模块为例,演示具体使用方法和场景。文中所使用的Python版本为2.7。XML是可扩展标记语言(ExtensibleMarkupLanguage)的缩写...
本教程将详细讲解如何使用Python解析XML文件,并进行添加、删除和查找操作。 首先,Python提供了几个库来处理XML,其中最常用的是`xml.etree.ElementTree`。这个模块提供了树形结构来表示XML文档,使得处理XML变得...
通过`ET.fromstring()`函数可以解析XML字符串,得到一个Element对象树,然后可以使用方法如`.find()`, `.findall()`, `.text`等来查询和操作元素。 现在,让我们深入探讨这个自动化XML解析类的实现。该类可能是通过...
.Python解析XML.docx
.Python解析XML.pdf
这篇文章主要介绍了用Python解析XML的几种常见方法,包括快速的使用ElementTree模块等方法的实例介绍,需要的朋友可以参考下 一、简介 XML(eXtensible Markup Language)指可扩展标记语言,被设计用来传输和存储数据...
### Python 解析、更新与写入 XML 文件 #### 概述 XML(可扩展标记语言)是一种用于存储和传输数据的格式,它以其强大的结构化数据表示能力而在各种应用中广泛使用。Python 提供了几种处理 XML 的库,其中 `xml.dom...
本压缩包包含一个xml样例文件和一个python原程序,实现了python 解析xml树形信息后,自动填充到 QTreeWidget 的每一个 QTreeWidgetItem 上,从而不用QtreeView的model模型,自动适应自定义树(Tree)形结构信息的...
python处理xml很实用好用的工具 主要有BeautifulSoup和BeautifulStoneSoup,import就好,前者处理html,后者处理xml 具体使用方法可以上网查
Python提供了几个库来解析XML,其中最常用的是`xml.dom`模块,特别是`minidom`子模块。本文将深入探讨如何使用`xml.dom.minidom`解析XML文件,并提供一个具体的实例代码。 `xml.dom.minidom`是Python中的一个DOM...
python解析xml,字符串替换,正则表达式,可以参考
在提供的`python使用elementtree模块解析xml.txt`文档中,应包含了使用`ElementTree`解析XML的详细代码示例。通过学习这些代码,你可以理解如何根据实际需求处理XML数据。实践中,可能涉及更复杂的操作,如处理命名...
关于 XML,要记住一个总体概念:可以验证或非验证方式处理 XML 文档。 Python 中的 XML 工具可以分为两类:验证型和非验证型。验证型工具可以验证 XML 文档的语法规则,而非验证型工具则不进行验证。非验证型工具...
使用`xml.etree.ElementTree`库,可以轻松地解析XML文件。例如: ```python import xml.etree.ElementTree as ET tree = ET.parse('example.xml') root = tree.getroot() for child in root: print(child....
本文实例讲述了python解析xml文件的方法。分享给大家供大家参考。具体如下: python解析xml非常方便。在dive into python中也有讲解。 如果xml的结构如下: <?xml version="1.0" encoding="utf-8"?> ...