`
speedup
  • 浏览: 10498 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

python解析xml中文解决方式

阅读更多
今天用python解析xml文件,出现异常信息如下:
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 13, column 31
解决方式:
将文件重新编码成utf-8格式就可以了。

在linux下一种取巧的解决方式:
对于中文,这里选了一种取巧的方法。即先通过iconv命令将xml文件变成utf-8格式,然后将xml中指定编码格式的内容去掉即可。

可参考如下代码:
cmd = "iconv " + filename + " -t \"utf-8\" >utf.tmp"
os.system(cmd)
utf_filename = "utf.tmp"
f = open(utf_filename)
data = f.read()
f.close()
os.system("rm -f utf.tmp")
#----delete the encode type in  xml file-----
#result = re.sub(regex, newstring, subject)
data = data.replace('encoding="GB2312"', '')
data = data.replace('encoding="gb2312"', '')
#self.dom.unlink
self.dom = xml.dom.minidom.parseString( data )

分享到:
评论

相关推荐

    python解析xml文件

    在Python中解析XML文件是一种常见的需求,特别是在处理配置文件、数据交换格式以及其他需要结构化数据的应用场景中。本文将详细介绍如何使用两种流行的方法——`MiniDom`和`ElementTree`来解析XML文件。 #### 1. ...

    python解析xml

    首先,我们来了解如何使用ElementTree解析XML。ElementTree库包含两个主要部分:`xml.etree.ElementTree` 和 `xml.etree.cElementTree`。前者是纯Python实现,后者是优化过的C版本,速度更快。基本的使用流程如下: ...

    深入解读Python解析XML的几种方式

    本文将介绍深入解读利用Python语言解析XML文件的几种方式,并以笔者推荐使用的ElementTree模块为例,演示具体使用方法和场景。文中所使用的Python版本为2.7。XML是可扩展标记语言(ExtensibleMarkupLanguage)的缩写...

    python解析xml文件增删查找

    本教程将详细讲解如何使用Python解析XML文件,并进行添加、删除和查找操作。 首先,Python提供了几个库来处理XML,其中最常用的是`xml.etree.ElementTree`。这个模块提供了树形结构来表示XML文档,使得处理XML变得...

    python解析xml生成excel文档

    使用`lxml`库中的`etree`模块来解析XML文件。首先,打开XML文件并将其解析为ElementTree对象。 ```python from lxml import etree def parse_xml(file_path): tree = etree.parse(file_path) root = tree....

    基于Python实现的自动化生成XML解析类

    通过`ET.fromstring()`函数可以解析XML字符串,得到一个Element对象树,然后可以使用方法如`.find()`, `.findall()`, `.text`等来查询和操作元素。 现在,让我们深入探讨这个自动化XML解析类的实现。该类可能是通过...

    用Python解析XML的几种常见方法的介绍

    这篇文章主要介绍了用Python解析XML的几种常见方法,包括快速的使用ElementTree模块等方法的实例介绍,需要的朋友可以参考下 一、简介 XML(eXtensible Markup Language)指可扩展标记语言,被设计用来传输和存储数据...

    python解析xml文件方式(解析、更新、写入)

    ### Python 解析、更新与写入 XML 文件 #### 概述 XML(可扩展标记语言)是一种用于存储和传输数据的格式,它以其强大的结构化数据表示能力而在各种应用中广泛使用。Python 提供了几种处理 XML 的库,其中 `xml.dom...

    python 解析XML python模块xml.dom解析xml实例代码

    Python提供了几个库来解析XML,其中最常用的是`xml.dom`模块,特别是`minidom`子模块。本文将深入探讨如何使用`xml.dom.minidom`解析XML文件,并提供一个具体的实例代码。 `xml.dom.minidom`是Python中的一个DOM...

    python xml html 解析工具(代码)

    python处理xml很实用好用的工具 主要有BeautifulSoup和BeautifulStoneSoup,import就好,前者处理html,后者处理xml 具体使用方法可以上网查

    python xml文件解析,正则表达式字符串替换

    python解析xml,字符串替换,正则表达式,可以参考

    python_elementt_xml.zip_python xml_xml解析 python

    在提供的`python使用elementtree模块解析xml.txt`文档中,应包含了使用`ElementTree`解析XML的详细代码示例。通过学习这些代码,你可以理解如何根据实际需求处理XML数据。实践中,可能涉及更复杂的操作,如处理命名...

    python解析xml文件实例分析

    本文实例讲述了python解析xml文件的方法。分享给大家供大家参考。具体如下: python解析xml非常方便。在dive into python中也有讲解。 如果xml的结构如下: <?xml version="1.0" encoding="utf-8"?> ...

    python读取XML文件资料集合

    关于 XML,要记住一个总体概念:可以验证或非验证方式处理 XML 文档。 Python 中的 XML 工具可以分为两类:验证型和非验证型。验证型工具可以验证 XML 文档的语法规则,而非验证型工具则不进行验证。非验证型工具...

    用Python解析XML文件的软件实现.zip

    Python作为一种强大的编程语言,提供了多种库来解析XML文件,使得处理XML数据变得简单易行。本主题将深入探讨如何使用Python来解析XML文件。 在Python中,常用的XML解析库有`xml.dom.minidom`、`ElementTree`(包括...

    python库 解析xml和文本字符集探测

    接着用`BeautifulSoup`解析XML文档,提取所需信息;最后,如果数据源是Excel文件,`xlrd`库则能有效地读取和处理这些数据。 需要注意的是,尽管Python 2.6已经不再维护,但这些库的早期版本仍然可以在某些场景下...

    python 解析xml文件常用模块用法及示例

    利用python xml模块来解析xml文件

    python文件对比 xml、excel

    使用`xml.etree.ElementTree`库,可以轻松地解析XML文件。例如: ```python import xml.etree.ElementTree as ET tree = ET.parse('example.xml') root = tree.getroot() for child in root: print(child....

Global site tag (gtag.js) - Google Analytics