`

python 解析xml(解决gb2312编码问题)

 
阅读更多
import urllib
import xml.dom.minidom               
url = 'http://223.202.45.187:8080/BillQueryService3/pub/query/billing/LogBandWidthByChannelID?Type=standard&RegionID=9050&ChannelCount=1&StartTime=20130911&EndTime=20130912&ChannelID1=46056'

if __name__ == '__main__':
    response = urllib.urlopen(url).read()
    doc = xml.dom.minidom.parseString(response.replace("GB2312","utf-8"))   
    root  =  doc.documentElement
    nodeList=root.getElementsByTagName("InData") 
    node=nodeList.item(0);
    print node.childNodes[0].nodeValue

<BandWidthDatas>
<InData>734967,804582,748431,700435,741438,790629,711222,785297,760371,879281,830852,667747,521595,591466,523582,596232,525482,521646,585350,590894,471779,495218,501089,522785,568087,516298,592462,560570,559551,663606,591116,532197,502947,587373,657666,564981,789629,892320,861506,666045,513198,516113,556784,382219,543530,852253,870274,626598,578371,581956,502750,561070,647509,609348,700398,556133,558517,1795000,1929277,1930552,1587964,1503018,979172,840592,991367,758422,526656,831452,878502,469387,855522,496229,447473,696246,722823,401733,402657,423735,635378,1540551,1252920,1461867,893117,707067,607637,594154,789271,843980,724784,804936,577846,757652,832049,947499,880607,720087,775329,934759,978645,803068,906384,874214,861754,1565193,1817977,1213644,1465298,1347389,1420933,1536785,1049131,1500526,1549579,1376343,1097279,3230237,2851553,2111527,1835563,1919216,2312424,2282630,2078254,1923741,1760418,2008574,2075676,3067038,3240775,2497667,2561080,2369818,2315820,2178929,1733992,1608287,1482467,1396103,2188629,3102358,2019556,2190123,2565644,2210615,1711603,1814254,1733067,1705588,2024283,1702695,1758020,2020507,1857479,1709575,1568892,1270235,1326908,1532812,1428638,1218445,1424708,1193779,1240165,1346645,1432530,1238506,1362267,1282136,1175855,1248302,1341789,1034955,1259787,961329,1289414,1342310,1174518,1269546,1129377,1102328,1221854,1395323,1590917,1322813,1902681,1308253,1789843,1903007,1369683,1409603,1449242,2380716,1340958,1654614,1317114,1465245,1529357,1591713,1433889,1670220,1618688,1690457,1465408,1379521,1490793,1531951,1455292,1450621,1195069,1401640,1145794,1080168,1175812,1028776,1066365,984952,934138,1040235,1140514,987066,824210,932885,1156897,1175121,965918,1111297,935694,977870,983840,1064438,916079,1069549,1192218,944294,900032,875097,909848,947157,1031544,899517,716283,829213,1198744,934569,822495,1013310,1230587,1050827,1731108,1552921,1397526,1438612,1416353,1424798,1360124,1367022,1266812,1189290,1195439,1270451,1085203,999244,1268162,1081781,986924,1026981,1008771,1021216,919458,921427,1096737,981464,1113669,1010843,802621,1085028,949214,958811,973648,1015204,926723,885322,897739,999079,930218,1114228,798395,739189,724534,770431,690081,666902,694693,1118018,599423,607569,696572,522615,562644,528183,573008,549234,574997,460402,442731,597562,485696,452766,365704,299791,392684,489297,442544,1660053,559529,453975,369781,403340,308204,424640,324732,299929,351675,412267,300087,356539,459041,424110,423831,364746,462399,348210,430134,496612,442855,332628,662960,433334,413039,435819,405867,374756,414264,356662,480472,336633,334113,356180,350322,297548,364154,407945,299995,330622,304129,332683,344510,280522,367045,361366,592740,1646051,394249,347948,349092,326759,385766,499077,371197,323002,411121,396095,419202,386872,425273,432689,371450,668124,474861,705197,828682,672870,675366,813503,795355,836554,733157,990117,765761,944861,1022581,1921460,1992838,1695212,1831779,1541186,1818039,1957435,1646411,1902510,1285266,1552405,1256307,2475268,2456613,1985066,2698468,2832225,2103389,2748432,1751707,1811439,1921550,1609594,1863545,2772701,3436475,3319181,3061922,1836621,2344195,2537610,2341312,2420511,1735777,1705224,1520220,2325041,2214416,2353633,2353664,2286993,1954483,1745312,1502533,2088155,2205358,1485198,1349934,2127168,1931649,1614977,1793171,1356623,1858905,1588347,1282158,1284027,1399066,1400769,1448384,1950174,1446398,1439969,1719046,1473635,1611261,1748211,1519365,1539319,1497638,1524792,1585318,1352348,1418220,1307308,1379955,1245545,1289584,1242751,1131553,1371001,1322266,1086547,1491898,1542348,1832589,1516676,1655508,1464823,1656897,1429998,1414577,1251325,1552593,1202537,1523697,1695120,1970189,1812949,1671501,1479295,1410004,1416660,1626993,1350815,1351374,1342072,1264197,1484656,1170365,1662184,1544690,1288538,1212562,1140891,1155569,1277611,885113,1099045,1125496,1413824,1280331,1368905,1362418,1129078,1333567,1315841,1139785,1108523,1498683,1384885,1101803,1219903,1119834,1246289,1109735,1118365,1095242,1080712,996819,1165898,988801,1025878,896924,1098847,1001020,971911,1224811,876390,843994,838953,1006624,770473,1022543,939497,966504,978833,940519,1033486,773550,901311,922494,826830,920623,1040724,1025869,938946,991959,877955,833190,928697,925425,1680577,1049644,874947,763486,1128969,1107442,875431,934978,903593,819502,743681,621233,917323,</InData>
</BandWidthDatas>
分享到:
评论

相关推荐

    python库 解析xml和文本字符集探测

    接着用`BeautifulSoup`解析XML文档,提取所需信息;最后,如果数据源是Excel文件,`xlrd`库则能有效地读取和处理这些数据。 需要注意的是,尽管Python 2.6已经不再维护,但这些库的早期版本仍然可以在某些场景下...

    GBK.enc GB2312.enc XML读取时编码格式

    为了正确读取GBK或GB2312编码的XML文件,我们需要使用相应的解码器。在Java中,可以使用`java.nio.charset.Charset`类的`decode()`方法,指定GBK或GB2312作为输入流的编码;在Python中,可以使用`open()`函数的`...

    PB 解析xml格式串

    在“PB解析xml格式串”的主题中,我们主要关注如何将XML格式的数据转换为Protocol Buffers的二进制格式,以便于高效地存储和传输。以下是一些相关的知识点: 1. **Protocol Buffers介绍**:PB是一种高效的序列化...

    解析XML特殊字符方法

    例如,在Python中,可以使用`xml.sax.saxutils.escape()`函数来编码特殊字符,而在JavaScript中,可以使用`encodeURI()`或`encodeURIComponent()`函数。同样,接收XML数据后,可以通过解码函数还原这些字符。 **3. ...

    xml解析器(解决XML错误)

    “xml解析器”就是用来解决这类问题的工具,它们读取XML文档并检查其语法和结构是否符合XML规范。安装一个可靠的XML解析器可以帮助开发者识别并修复这些问题,确保XML文件的有效性和可读性。本压缩包提供了两个XML...

    python自定义解析简单xml格式文件的方法

    ### Python自定义解析简单XML格式文件的方法 #### 概述 在进行Web开发或处理不同系统间的数据交换时,XML(可扩展标记语言)是一种常用的数据格式。它以标签的形式组织数据,使得数据结构清晰易读。Python 提供了...

    python解析xml简单示例

    本篇将详细介绍如何使用Python解析XML文件,以城市信息为例进行讲解。 首先,Python提供了几个库来处理XML,如`xml.dom.minidom`,`ElementTree`(包括`xml.etree.ElementTree`和`xml.etree.cElementTree`)。这里...

    chardet-1.0.1.tar.gz 自动检测python汉字编码辅助

    它支持多种编码格式,包括但不限于GBK、GB2312、Big5、UTF-8、ISO-8859-1等,这些都是处理中文文本时常见的编码方式。通过使用 `chardet`,开发者可以避免因为编码问题导致的乱码或解析错误。 在HTML解析方面,`...

    XML解析还原代码

    解析XML文档时,通常会构建一个DOM树,以便于对数据进行操作。 解析XML文件的常用方法有两种:DOM解析和SAX解析。DOM解析会将整个XML文档加载到内存中,形成一个完整的DOM树,适合小到中等大小的XML文件。而SAX解析...

    xml.zip_XML 解析_XML解析_xml linux

    5. **Python解析**:Python有许多内置的XML处理库,如`xml.etree.ElementTree`,它提供了简洁的API来解析和操作XML。 压缩包中的`IpCamXml_Codec.cpp`和`IpCamXml_Codec.h`文件可能是用于处理IP摄像头XML数据的编码...

    xml_3rd_fix_XML解析_

    例如,可以使用lxml库的`Element`类来创建和操作元素,`iterparse`函数来迭代解析XML,`tostring`方法将元素转换为字符串形式,从而实现XML的序列化。 在实际开发中,处理XML时可能会遇到编码问题、命名空间问题、...

    解决读取XML元素时的中文乱码的程序

    具体步骤可能包括使用编程语言提供的XML处理库,设置正确的编码,然后读取、解析XML文件,验证中文元素是否正确显示。如果一切正常,说明解决方案有效。 总的来说,解决XML文件中文乱码问题需要对字符编码有深入的...

    eric5-i18n-zh_CN.GB2312-5.1.2.zip

    《深入理解eric5-i18n-zh_CN.GB2312-5.1.2.zip:中文汉化包的解析与应用》 在IT领域,本地化(Localization,简称L10n)和国际化(Internationalization,简称i18n)是至关重要的部分,它们确保软件在全球范围内能...

    Python爬虫基于lxml解决数据编码乱码问题

    在Python爬虫开发中,经常会遇到数据编码乱码的问题,特别是在处理HTML或XML文档时。lxml库作为Python的一个强大的解析库,不仅支持HTML和XML的解析,还提供了XPath这一强大的查询工具,使得数据提取变得更为高效。...

    python解析osm为json.zip

    这个"python解析osm为json.zip"的压缩包文件就是提供了一个用Python实现OSM数据解析并转换为JSON格式的方法。 在Python中,解析OSM文件主要涉及两个关键库:`xml.etree.ElementTree`(用于XML解析)和`json`(用于...

    XML读取以及解析

    &gt;`定义,表示XML版本和编码方式。 - 可以包含属性,如 `&lt;element attr1="value1" attr2="value2"&gt;`。 2. **XML解析方式**: - **DOM解析**:Document Object Model(DOM)将整个XML文档加载到内存中,形成一棵树...

    基于Python获取docx/doc文件内容代码解析

    在解析XML时,为了获取纯文本内容,通常需要移除XML标签。代码中使用了`re.sub`函数和正则表达式`*?&gt;`来删除所有XML标签,只保留文本内容。由于`document.xml`中的段落和行是以`&lt;w:t&gt;&lt;/w:t&gt;`标签对包裹的,所以在...

    word文件批量替换(word转xml、xml转字符串、doc转docx)

    转换后的XML文件可以使用XML解析器读取,然后根据需求对数据进行处理。 接下来,我们要讨论的是“xml转字符串”。XML文件本身是以结构化的文本形式存在的,但有时我们需要将其转换为单一的字符串,这可能是因为要...

    文件上传,下载,解析xml文件

    解析XML文件的方法有两种:DOM(Document Object Model)和SAX(Simple API for XML)。DOM一次性加载整个XML文档到内存,形成一个树形结构,方便遍历和查找元素。而SAX是事件驱动的,逐行读取XML文件,只在遇到特定...

    解析xml

    XML(eXtensible Markup Language)是一种用于标记数据的...以上代码片段展示了如何在Python和Java中解析XML文件,获取元素和属性信息。通过这些基本操作,你可以进一步处理XML数据,实现数据转换、存储或业务逻辑。

Global site tag (gtag.js) - Google Analytics