`
诗意的栖居
  • 浏览: 276129 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

xml.sax.saxutils

XML 
阅读更多
xml.sax.saxutils模块里面包含了很多在使用SAX应用程序都可能用到的
有用类和程序,不管是基础类还是直接使用的方法。

escape(data[,entities])
   避开一个string数据里面的“&”,“<”,“>”字符串。
   你同样可以避开其他的字符串,你只需要传一个通过可选的参数entities
   传一个字典给它就行。字典的键,值都必须是字符串;每一个
   键都会被它对应的值替换。

unescape(data[,entities])
   不忽略string里面的"&amp;","&lt;","&gt;"字符串。
   你同样可以不避开其他的字符串,你只需要传一个通过可选的参数entities
   传一个字典给它就行。字典的键,值都必须是字符串;每一个
   键都会被它对应的值替换。
  
   出现于2.3中

quoteattr(data[,entities])
    和escape()相似,也将data用作一个属性值。返回值是一个
        被引用了的带有所有附加替换请求的data版本。
        quoteattr()将会基于data的内容选择一个引用的字符,
        企图避免对字符串里面的任何字符进行编码。如果单引用和双引用
        字符都已经存在于data中,那么双引用字符会被编码,data
        将会被双引用封装。结果数据将可以被直接用作一个属性值:
           >>> print "<element attr=%s>" % quoteattr("ab ' cd \" ef")
       <element attr="ab ' cd &quot; ef">
              
     当你正想通过混合的格式来为HTML或者任何SGML产生属性值
         的时候,这个函数将会变得非常有用。
      
class XMLGenerator([out[,encoding]])
     这个类通过将SAX事件写回到XML文档中来实现了ContentHandler接口。
         换句话说,用一个XMLGenerator类当作一个内容处理器将会重新生成
         已经被解析过的文档。out应当是一个类文件对象,默认值为sys.stdout,
         encoding是输出流的编码方式,默认值为"iso-8859-1".

class XMLFilterBase(base)
     这个类被设计用来处理XMLReader和客户端应用程序时间处理器之间做一些
         你想做的事情的。
         默认情况下,它不会做任何多于的事情,只是将请求传给reader,将事件传给
         未被修改的处理器。但是它的子类可以覆盖具体的方法,在信息通过它
         传递的时候就可以修改事件流和配置请求。

prepare_input_source(source[,base])
    这个函数接受一个输入源和一个可选的基础URL,返回一个被完全解析的
        InputSource对象来为读做准备。这个输入源可以通过一个字符串,类文件对象
        ,或者一个InputSource对象来给定,解析器会利用这个函数为他的parse()方法
        实现多形态的source参数.
分享到:
评论

相关推荐

    解析XML特殊字符方法

    例如,在Python中,可以使用`xml.sax.saxutils.escape()`函数来编码特殊字符,而在JavaScript中,可以使用`encodeURI()`或`encodeURIComponent()`函数。同样,接收XML数据后,可以通过解码函数还原这些字符。 **3. ...

    Python对HTML转义字符进行反转义的实现方法

    # 使用 xml.sax.saxutils.unescape from xml.sax.saxutils import unescape escaped_string = 'param=p1&param=p2' decoded_string = unescape(escaped_string) print(decoded_string) # 输出: param=p1&param=p2 `...

    python3.6.5参考手册 chm

    xml.sax zipfile Other module-level changes Optimizations Build and C API Changes Deprecated New Keywords Deprecated Python Behavior Unsupported Operating Systems Deprecated Python modules, ...

    Python中将字典转换为XML以及相关的命名空间解析

    Python的`xml.sax.saxutils`模块提供了`escape()`和`unescape()`函数来进行转义和反转义操作: ```python from xml.sax.saxutils import escape, unescape d = {'name': '&lt;spam&gt;'} escaped_value = escape(d['name...

    Python在字符串中处理html和xml的方法

    对于XML实体,可以使用 `xml.sax.saxutils.unescape()` 函数: ```python from xml.sax.saxutils import unescape t = 'The prompt is &gt;&gt;&gt;' print(unescape(t)) ``` 这会将 `&gt;` 等XML实体替换为其...

    详解用Python处理HTML转义字符的5种方式

    from xml.sax.saxutils import unescape escaped_str = unescape('a=1&b=2') ``` 5. **自定义函数**: 虽然Python提供了一些内置方法,但你也可以编写自己的函数来处理转义字符。这通常涉及使用正则表达式替换...

    Python将字典转换为XML的方法

    `xml.sax.saxutils`模块的`escape()`函数可以帮助完成这项工作。然而,使用`ElementTree`创建XML元素可以自动处理这些细节,更安全且易于维护。 另外,如果要保持字典中元素的顺序,建议使用`collections....

Global site tag (gtag.js) - Google Analytics