浏览 6886 次
锁定老帖子 主题:DOM4J好在哪里
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2010-01-28
JAXP(Java API for XML Parsing)
Sun(现在属于oracle)提供的一套操作解析和操作XML文档的接口,主要包括三个包:
// 获取DOM解析器并解析文档 // 此后就是使用org.w3c.dom包的接口来操作Document了 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = parser.parse(filename); // 获取SAX解析器并解析文档 // 此后就是使用org.xml.sax包的接口来操作了 SAXParserFactory factory2 = SAXParserFactory.newInstance(); SAXParser parser = factory2.newSAXParser(); System.out.println(parser.getClass()); parser.parse(new File("d:\\xml\\table.xml"), new MyHandler()); 由上面可以看到,JAXP中DOM和SAX获取解析器的步骤是相似的,查看实现可以了解其内部有一个查找过程,如果用户不进行任何修改,JDK1.6会默认绑定apache的Xerces。 DOM4J 提到java的XML解析,大家都会想到DOM4J,那么DOM4J和JAXP有什么关系呢? 通过研究DOM4J 2.0的源码发现,DOM4J使用JAXP来获取解析器,然后通过自己定义的接口来操作解析后的文档,也就是说DOM4J和JAXP仅仅在操作文档上接口不同,JAXP使用的是org.w3c.dom和org.xml.sax,而DOM4J使用的是自定定义的一套接口。看DOM4J例子 // 使用JAXP获取DOM解析器并解析文档 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); org.w3c.dom.Document Document doc = parser.parse(filename); // 对Document进行接口转换,转换成自己定义的Document接口 DOMReader reader = new DOMReader(); org.dom4j.Document doc = reader.read(doc2); // SAX的例子 File f = new File("d:\\xml\\table.xml"); SAXReader reader = new SAXReader(); org.dom4j.Document Document doc = reader.read(f); 上面DOM操作的例子比较容易看懂,使用JAXP解析了文档后,再使用SAXReader对将org.w3c.dom.Document转换成org.dom4j.Document接口。以后对文档的操作就是org.dom4j.Document的事情了。 SAX的例子比较特别点,通过看DOM4J的源码,最后在SAXHelper类中发现了下面一句: reader = createXMLReaderViaJAXP(validating, true); 就比较清楚了,SAX也是通过JAXP来获取解析器的。 不管是DOM还是SAX,在解析文档后,最终都转换成了org.dom4j.Document接口,这样的好处是很明显的: 如果程序之前使用DOM解析器,由于某种原因想换成SAX解析器,只需修改获取解析器部分的代码,后面对文档的操作代码是不需要改动的,而JAXP就不行,因为org.w3c.dom和org.xml.sax的接口是不一样的。 分析到这里,连我自己都有些疑惑了,个人认为:DOM4J的优势在于DOM和SAX访问接口的统一,而解析文档则共用的JAXP这部分。但是上网google一下都说DOM4J性能好,如果说DOM4J性能好,那到底快在哪里? 这个问题没有想明白。不知道谁研究过这个问题,学习一下。 附: 如何配置JAXP的解析器: A 如何对JAXP SAX解析器进行配置: 1 程序中设置javax.xml.parsers.SAXParserFactory属性,例如 System.setProperty("javax.xml.parsers.SAXParserFactory", "org.apache.xerces.jaxp.SAXParserFactoryImpl"); 2 运行时使用-D参数 java -Djavax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl 3 JAVA_HOME\JRE\lib下建立一个文件jaxp.properties,加入一行 javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl 4 查找解析器jar文件的META-INF\services目录, 在此目录下如果含有 javax.xml.parsers.SAXParserFactory文件,则通过此文件的内容加载解析器。 5 缺省解析器,1.6是xerces 其中DOM4J就是通过第四条,引入pull-parser jar包,并且在包中的META-INF\services目录加入javax.xml.parsers.SAXParserFactory文件来配置SAX解析器的。 B 如何对JAXP DOM解析器进行配置: 步骤和上面类似,不过设置的属性是javax.xml.parsers.DocumentBuilderFactory。 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2010-06-28
看着迷糊啊 呵呵
|
|
返回顶楼 | |
发表时间:2010-06-28
具体选型工作需要看当时的环境而定,dom4j也没什么不好。
而我个人比较喜欢用w3c.dom |
|
返回顶楼 | |
发表时间:2010-06-28
xml 现在被烂用了。。。。。
|
|
返回顶楼 | |
发表时间:2010-06-29
你举得例子太简单了,如果你用JAXP解析下一个XML文件,再试下用DOM4J来解析就知道差别了,总体感觉就是DOM4J解析更符合人性化,用JAXP解析简直是噩梦...
|
|
返回顶楼 | |
发表时间:2010-06-29
SAX和Doc的应用场合本来就不同
DOM4J针对普遍应用场景 |
|
返回顶楼 | |