- 浏览: 28684 次
- 性别:
- 来自: 广州
最新评论
-
Java小菜哈:
大哥,你有没有试过的,解析DOM数的时候还是个死循环。
java解析xml之一:使用SAX与DOM -
Sequencenet:
可以使用,开源精神发扬光大。
java获取网页主信息之五:测试 -
lahvey:
可以写一个浏览器了,利害
java获取网页主信息之一:html树操作 -
xo_tobacoo:
很想看看,可是干扰的字符太多,请清理下哦!
位操作技巧 -
sku:
好东东,谢谢博主无私奉献,真的太厉害。我一定要好好研究一下。
...
java获取网页主信息之五:测试
一.简介
DOM4J是dom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J最大的特色是使用大量的接口,这也是它被认为比JDOM灵活的主要原因。
二.安装dom4j
1.下载dom4j:http://sourceforge.net/project/showfiles.php?group_id=16035
2.安装dom4j:将解压后的dom4j-full.jar文件放置到项目的类路径中去,也可以作为附加包添加到项目中。
三.实例
1.所需xml文件
catalog.xml
- <!---->xml version="1.0" encoding="GBK"?>
- <catalog>
- <!----><!---->target text?>
- <journal title="XML Zone" publisher="IBM developerWorks">
- <article level="Intermediate" date="December-2001">
- <title>Java configuration with XML Schematitle>
- <author>
- <firstname>Marcellofirstname>
- <lastname>Vitalettilastname>
- author>
- article>
- journal>
- catalog>
2.修改xml文件
- package domj4Parser;
- import java.io.*;
- //导入dom4j API类
- import org.dom4j.Document;
- import org.dom4j.DocumentHelper;
- import org.dom4j.Element;
- import org.dom4j.io.XMLWriter;
- public class XmlDom4J{
- public void generateDocument(){
- //使用 DocumentHelper 类创建一个文档实例
- //DocumentHelper 是生成 XML 文档节点的 dom4j API 工厂类
- Document document = DocumentHelper.createDocument();
- //使用 addElement() 方法创建根元素 catalog
- //addElement() 用于向 XML 文档中增加元素
- Element catalogElement = document.addElement("catalog");
- //在 catalog 元素中使用 addComment() 方法添加注释"An XML catalog"
- catalogElement.addComment("An XML Catalog");
- //在 catalog 元素中使用 addProcessingInstruction() 方法增加一个处理指令
- catalogElement.addProcessingInstruction("target","text");
- //在 catalog 元素中使用 addElement() 方法增加 journal 元素
- Element journalElement = catalogElement.addElement("journal");
- //使用 addAttribute() 方法向 journal 元素添加 title 和 publisher 属性
- journalElement.addAttribute("title", "XML Zone");
- journalElement.addAttribute("publisher", "IBM developerWorks");
- //向 article 元素中添加 journal 元素
- Element articleElement=journalElement.addElement("article");
- //为 article 元素增加 level 和 date 属性
- articleElement.addAttribute("level", "Intermediate");
- articleElement.addAttribute("date", "December-2001");
- //向 article 元素中增加 title 元素
- Element titleElement=articleElement.addElement("title");
- //使用 setText() 方法设置 article 元素的文本
- titleElement.setText("Java configuration with XML Schema");
- //在 article 元素中增加 author 元素
- Element authorElement=articleElement.addElement("author");
- //在 author 元素中增加 firstname 元素并设置该元素的文本
- Element firstNameElement=authorElement.addElement("firstname");
- firstNameElement.setText("Marcello");
- //在 author 元素中增加 lastname 元素并设置该元素的文本
- Element lastNameElement=authorElement.addElement("lastname");
- lastNameElement.setText("Vitaletti");
- //可以使用 addDocType() 方法添加文档类型说明
- //document.addDocType("catalog",null,"catalog.dtd");
- try{
- XMLWriter output = new XMLWriter(
- new FileWriter(new File("xmlFile/catalog.xml")));
- output.write(document);
- output.close();
- }
- catch(IOException e){
- System.out.println(e.getMessage());
- }
- }
- public static void main(String[] argv){
- XmlDom4J dom4j=new XmlDom4J();
- dom4j.generateDocument();
- }
- }
3.生成xml文件
- package domj4Parser;
- import java.util.List;
- import java.util.Iterator;
- import java.io.*;
- //导入 dom4j API 类
- import org.dom4j.Document;
- import org.dom4j.Element;
- import org.dom4j.Attribute;
- import org.dom4j.Node;
- import org.dom4j.io.OutputFormat;
- import org.dom4j.io.XMLWriter;
- import org.dom4j.DocumentException;
- import org.dom4j.io.SAXReader;
- public class Dom4Jparser{
- public void modifyDocument(File inputXml){
- try{
- //使用 SAXReader 解析 XML 文档 catalog.xml
- SAXReader saxReader = new SAXReader();
- //inputXml 是从 catalog.xml 创建的 java.io.File
- Document document = saxReader.read(inputXml);
- //使用 XPath 表达式从 article 元素中获得 level 节点列表
- List list = document.selectNodes("//article/@level");
- Iterator iter=list.iterator();
- while(iter.hasNext()){
- //如果 level 属性值是"Intermediate"则改为"Introductory"
- Attribute attribute=(Attribute)iter.next();
- if(attribute.getValue().equals("Intermediate"))
- attribute.setValue("Introductory");
- }
- list = document.selectNodes("//article/@date" );
- iter=list.iterator();
- while(iter.hasNext()){
- Attribute attribute=(Attribute)iter.next();
- if(attribute.getValue().equals("December-2001"))
- attribute.setValue("October-2002");
- }
- //获取 article 元素列表
- list = document.selectNodes("//article" );
- iter=list.iterator();
- while(iter.hasNext()){
- Element element=(Element)iter.next();
- //使用Visitor模式遍历子节点
- element.accept(new MyVisitor());
- //从 article 元素中的 title 元素得到一个迭代器
- Iterator iterator=element.elementIterator("title");
- while(iterator.hasNext()){
- Element titleElement=(Element)iterator.next();
- //并修改 title 元素的文本
- if(titleElement.getText().equals("Java configuration with XMLSchema"))
- titleElement.setText("Create flexible and extensible XML schema");
- }
- }
- list = document.selectNodes("//article/author" );
- iter=list.iterator();
- while(iter.hasNext()){
- Element element=(Element)iter.next();
- Iterator iterator=element.elementIterator("firstname");
- while(iterator.hasNext()){
- Element firstNameElement=(Element)iterator.next();
- if(firstNameElement.getText().equals("Marcello"))
- firstNameElement.setText("Ayesha");
- }
- }
- list = document.selectNodes("//article/author" );
- iter=list.iterator();
- while(iter.hasNext()){
- Element element=(Element)iter.next();
- Iterator iterator=element.elementIterator("lastname");
- while(iterator.hasNext()){
- Element lastNameElement=(Element)iterator.next();
- if(lastNameElement.getText().equals("Vitaletti"))
- lastNameElement.setText("Malik");
- }
- }
- XMLWriter output = new XMLWriter(
- new FileWriter( new File("xmlFile/catalog-modified.xml")));
- output.write(document);
- output.close();
- }
- catch(DocumentException e){
- e.printStackTrace();
- }
- catch(IOException e){
- System.out.println(e.getMessage());
- }
- }
- public void treeWalk(Element element) {
- for (int i = 0,size = element.nodeCount();i < size;i++){
- Node node = element.node(i);
- if (node instanceof Element) {
- treeWalk((Element) node);
- }
- else { /* do something....*/}
- }
- }
- //处理中文问题
- public int formatXMLFile(String filename){
- int returnValue = 0;
- try{
- SAXReader saxReader = new SAXReader();
- Document document = saxReader.read(new File(filename));
- XMLWriter output = null;
- /** 格式化输出,类型IE浏览一样 */
- OutputFormat format = OutputFormat.createPrettyPrint();
- /** 指定XML字符集编码 */
- format.setEncoding("GBK");
- output = new XMLWriter(new FileWriter(new File(filename)),format);
- output.write(document);
- output.close();
- /** 执行成功,需返回1 */
- returnValue = 1;
- }
- catch(Exception ex){
- ex.printStackTrace();
- }
- return returnValue;
- }
- public static void main(String[] argv){
- Dom4Jparser dom4jParser=new Dom4Jparser();
- dom4jParser.modifyDocument(new File("xmlFile/catalog.xml"));
- dom4jParser.formatXMLFile("xmlFile/catalog.xml");
- }
- }
4.使用Visitor模式
- package domj4Parser;
- import org.dom4j.Attribute;
- import org.dom4j.Element;
- import org.dom4j.VisitorSupport;
- //Visitor模式
- public class MyVisitor extends VisitorSupport {
- public void visit(Element element){
- System.out.println(element.getName());
- }
- public void visit(Attribute attr){
- System.out.println(attr.getName());
- }
- }
发表评论
-
java获取网页主信息之五:测试
2007-09-01 22:29 24321.所需文件 param.txt:存放需要提取信息的网页路径 ... -
java获取网页主信息之四:抽取信息块
2007-09-01 22:24 2279从已经建立完成的html树中抽取主信息。 pac ... -
java获取网页主信息之三:html to tree
2007-09-01 22:22 2506对html文件进行扫描,将html元素抽象出来形成树。 ... -
java获取网页主信息之二:辅助操作
2007-09-01 22:19 17531.栈操作 package Source; ... -
java获取网页主信息之一:html树操作
2007-09-01 22:17 29941.节点操作 package ... -
java解析xml之二:使用JDOM
2007-09-01 21:49 1622一.简介 JDOM是一种解析XML的Java工具包。 ... -
java解析xml之一:使用SAX与DOM
2007-09-01 17:29 3734一.概要 用Java解析XML文档,最常用的有两种方法:使 ...
相关推荐
DOMJ4是Java中处理XML的一种API,全称为Java DOM API,它允许程序通过内存中的对象模型与XML文档进行交互。 首先,我们需要了解DOM(Document Object Model)的概念。DOM是一种将XML文档解析为一棵树形结构的API,...
Android提供了三种主要的XML解析方式:SAX(Simple API for XML)、Pull解析器和DOM(Document Object Model)。每种方法都有其特定的优缺点和适用场景。 1. **SAX解析**: - **特点**:SAX解析是基于事件驱动的...
- 配置文件处理:许多Java应用使用XML配置文件,DOM4J能方便地解析和修改这些文件。 - 日志分析:XML格式的日志可以通过DOM4J进行解析,提取关键信息。 6. **性能优化** - 使用流式API:对于大型XML文件,避免一...
domj4 jar包 包含1.6.1,2.0.2,2.1.0三个版本,适用于不同的java版本. dom4j-1.6.1 XML Document Object Model based on Java Collections Framework Java 1.4+ dom4j-2.0.2 XML Document Object Model based on ...
而DOM4J是Java中一个功能强大的XML处理库,它提供了一种灵活的方式来解析、操作和生成XML文档。本教程将深入探讨如何利用DOM4J库来解析XML文档。 首先,我们需要了解DOM4J的基本概念。DOM4J采用的是Document Object...
在提供的压缩包中,`Java中用Domj4对xml的操作`可能包含示例代码、解释文档和所需的Dom4j库的jar包。使用这些资源,开发者可以更深入地理解并实践Dom4j在处理XML文档时的各种操作。总的来说,Dom4j为Java程序员提供...
在描述部分提供的Java代码片段中,演示了如何使用dom4j库中的SAXReader来读取一个XML文件并返回一个Document对象。这一过程首先创建了一个SAXReader实例,然后通过调用它的read方法来解析XML文件,最终得到一个...
4. **使用字符串操作**:如果可能,可以将XML转换为字符串,进行字符串操作来删除节点,然后再将结果转换回XML。这种方法需谨慎处理,因为它可能破坏XML的结构。 5. **选择合适的解析库**:不同编程语言的XML库处理...
《Java毕业设计-cs架构_domj_在线考试系统》是一款基于Java语言开发的C/S架构在线考试系统。该系统实现了用户管理、题库管理、试卷生成、在线考试、自动评分及成绩统计等功能。通过高效稳定的技术架构和简洁的用户...
2.解析XML形式的文本,得到document对象. String text = "<members></members>"; Document document = DocumentHelper.parseText(text); 3.主动创建document对象. Document document = DocumentHelper.create...
2. 使用DOM解析库(如Domj4xml)解析XML文件,获取APN条目的各项参数,如APN名、MMSC(彩信中心)、MCC(移动国家代码)、MNC(移动网络代码)等。 3. 将这些参数按照WP8系统所接受的格式组织起来。 4. 创建新的WP8 ...