xml文件解析-DOM4J

yuping322

浏览: 94147 次
来自: ...

最近访客更多访客>>

dongguangming88

jielun1995

zhanyuanwen1989

serialization_

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

XML 设计模式 XHTML 工作

１．读取并解析XML文档：

读写XML文档主要依赖于org.dom4j.io包，其中提供DOMReader和SAXReader两类不同方式，而调用方式是一样的。这就是依靠接口的好处。

// 从文件读取XML，输入文件名，返回XML文档

public Document read(String fileName) throws MalformedURLException, DocumentException {

SAXReader reader = new SAXReader();

Document document = reader.read(new File(fileName));

return document;

}

其中，reader的read方法是重载的，可以从InputStream, File, Url等多种不同的源来读取。得到的Document对象就带表了整个XML。

根据本人自己的经验，读取的字符编码是按照XML文件头定义的编码来转换。如果遇到乱码问题，注意要把各处的编码名称保持一致即可。

２．取得Root节点

读取后的第二步，就是得到Root节点。熟悉XML的人都知道，一切XML分析都是从Root元素开始的。

　 public Element getRootElement(Document doc){

return doc.getRootElement();

}

2.2访问节点

List childrenList = elt.elements();

List childrenList = elt.elements("student");

Element eltChild = elt.element("student");

2.3.访问属性

List attrList = elt.attributes();

Attribute attr = elt.attribute("sn");

String attrValue = elt.attributeValue("sn");

2.4.删除元素和属性

Element eltStu = root.element("student");

root.remove(eltstu);

--------------------------------

etl.remove(elt.attribute("sn"));

３．遍历XML树

DOM4J提供至少3种遍历节点的方法：

1) 枚举(Iterator)

// 枚举所有子节点

for ( Iterator i = root.elementIterator(); i.hasNext(); ) {

Element element = (Element) i.next();

// do something

}

// 枚举名称为foo的节点

for ( Iterator i = root.elementIterator("foo"); i.hasNext();) {

Element foo = (Element) i.next();

// do something

}

// 枚举属性

for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {

Attribute attribute = (Attribute) i.next();

// do something

2)递归

递归也可以采用Iterator作为枚举手段，但文档中提供了另外的做法

public void treeWalk() {

treeWalk(getRootElement());

}

public void treeWalk(Element element) {

for (int i = 0, size = element.nodeCount(); i < size; i++) {

Node node = element.node(i);

if (node instanceof Element) {

treeWalk((Element) node);

} else { // do something....

}

3) Visitor模式

最令人兴奋的是DOM4J对Visitor的支持，这样可以大大缩减代码量，并且清楚易懂。了解设计模式的人都知道，Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用，并且一种作为Visitor去访问许多Visitable。我们来看DOM4J中的Visitor模式(快速文档中没有提供)

只需要自定一个类实现Visitor接口即可。

　 public class MyVisitor extends VisitorSupport {

public void visit(Element element){

System.out.println(element.getName());

}

public void visit(Attribute attr){

System.out.println(attr.getName());

}

        调用：  root.accept(new MyVisitor())

Visitor接口提供多种Visit()的重载，根据XML不同的对象，将采用不同的方式来访问。上面是给出的Element和Attribute的简单实现，一般比较常用的就是这两个。VisitorSupport是DOM4J提供的默认适配器，Visitor接口的Default Adapter模式，这个模式给出了各种visit(*)的空实现，以便简化代码。

注意，这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor)，将遍历子节点。我第一次用的时候，认为是需要自己遍历，便在递归中调用Visitor，结果可想而知。

4. XPath支持

DOM4J对XPath有良好的支持，如访问一个节点，可直接用XPath选择。

public void bar(Document document) {

List list = document.selectNodes( "//foo/bar" );

Node node = document.selectSingleNode("//foo/bar/author");

String name = node.valueOf( "@name" );

}

例如，如果你想查找XHTML文档中所有的超链接，下面的代码可以实现：

public void findLinks(Document document) throws DocumentException {

List list = document.selectNodes(" //a/@href ");

for (Iterator iter = list.iterator(); iter.hasNext(); ) {

Attribute attribute = (Attribute) iter.next();

String url = attribute.getValue();

}

5. 字符串与XML的转换

有时候经常要用到字符串转换为XML或反之，

    // XML转字符串

　Document document = ...;

String text = document.asXML();

// 字符串转XML

String text = "<person> <name>James</name> </person>";

Document document = DocumentHelper.parseText(text);

6 用XSLT转换XML

public Document styleDocument(

Document document,

String stylesheet

) throws Exception {

// load the transformer using JAXP

TransformerFactory factory = TransformerFactory.newInstance();

Transformer transformer = factory.newTransformer(

new StreamSource( stylesheet )

);

// now lets style the given document

DocumentSource source = new DocumentSource( document );

DocumentResult result = new DocumentResult();

transformer.transform( source, result );

// return the transformed document

Document transformedDoc = result.getDocument();

return transformedDoc;

}

7. 创建XML

一般创建XML是写文件前的工作，这就像StringBuffer一样容易。

public Document createDocument() {

Document document = DocumentHelper.createDocument();

Element root = document.addElement(root);

Element author1 =

root

.addElement("author")

.addAttribute(name, "James")

.addAttribute("location", "UK")

.addText("James Strachan");

Element author2 =

root

.addElement("author")

.addAttribute("name", Bob")

.addAttribute("location", "US")

.addText("Bob McWhirter");

return document;

}

8. 文件输出

一个简单的输出方法是将一个Document或任何的Node通过write方法输出

FileWriter out = new FileWriter( "foo.xml");

document.write(out);

 如果你想改变输出的格式，比如美化输出或缩减格式，可以用XMLWriter类

public void write(Document document) throws IOException {

// 指定文件

XMLWriter writer = new XMLWriter(

new FileWriter( "output.xml" )

);

writer.write( document );

writer.close();

// 美化格式

OutputFormat format = OutputFormat.createPrettyPrint();

writer = new XMLWriter( System.out, format );

writer.write( document );

// 缩减格式

format = OutputFormat.createCompactFormat();

writer = new XMLWriter( System.out, format );

writer.write( document );

}

分享到：

掌握JDK1.5枚举类型 | Java中类与类的关系

2007-08-22 18:10
浏览 3843
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

打造高效集成工具箱：基于Python与Tkinter的实战开发教程: 在日常的开发和使用中，我们经常需要借助各种小工具来提高工作效率，例如快速启动常用的应用程序、管理文件等。一个简单但功能强大的集成工具箱可以帮助用户快速访问、启动并管理程序。今天，我们将以Python为基础，结合Tkinter和Win32API，开发一个类似Windows快捷方式的工具箱应用，能够让你轻松集成各种常用程序并一键启动

django自建博客app: django自建博客app

《基于YOLOv8的智慧校园实验室高压灭菌锅安全联锁系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 《基于YOLOv8的智慧校园实验室高压灭菌锅安全联锁系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计

用于hifi测序数据的基因组组装程序: 用于hifi测序数据的基因组组装程序

Microsoft Access 2010 数据库引擎可再发行程序包AccessDatabaseEngine-X64解压后的文件AceRedist: Microsoft Access 2010 数据库引擎可再发行程序包AccessDatabaseEngine-X64解压后的文件AceRedist

从大模型、智能体到复杂AI应用系统的构建-以产业大脑为例.pdf: 从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例

自然语言处理之TF-IDF算法与TextRank算法的缠绵_textrank,tf-idf和两者的组合-CSDN博客.html: 自然语言处理之TF-IDF算法与TextRank算法的缠绵_textrank,tf-idf和两者的组合-CSDN博客.html

科学智能2023版《科学智能 (AI4S)全球发展观察与展望》：AI4S驱动的跨领域技术创新与应用: 内容概要：2023版《科学智能 (AI4S)全球发展观察与展望》阐述了AI for Science（AI4S）在全球范围内的最新进展及其对科学和工业的深远影响。文章首先回顾了AI4S在过去一年中的快速发展，特别是在药物研发、材料科学、地质学、污染治理等多个领域的应用实例。AI4S通过结合深度学习、机器学习和其他AI技术，加速了从基础研究到实际应用的转化过程。例如，在药物研发中，AI4S帮助科学家克服了“反摩尔定律”的挑战，提高了新药研发的成功率；在材料科学中，AI4S实现了复杂材料的高效模拟，如人造钻石、石墨烯、碳纳米管等；在地质学中，AI4S通过模拟地球内部结构和物理过程，为地震学研究提供了新视角。此外，文章还探讨了大语言模型（LLMs）与科学方法的结合，指出LLMs不仅能辅助科学研究，还能生成新的科学假设并进行逻辑推理。适合人群：具备一定科研背景或对AI技术感兴趣的科研人员、工程师、政策制定者及高校师生。

个人健康与健身追踪数据集，包含了日常步数统计、睡眠时长、活跃分钟数以及消耗的卡路里，适用于数据分析、机器学习: 这个数据集包含了日常步数统计、睡眠时长、活跃分钟数以及消耗的卡路里，是个人健康与健身追踪的一部分。该数据集非常适合用于以下实践：数据清洗：现实世界中的数据往往包含缺失值、异常值或不一致之处。例如，某些天的步数可能缺失，或者存在不切实际的数值（如10,000小时的睡眠或负数的卡路里消耗）。通过处理这些问题，可以学习如何清理和准备数据进行分析。探索性分析（发现日常习惯中的模式）：可以通过分析找出日常生活中的模式和趋势，比如一周中哪一天人们通常走得最多，或是睡眠时间与活跃程度之间的关系等。构建可视化图表（步数趋势、睡眠与活动对比图）：将数据转换成易于理解的图形形式，有助于更直观地看出数据的趋势和关联。例如，绘制步数随时间变化的趋势图，或是比较睡眠时间和活动量之间的关系图。数据叙事（将个人风格的追踪转化为可操作的见解）：通过讲述故事的方式，把从数据中得到的洞察变成具体的行动建议。例如，根据某人特定时间段内的活动水平和睡眠质量，提供改善健康状况的具体建议。

框架结构天城商业办公楼5200平米（建筑图结构图计算书开题报告任务书文献翻.zip: 框架结构天城商业办公楼5200平米（建筑图结构图计算书开题报告任务书文献翻.zip

柴油机连杆加工工艺及夹具设计.zip: 柴油机连杆加工工艺及夹具设计.zip

BeautifulSoup中的select方法汇总: 读书网首页的HTML信息

渐变色文字生成工具 v1.0一款让文字生成渐变颜色代码的软件文字渐变颜色代码生成器.rar: 文字渐变颜色代码生成器：让文字绽放多彩魅力，演示：在信息交流日益丰富的今天，个性化的文字展示成为吸引目光的关键。这款文字渐变颜色代码生成器，便是为满足这一需求而生的绿色软件，无需安装，便捷实用。它的操作极为简便。用户只需在软件界面中输入想要转换的文字内容，接着从丰富的色彩选项里挑选心仪的起始颜色与结束颜色，随后轻轻按下 “转换按钮”，神奇的事情就此发生 —— 适用于论坛、网页、QQ 空间等多种平台，以及自定义格式的渐变颜色代码便会即刻生成。不仅如此，生成的代码还能自动复制到剪切板，极大地节省了用户手动复制的时间。当你在论坛回帖、更新网页内容或是装扮 QQ 空间时，只需轻松粘贴代码，原本单调的文字瞬间就能拥有绚丽的渐变色彩，瞬间脱颖而出，为你的表达增添独特魅力，让文字不再平凡，轻松成为视觉焦点。一款可以轻松把一段文字生成渐变颜色代码的绿色软件,当你在软件中输入完要转换的文字后,只需要挑选自己喜欢的起始颜色、结束颜色后,按一下―转换按钮即可生成相应的论坛/网页/QQ空间以及自定义格式代码,并且代码可以自动复制到剪切板中,回帖时直接粘贴代码即可不错得文字代码生成器,让你得文字更加漂亮.

【锂电池剩余寿命预测】Transformer锂电池剩余寿命预测（Matlab完整源码和数据）: 1.【锂电池剩余寿命预测】Transformer锂电池剩余寿命预测（Matlab完整源码和数据） 2.数据集：NASA数据集，已经处理好，B0005电池训练、B0006测试； 3.环境准备：Matlab2023b，可读性强； 4.模型描述：Transformer在各种各样的问题上表现非常出色，现在被广泛使用。 5.领域描述：近年来，随着锂离子电池的能量密度、功率密度逐渐提升，其安全性能与剩余使用寿命预测变得愈发重要。本代码实现了Transformer在该领域的应用。 6.作者介绍：机器学习之心，博客专家认证，机器学习领域创作者，2023博客之星TOP50，主做机器学习和深度学习时序、回归、分类、聚类和降维等程序设计和案例分析，文章底部有博主联系方式。从事Matlab、Python算法仿真工作8年，更多仿真源码、数据集定制私信。

《基于YOLOv8的船舶压载水违规排放监测系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

《基于YOLOv8的港口船舶靠泊角度偏差预警系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

基于android的英语学习记单词软件设计与开发-终稿.zip: Android项目原生java语言课程设计，包含LW+ppt

支持Win7系统的Node 16.3.0版本: 配套文章：https://blog.csdn.net/gust2013/article/details/146909670?spm=1001.2014.3001.5502

《基于YOLOv8的智慧社区儿童游乐设施安全监测系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 《基于YOLOv8的智慧社区儿童游乐设施安全监测系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论