xml文件:在src目录下创建books.xml文件
<?xml version="1.0" encoding="UTF-8"?> <bookstore> <book category="cooking"> <title lang="en">Everyday Italian</title> <author>Giada De Laurentiis</author> <year>2005</year> <price>30.00</price> </book> <book category="children"> <title lang="en">Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price> </book> <book category="web"> <title lang="en">XQuery Kick Start</title> <author>James McGovern</author> <author>Per Bothner</author> <author>Kurt Cagle</author> <author>James Linn</author> <author>Vaidyanathan Nagarajan</author> <year>2003</year> <price>49.99</price> </book> <book category="web"> <title lang="en">Learning XML</title> <author>Erik T. Ray</author> <year>2003</year> <price>39.95</price> </book> </bookstore>
一.读取xml文件
(1)基于光标模型的操作方式
@Test public void test01() { XMLInputFactory factory = XMLInputFactory.newInstance(); InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); // 基于光标模型的操作方式 XMLStreamReader reader = factory.createXMLStreamReader(is); while (reader.hasNext()) { int type = reader.next(); // 判断节点类型是否是开始或者结束或者文本节点,之后根据情况及进行处理 if (type == XMLStreamConstants.START_ELEMENT) { System.out.println("<" + reader.getName() + ">"); } else if (type == XMLStreamConstants.CHARACTERS) { System.out.println(reader.getText().trim()); } else if (type == XMLStreamConstants.END_ELEMENT) { System.out.println("</" + reader.getName() + ">"); } } } catch (XMLStreamException e) { e.printStackTrace(); } finally { try { if (is != null) { is.close(); is = null; } } catch (IOException e) { e.printStackTrace(); } } } @Test public void test02() { XMLInputFactory factory = XMLInputFactory.newInstance(); InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); XMLStreamReader reader = factory.createXMLStreamReader(is); while (reader.hasNext()) { if (reader.next() == XMLStreamConstants.START_ELEMENT) { String name = reader.getName().toString(); if ("book".equals(name)) { System.out.println("属性:" + reader.getAttributeName(0) + "=" + reader.getAttributeValue(0)); } else if ("title".equals(name)) { System.out.print(reader.getElementText() + ":"); } else if ("price".equals(name)) { System.out.print(reader.getElementText() + "\n"); } } } } catch (XMLStreamException e) { e.printStackTrace(); } finally { try { if (is != null) { is.close(); is = null; } } catch (IOException e) { e.printStackTrace(); } } }
运行test01()方法,打印结果:
<bookstore>
<book>
<title>
Everyday Italian
</title>
<author>
Giada De Laurentiis
</author>
<year>
2005
</year>
<price>
30.00
</price>
</book>
<book>
<title>
Harry Potter
</title>
<author>
J K. Rowling
</author>
<year>
2005
</year>
<price>
29.99
</price>
</book>
<book>
<title>
XQuery Kick Start
</title>
<author>
James McGovern
</author>
<author>
Per Bothner
</author>
<author>
Kurt Cagle
</author>
<author>
James Linn
</author>
<author>
Vaidyanathan Nagarajan
</author>
<year>
2003
</year>
<price>
49.99
</price>
</book>
<book>
<title>
Learning XML
</title>
<author>
Erik T. Ray
</author>
<year>
2003
</year>
<price>
39.95
</price>
</book>
</bookstore>
运行test02()方法,打印结果:
属性:category=cooking
Everyday Italian:30.00
属性:category=children
Harry Potter:29.99
属性:category=web
XQuery Kick Start:49.99
属性:category=web
Learning XML:39.95
(2)基于迭代模型的操作方式
@Test public void test03() { XMLInputFactory factory = XMLInputFactory.newInstance(); InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); // 基于迭代模型的操作方式 XMLEventReader reader = factory.createXMLEventReader(is); while (reader.hasNext()) { // 通过XMLEvent来获取是否是某种节点类型 XMLEvent event = reader.nextEvent(); if (event.isStartElement()) { // 通过event.asxxx转换节点 String name = event.asStartElement().getName().toString(); if (name.equals("title")) { System.out.print(reader.getElementText() + ":"); } else if (name.equals("price")) { System.out.print(reader.getElementText() + "\n"); } } } } catch (XMLStreamException e) { e.printStackTrace(); } finally { try { if (is != null) { is.close(); is = null; } } catch (IOException e) { e.printStackTrace(); } } }
打印结果:
Everyday Italian:30.00
Harry Potter:29.99
XQuery Kick Start:49.99
Learning XML:39.95
(3)基于过滤器模型的操作方式
@Test public void test04() { XMLInputFactory factory = XMLInputFactory.newInstance(); InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); // 基于过滤器模型的操作方式,可以有效的过滤掉不用进行操作的节点,效率会高一些 XMLEventReader reader = factory.createFilteredReader(factory.createXMLEventReader(is), new EventFilter() { @Override public boolean accept(XMLEvent event) { // 返回true表示会显示,返回false表示不显示 if (event.isStartElement()) { String name = event.asStartElement().getName().toString(); if (name.equals("title") || name.equals("price")) { return true; } } return false; } }); while (reader.hasNext()) { // 通过XMLEvent来获取是否是某种节点类型 XMLEvent event = reader.nextEvent(); if (event.isStartElement()) { // 通过event.asxxx转换节点 String name = event.asStartElement().getName().toString(); if (name.equals("title")) { System.out.print(reader.getElementText() + ":"); } else if (name.equals("price")) { System.out.print(reader.getElementText() + "\n"); } } } } catch (XMLStreamException e) { e.printStackTrace(); } finally { try { if (is != null) { is.close(); is = null; } } catch (IOException e) { e.printStackTrace(); } } }
打印结果:
Everyday Italian:30.00
Harry Potter:29.99
XQuery Kick Start:49.99
Learning XML:39.95
(4)基于xpath模型的操作方式
@Test public void test05() { InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); // 基于xpath模型的操作方式 // 创建文档处理对象 DocumentBuilder db = DocumentBuilderFactory.newInstance().newDocumentBuilder(); // 通过文档处理对象创建文档对象 Document doc = db.parse(is); // 创建XPath XPath xpath = XPathFactory.newInstance().newXPath(); // 第一个参数就是xpath,第二参数就是文档 NodeList list = (NodeList) xpath.evaluate("//book[@category='web']", doc, XPathConstants.NODESET); for (int i = 0; i < list.getLength(); i++) { // 遍历输出相应的结果 Element e = (Element) list.item(i); System.out.println(e.getElementsByTagName("title").item(0).getTextContent()); } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } catch (XPathExpressionException e) { e.printStackTrace(); } finally { try { if (is != null) { is.close(); is = null; } } catch (IOException e) { e.printStackTrace(); } } }
打印结果:
XQuery Kick Start
Learning XML
二.使用XMLStreamWriter创建xml
// 使用XMLStreamWriter创建xml @Test public void test06() { try { XMLStreamWriter xsw = XMLOutputFactory.newInstance().createXMLStreamWriter(System.out); xsw.writeStartDocument("GB18030", "1.0"); xsw.writeEndDocument(); String ns = "http://stax.test.com/ns"; xsw.writeStartElement("ns", "person", ns); xsw.writeNamespace("ns",ns); xsw.writeStartElement(ns, "id"); xsw.writeCharacters("1"); xsw.writeEndElement(); xsw.writeEndElement(); xsw.flush(); xsw.close(); } catch (XMLStreamException e) { e.printStackTrace(); } catch (FactoryConfigurationError e) { e.printStackTrace(); } }
打印结果:
<?xml version="1.0" encoding="GB18030"?>
<ns:person xmlns:ns="http://stax.test.com/ns">
<ns:id>1</ns:id>
</ns:person>
三.使用Transformer更新xml文件节点信息
// 使用Transformer更新节点信息 @Test public void test07() { InputStream is = null; try { is = TestStax.class.getClassLoader().getResourceAsStream("books.xml"); // 创建文档处理对象 DocumentBuilder db = DocumentBuilderFactory.newInstance().newDocumentBuilder(); // 通过文档处理对象创建文档对象 Document doc = db.parse(is); // 创建XPath XPath xpath = XPathFactory.newInstance().newXPath(); Transformer tf = TransformerFactory.newInstance().newTransformer(); tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); tf.setOutputProperty(OutputKeys.INDENT, "yes"); // 第一个参数就是xpath,第二参数就是文档 NodeList list = (NodeList) xpath.evaluate("//book[title='Learning XML']", doc, XPathConstants.NODESET); // 获取price节点 Element e = (Element) list.item(0); e.getElementsByTagName("price").item(0).setTextContent("333.9"); // 通过tranformer修改节点 tf.transform(new DOMSource(doc), new StreamResult(System.out)); } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } catch (XPathExpressionException e) { e.printStackTrace(); } catch (TransformerConfigurationException e) { e.printStackTrace(); } catch (TransformerFactoryConfigurationError e) { e.printStackTrace(); } catch (TransformerException e) { e.printStackTrace(); } finally { try { if (is != null) is.close(); } catch (IOException e) { e.printStackTrace(); } } }
运行结果:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<bookstore>
<book category="cooking">
<title lang="en">Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>30.00</price>
</book>
<book category="children">
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
<book category="web">
<title lang="en">XQuery Kick Start</title>
<author>James McGovern</author>
<author>Per Bothner</author>
<author>Kurt Cagle</author>
<author>James Linn</author>
<author>Vaidyanathan Nagarajan</author>
<year>2003</year>
<price>49.99</price>
</book>
<book category="web">
<title lang="en">Learning XML</title>
<author>Erik T. Ray</author>
<year>2003</year>
<price>333.9</price>
</book>
</bookstore>
相关推荐
在读取XML文件后,可以通过DOM提供的API进行修改,如`Element`的`setTextContent`、`setAttribute`等方法。修改完成后,需使用`Transformer`将`Document`对象转换回XML字符串,保存到文件。 8. **XPath和XSLT** ...
本文将详细介绍如何使用Java来读取和修改XML文件,主要涉及以下几个核心知识点: 1. **DOM解析器**: Document Object Model(DOM)是一种将XML文档转换为内存中的树形结构的方法,使得可以遍历和修改XML文件。...
StAX是一种用于读取和写入XML数据的事件驱动型API,特别适合于处理大型XML文件或在内存有限的情况下进行XML处理。 #### 二、StAX概述 StAX的核心优势在于它能够以流式方式处理XML文档,即逐个事件地读取和写入XML...
要读取XML文件,Java提供了多种方法。以下是四种常用的方法,每种都有其适用场景和特点: 1. **DOM解析器(Document Object Model)** DOM解析器将整个XML文件加载到内存中,创建一个树形结构,允许我们通过节点...
在Kettle中,XML Input Stream (StAX) 转换步骤允许我们逐个读取XML文档的事件,而不是一次性加载整个文档到内存中。这尤其适合处理大型XML文件,因为它避免了内存不足的问题。以下是如何在Kettle中设置和使用XML ...
除了读取XML文档之外,StAX还支持创建和写入XML文档。这通常通过`XMLStreamWriter`接口实现。`XMLStreamWriter`提供了许多方法来构建XML文档,例如`writeStartElement(String localName)`、`writeEndElement()`、`...
首先,使用StAX逐个读取XML事件,然后利用JAXB将这些事件转换为Java对象,从而实现高效且内存友好的XML解析。 下面是一些关键知识点: 1. **StAX解析流程**: - 创建XMLInputFactory实例,这是解析XML的起点。 -...
在给定的场景中,我们主要关注如何使用Java来读取XML文件并根据需求生成新的文件。以下是关于这个主题的详细说明。 首先,Java中的`javax.xml.parsers`和`org.w3c.dom`包提供了处理XML的基本工具。`javax.xml....
总结一下,Java 提供了多种方式来读取和处理 XML 文件,包括 JAXB、DOM、SAX 和 StAX。对于 XML 的结构验证,可以选择使用 DTD 或 XSD。理解这些概念和使用方法对于进行有效的 XML 处理至关重要。在实践中,你需要...
StAX是一种基于流的解析器,允许开发者按需读取XML文档,可以向前移动,但不能回溯。它比SAX更灵活,也更节省内存。 - 优点:内存效率高,编程更灵活。 - 缺点:需要更多的代码来实现相同功能。 - 示例代码: ```...
kettle 解析xml数据,xml多层分组嵌套,xml stax方法,完整解析案例使用(包含xml文件以及ktr文件)。ETL大数据迁移,数据清洗。XML Input Stream (StAX) 方法
在读取XML文件时,我们需要解析这些节点来获取数据。在Windows环境下,通常会使用微软提供的MSXML库(Microsoft XML Core Services),它包含了处理XML文档的一系列接口,如IXMLDOMDocument,IXMLDOMNode等。 1. **...
本教程将详细讲解如何在编程环境中读取XML文件。 1. XML文件的结构 XML文件由元素(Elements)、属性(Attributes)、文本内容(Text Content)和命名空间(Namespaces)等构成。元素是XML的基本构建块,它们通过尖...
在Java编程中,处理XML文件是常见的需求,包括创建XML文件、读取XML文件以及解析XML内容。下面将详细介绍Java如何进行XML文件的操作。 一、Java写XML文件 1. 使用DOM(Document Object Model)API: DOM是W3C推荐...
JDOM,全称为Java Document Object Model,是一种专为Java设计的XML处理API,它提供了对XML文档结构的完整映射,使得我们可以方便地创建、读取和修改XML文件。下面将详细介绍如何使用JDOM来读取XML文件。 首先,...
DOM解析器将整个XML文件加载到内存中,形成一个树形结构,允许开发者通过节点操作来访问和修改XML文档。这种方式的优点在于方便、直观,但缺点是占用内存较大,不适用于处理大型XML文件。 首先,我们需要了解XML的...
接着,创建一个Service类,使用Spring的`@Autowired`注解注入UserMapper,然后编写读取XML和插入数据库的方法。在这个方法中,遍历XML文档的节点,根据节点内容创建User对象,并调用Mapper的`insertUser`方法将其...
本篇文章将深入探讨如何使用Pull解析器来读取XML文件,以及如何生成XML文件。Pull解析器是一种轻量级的解析方式,它允许程序在解析XML时按需获取数据,而不需要一次性加载整个文档到内存,从而提高了效率和资源利用...
本教程将重点介绍如何使用SAXReader在Java中读取XML文件。 SAXReader是JDOM库中的一个类,它实现了SAX解析器接口,适用于处理大型XML文档,因为它不会将整个XML文档加载到内存中,而是采用事件驱动的方式,逐个处理...
四、XML修改 DOM模型提供了一种方便的方式来修改XML文档。例如,添加一个新的元素: ```java Element newNode = doc.createElement("author"); newNode.setTextContent("John Doe"); doc.getDocumentElement()....