`
huibin
  • 浏览: 750526 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

用XPath 表达式从 XML 文档中提取信息

    博客分类:
  • XML
阅读更多
package test;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;

import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class News {
	public static void main(String[] args) throws XPathExpressionException, ParserConfigurationException, SAXException, IOException {
		String uri = "src/news.xml";
		// 读取所有div节点的xpath
		// String expression="//div";
		// 读取newname=”军事新闻”的div节点的id属性的xpath
		// String expression="//div[@newname='军事新闻']";
		// 读取倒数第二个div节点的xpath
		// String expression="root/p/div[last()-1]";
		// 读取orders大于3且newtype=”0”的div节点的xpath
		String expression = "//div[@orders>3 and @newtype=0]";
		print(getNodeList(uri, expression));
	}
	
	static NodeList getNodeList(String uri,String expression)  throws ParserConfigurationException, SAXException,  IOException, XPathExpressionException {
		 DocumentBuilderFactory domFactory = DocumentBuilderFactory.newInstance();
		    domFactory.setNamespaceAware(true); // never forget this!
		    DocumentBuilder builder = domFactory.newDocumentBuilder();
		    Document doc = builder.parse(uri);
		    XPathFactory factory = XPathFactory.newInstance();
		    XPath xpath = factory.newXPath();
		    XPathExpression expr = xpath.compile(expression);
		    Object result = expr.evaluate(doc, XPathConstants.NODESET);
		    return (NodeList) result;
	}
	static void print(NodeList nodes){
		for (int i = 0; i < nodes.getLength(); i++) {
	        System.out.println(nodes.item(i).getNodeName()); 
	    }
	}
}

 

news.xml:

 

<?xml version="1.0" encoding="utf-8"?>
<root>
	<p>
		<div id="1" newname="业界新闻" newtype="1" orders="1" comment="" />
		<div id="2" newname="汽车新闻" newtype="0" orders="2" comment="" />
		<div id="3" newname="军事新闻" newtype="1" orders="3" comment="">
			军事新闻备注</div>
		<div id="4" newname="法制新闻" newtype="1" orders="4" />
		<div id="5" newname="房产新闻" newtype="0" orders="5" />
		<div id="6" newname="其他新闻" newtype="0" orders="6" comment="" />
	</p>
</root>

 

Java 语言的 XPath API:http://www.ibm.com/developerworks/cn/xml/x-javaxpathapi.html

分享到:
评论

相关推荐

    xpath表达式测试小工具

    XPath表达式则是用于定位XML文档中的元素、属性、文本等节点的语句。这款“XPath表达式测试小工具”显然是为了帮助开发者和XML爱好者更方便地测试和验证XPath表达式的正确性。 在XML文档中,XPath表达式可以用来...

    Java中使用xpath获取xml中的数据

    在实际应用中,可以根据需求灵活地构造XPath表达式,以高效地提取XML文档中的信息。记住,XPath是XML处理中的强大工具,合理使用能大大提高开发效率。在处理大型XML文档时,使用XPath配合Java进行数据提取,可以避免...

    Xpath 表达式教程

    XPath(XML Path Language)是一种在XML文档中查找信息的语言,它允许开发者通过路径表达式来选取XML文档中的节点,如元素、属性、文本等。XPath基于XML的树状结构,类似于文件系统中的路径定位文件,但XML文档中的...

    从XML文件抽出XPath - C and C++

    XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点,如元素、属性、文本等。XPath使用路径表达式来选取节点,类似于我们在网页浏览器中输入URL来访问特定页面的方式...

    表达式验证1.0[正则,xpath测试]

    XPath,另一方面,是XML文档的导航语言,用于选取XML文档中的节点,如元素、属性和文本。在XML数据处理中,XPath的强大之处在于能高效地定位到所需信息。在"表达式验证1.0"中,开发者可以输入XPath表达式,结合XML...

    用XSLT和Xpath查询XML文档.doc

    XPath表达式可以定位XML文档中的节点,如元素、属性、文本等,并可以执行算术运算、字符串操作和逻辑判断。 4. **XSLT:XML样式表语言** XSLT用于转换XML文档,它可以将XML文档转换成其他格式,如HTML、PDF,或者...

    正则表达式+xml

    结合提供的`RegexTool`文件,这可能是一款集成了正则表达式验证和XML操作功能的工具,用户可以利用它来测试正则表达式,或者处理XML文档,比如验证XML的结构、提取XML数据等。这样的工具对于开发者来说非常实用,...

    xpath表达式说明

    根据提供的文件信息,我们可以了解到XPath表达式的几个重要知识点: 1.XPath路径表达式的基本概念 XPath使用路径表达式来选取XML文档中的节点或者节点集。基本的XPath表达式包含有nodename,它用于选取所有特定的子...

    xpath表达式基本格式

    XPath 表达式是选择 XML 文件中节点的方法,节点是 XML 文件的最小构成单位,分为 7 种:element(元素节点)、attribute(属性节点)、text (文本节点)、namespace (名称空间节点)、processing-instruction ...

    无涯教程(LearnFk)-Xpath教程完整离线版.pdf

    XPath表达式使用路径表达式来选择XML文档中的节点或节点列表,它可以支持非常灵活和丰富的查询需求。结构定义部分定义了XML文档的各个部分,例如元素、属性、文本、名称空间、处理指令、注释和文档节点。 XPath提供...

    xmlquery:xmlquery是用于XML查询的Golang XPath软件包

    XML查询总览xmlquery是用于XML文档的XPath查询包,允许您使用XPath表达式从XML文档中提取数据或评估。 xmlquery具有内置的查询对象缓存功能,可以缓存最近使用的XPATH查询字符串。 启用缓存可以避免为每个查询重新...

    xpath表达式完整实例

    Xpath使用路径表达式来选择XML文档中的节点: - **路径表达式**:类似于文件系统的路径,用于定位文档中的节点。 - **斜杠(/)**:路径内部的分割符。 - **绝对路径**:使用“/”起始,从根节点开始。 - **相对...

    Demo4j和XPath解析XML的文件路径表达式(ZVON.org - X 路径教程)

    通过理解XPath的基本语法和使用DOM4J的API,开发者能够高效地导航XML文档,提取所需的数据,从而提高XML处理的效率和灵活性。在实际项目中,XPath不仅可以用于简单的查询,还能在XML验证、转换和数据绑定等方面发挥...

    如何使用XPath提取xml文档数据

    在上面的代码中,我们使用Dom4j库的SAXReader类来读取XML文档,然后使用XPath表达式"//price"来选择所有price元素,最后输出每个元素的文本值。 小结 XPath是一种强大的查询语言,广泛应用于XML文档数据的提取和...

    XMLDOM T-SQL XPath 正则表达式等CHM格式学习文档

    XPath(XML Path Language)是一种在XML文档中查找信息的语言,主要用于选取XML文档中的节点,如元素、属性、文本等。XPath使用路径表达式来选取节点,类似于文件系统的路径。此外,XPath还提供了函数库,用于对节点...

    行业分类-设备装置-一种XML路径表达式提取方法及装置.zip

    本技术主题聚焦于“一种XML路径表达式提取方法及装置”,这通常涉及到如何高效地从复杂的XML文档中定位并提取特定的数据。 XML路径表达式,也称为XPath,是XML解析中的一个重要概念。XPath允许开发者通过路径导航来...

Global site tag (gtag.js) - Google Analytics