话说好久没写JAVA代码了……
最近一个项目server/client间用XML传数据,server是java的,我嫌XPATH太臃肿,故而花了点时间自己实现一个通用XML解析器,不知道算不算重复造个轮子。
优点:只访问解析一次XML,每次拿数据时都是从HashMap中取。
没测试大XML文件。有需要的话到时候改成SAX等方式去解析好了。
用法:
<RootNode rAttr1='root_attr_1' rAttr2='root_attr2'>
<other property='other prop'>123</other>
<other property='other2 prop'>456</other>
<level1 attr='level1_attr1'>1111111</level1>
<level1 attr='level1_attr2'>1111111</level1>
<level1 attr='level1_attr3'>22222</level1>
<level1 attr='level1_attr4' attr2='test'>
<level2 attr='l2_attr1'>
<level3><![CDATA[<mytest>]]></level3>
</level2>
</level1>
</RootNode>
可以通过parser.getNodeValue("/RootNode#0/level1#3/level2#0/level3#0")或者parser.getNodeValue("/RootNode/level1#3/level2/level3")访问到值mytest(路径中#0可写可不写)
通过路径/RootNode/level1#1@attr可以访问到值level1_attr2
通过路径/RootNode/level3#1@attr2可以访问到值test
通过parser.getNodeCount("/RootNode/level1")可以返回level1的结点数是4。
代码如下:
package parser;
import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
/**
* @author Russell.Loy,
* @version 0.1
*/
public class MyXMLParser {
private DocumentBuilder documentBuilder;
String currentPath;
Map<String, String> map;
Map<String, Integer> countMap;
private static MyXMLParser parserInstance;
public static MyXMLParser getInstance() {
if (parserInstance == null) {
parserInstance = new MyXMLParser();
}
return parserInstance;
}
private MyXMLParser() {
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory
.newInstance();
map = new HashMap<String, String>();
countMap = new HashMap<String, Integer>();
try {
documentBuilder = documentBuilderFactory.newDocumentBuilder();
} catch (ParserConfigurationException e) {
e.printStackTrace();
}
}
private void parseDocument(String xmlString) {
Document doc = null;
map.clear();
countMap.clear();
try {
doc = documentBuilder.parse(new ByteArrayInputStream(xmlString
.getBytes("UTF-8")));
Element root = doc.getDocumentElement();
currentPath = "/" + root.getNodeName() + "#0";
if (root.getNodeValue() != null) {
map.put(currentPath, root.getNodeValue());
}
parseNode(root, currentPath);
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
private void parseNode(Node e, String path) {
NamedNodeMap attrs = e.getAttributes();
if (attrs != null) {
for (int i = 0; i < attrs.getLength(); i++) {
map.put(path + "@" + attrs.item(i).getNodeName(), attrs.item(i)
.getNodeValue());
}
}
NodeList list = e.getChildNodes();
if (list != null) {
for (int i = 0; i < list.getLength(); i++) {
Node node = list.item(i);
if (e.getNodeValue() == null) {
if (node.getNodeValue() != null) { /* text node */
map.put(path, node.getNodeValue());
}
}
if (countMap.containsKey(path + "/" + node.getNodeName())) {
countMap.put(path + "/" + node.getNodeName(),
countMap.get(path + "/" + node.getNodeName()) + 1);
} else {
countMap.put(path + "/" + node.getNodeName(), 0);
}
parseNode(node, path + "/" + node.getNodeName() + "#"
+ countMap.get(path + "/" + node.getNodeName()));
}
}
}
public void parse(String xmlString) {
parseDocument(xmlString);
}
public int getNodeCount(String path) {
Integer i = countMap.get(path) == null ? countMap.get(formatPath(path, true))
: countMap.get(path);
return i == null ? 0 : i + 1;
}
public static String formatPath(String path, boolean isGetCount) {
String t = path.replaceFirst("^/", "");
t = t.replaceAll("/", "#0/").replaceAll("(#\\d+)#0\\/", "$1/");
t = t.replaceAll("@", "#0@").replaceAll("(#\\d+)#0@", "$1@");
if (!t.contains("@") && !t.matches(".*#\\d+$") && !isGetCount) {
t += "#0";
}
return "/" + t;
}
public String getNodeValue(String path) {
return map.get(path) == null ? map.get(formatPath(path, false)) : map
.get(path);
}
private void debug(){
for (Map.Entry<String, String> entry : map.entrySet()) {
System.out.println(entry.getKey() + ": " + entry.getValue());
}
System.out.println("~~~~~~~");
for (Map.Entry<String, Integer> entry : countMap.entrySet()) {
System.out.println(entry.getKey() + ": " + entry.getValue());
}
}
public static void main(String[] args) throws Exception {
MyXMLParser parser = new MyXMLParser();
String xml = new String("<RootNode rAttr1='root_attr_1' rAttr2='root_attr2'>"
+ "<other property='other prop'>123</other>"
+ "<other property='other prop'>456</other>"
+ "<level1 attr='level1_attr1'>"
+ "1111111"
+ "</level1>"
+ "<level1 attr='level1_attr2'>"
+ "中文"
+ "</level1>"
+ "<level1 attr='level1_attr3'>"
+ "22222"
+ "</level1>"
+ "<level1 attr='level1_attr4' attr2='test'>"
+ "<level2 attr='l2_attr1'><level3><![CDATA[<mytest>]]></level3></level2>"
+ "</level1>" + "</RootNode>");
// System.out.println(xml);
parser.parse(xml);
System.out.println("RootNode/level1 COUNT:" + parser.getNodeCount("/RootNode/level1"));
for (int i = 0; i < parser.getNodeCount("/RootNode/level1"); i++) {
System.out.println("~~"
+ parser.getNodeValue("/RootNode/level1#" + i + ""));
}
System.out.println( parser.getNodeValue("/RootNode/level1#" + 3 + "/level2/level3"));
System.out.println(parser.getNodeValue("/RootNode/level1#1@attr"));
//----another xml test-----
parser.parse("<another><test1 attr='mytest'>hello</test1><test1>world</test1></another>");
System.out.println(parser.getNodeValue("/RootNode/level1#3/level2/level3"));
System.out.println(parser.getNodeValue("/another/test1#0@attr"));
System.out.println(parser.getNodeValue("/another/test1#1"));
System.out.println(parser.getNodeCount("/another/test1"));
}
}
分享到:
相关推荐
pugixml, 带有XPath支持的C++的轻量级简单和快速XML解析器 pugixml pugixml是一个 C++ XML处理库,由具有丰富遍历/修改功能的DOM和基于XML的超快速XML解析器组成,用于构造XML树和复杂的数据驱动树查询的XPath 1.0...
xPath.jar,XML解析包。XPath是获取xml中数据的一种方式,其简单语法易用。
DOM解析器会创建一个完整的XML文档对象模型,允许开发者通过节点层级来访问和修改XML内容。在Java中,我们可以使用JAXB(Java Architecture for XML Binding)或DOM4J库来实现DOM解析。例如,使用DOM4J解析XML文件...
1. DOM解析器:DOM解析器将整个XML文档加载到内存中,创建一个树形结构,称为DOM树。这种解析方式允许开发者通过遍历树来访问和修改文档的任何部分,但消耗的内存资源较多,适合小型或中型XML文件。 2. SAX解析器:...
本项目提供的是一款C语言实现的XML解析器,特别之处在于它还支持XPath(XML Path Language)语法。 XPath是一种在XML文档中查找信息的语言,通过它可以方便地选取节点、计算节点集、测试节点属性等。XPath表达式...
pugixml, 带有XPath支持的C 的轻量级简单和快速XML解析器 pugixml pugixml是一个 C XML处理库,由具有丰富遍历/修改功能的DOM和基于XML的超快速XML解析器组成,用于构造XML树和复杂的数据驱动树查询的XPath 1.0实现...
DOM是W3C推荐的一种XML文档的API,它将XML文档视为一个树形结构,每个节点代表XML文档的一个部分。DOM解析器会一次性加载整个XML文档到内存,然后通过节点操作进行访问和修改。这种方式适合处理小到中型的XML文档,...
博文链接中的资源可能包含了一个实现XML解析和XPath选取的示例代码。通过阅读和理解这些源码,可以深入理解XML解析和XPath的工作原理,这对于进行自定义处理或优化性能很有帮助。 七、工具支持 除了编程语言内置的...
1. DOM解析器:它将整个XML文档加载到内存中,形成一个树形结构,允许开发者随机访问任何部分。优点是方便操作,缺点是对大文件内存消耗较大。 2. SAX解析器:采用事件驱动的方式,逐行读取XML,只在遇到特定元素时...
之前找了好多感觉和自己的需求不太一样,这个可以根据Xpath解析出来xml里所有的信息,十分好用 举个例子 xmlPath = "E://upload/xml/1580242.163.xml"; XPathUtil util = XPathUtil.newInstance(xmlPath); Product ...
在处理XML时,我们通常会使用三种主要的解析方式:DOM(Document Object Model)、SAX(Simple API for XML)和XPath(XML Path Language)。下面将详细介绍这三种解析方法,并结合实例进行讲解。 1. DOM解析: DOM...
总的来说,XPath是XML解析的重要工具,它使得在XML文档中寻找和操作数据变得简单而直观。结合Map集合,XPath可以帮助我们更加灵活地处理XML数据,减少Java代码的复杂性。理解并熟练掌握XPath的使用,对于任何处理XML...
例如,`XMLDocument.prototype.selectNodes`方法首先创建一个命名空间解析器,然后使用`evaluate()`方法执行XPath表达式,得到一个结果集,再将结果集转换为数组返回。`XMLDocument.prototype.selectSingleNode`方法...
PUGIXML是一个强大的XML解析库,它的XPath支持和高性能使其成为C++开发者的理想选择。通过深入理解和熟练运用PUGIXML,开发者可以更高效地处理XML数据,提高项目质量和开发效率。无论是解析大型XML文档,还是进行...
在"tests2csv"这个例子中,很可能是一个测试项目,包含了一些XML文件,目标是将这些XML文件中的数据用XPath选取出来并转化为CSV格式。这可能涉及到多个XML文件的处理,以及对不同XML结构的理解和适配。 总结一下,...
更新XML文件通常涉及DOM(Document Object Model)解析,将XML文件加载到内存中形成一个可操作的树形结构。例如,使用Python的`lxml`库: ```python from lxml import etree # 加载XML tree = etree.parse('...
libxml2是一个功能强大的XML解析库,它提供了XPath API,可以直接在XML文档上执行XPath查询。使用libxml2时,我们需要先用`xmlParseDoc()`解析XML,得到`xmlDocPtr`,然后调用`xmlXPathNewContext()`创建XPath上下文...
因此,无论是XML解析还是MyBatis的使用,XPath都是一个不可或缺的知识点,对于初学者来说,掌握XPath的入门知识是迈入这个领域的第一步。通过实际的练习和项目实践,可以进一步提升对XPath和MyBatis的运用能力。
在Java编程中,JDOM库是一个流行的解析和操作XML的工具,它提供了对XPath的支持,使得我们可以方便地通过XPath表达式来读取XML文档的节点。 首先,理解XPath的基本语法是非常重要的。XPath表达式由路径表达式组成,...