`
donnki
  • 浏览: 45937 次
  • 性别: Icon_minigender_1
  • 来自: 火星
文章分类
社区版块
存档分类
最新评论

自己写的一个小巧简单的通用XML解析器,访问值有点类似XPATH~

XML 
阅读更多
话说好久没写JAVA代码了……
最近一个项目server/client间用XML传数据,server是java的,我嫌XPATH太臃肿,故而花了点时间自己实现一个通用XML解析器,不知道算不算重复造个轮子。

优点:只访问解析一次XML,每次拿数据时都是从HashMap中取。

没测试大XML文件。有需要的话到时候改成SAX等方式去解析好了。

用法:
<RootNode rAttr1='root_attr_1' rAttr2='root_attr2'>
 <other property='other prop'>123</other>
 <other property='other2 prop'>456</other>
 <level1 attr='level1_attr1'>1111111</level1>
 <level1 attr='level1_attr2'>1111111</level1>
 <level1 attr='level1_attr3'>22222</level1>
 <level1 attr='level1_attr4' attr2='test'>
   <level2 attr='l2_attr1'>
     <level3><![CDATA[<mytest>]]></level3>
   </level2>
  </level1>
</RootNode>

可以通过parser.getNodeValue("/RootNode#0/level1#3/level2#0/level3#0")或者parser.getNodeValue("/RootNode/level1#3/level2/level3")访问到值mytest(路径中#0可写可不写)
通过路径/RootNode/level1#1@attr可以访问到值level1_attr2
通过路径/RootNode/level3#1@attr2可以访问到值test
通过parser.getNodeCount("/RootNode/level1")可以返回level1的结点数是4。

代码如下:
package parser;

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
/**
 * @author Russell.Loy, 
 * @version 0.1
 */
public class MyXMLParser   {

	private DocumentBuilder documentBuilder;
	String currentPath;
	Map<String, String> map;
	Map<String, Integer> countMap;

	private static MyXMLParser parserInstance;
	
	public static MyXMLParser getInstance() {
		if (parserInstance == null) {
			parserInstance = new MyXMLParser();
		}
		return parserInstance;
	}

	private MyXMLParser() {
		DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory
				.newInstance();
		map = new HashMap<String, String>();
		countMap = new HashMap<String, Integer>();
		try {
			documentBuilder = documentBuilderFactory.newDocumentBuilder();
		} catch (ParserConfigurationException e) {
			e.printStackTrace();
		}
	}

	private void parseDocument(String xmlString) {
		Document doc = null;
		map.clear();
		countMap.clear();
		try {
			doc = documentBuilder.parse(new ByteArrayInputStream(xmlString
					.getBytes("UTF-8")));

			Element root = doc.getDocumentElement();
			currentPath = "/" + root.getNodeName() + "#0";
			if (root.getNodeValue() != null) {
				map.put(currentPath, root.getNodeValue());
			}
			parseNode(root, currentPath);
		} catch (SAXException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	private void parseNode(Node e, String path) {
		NamedNodeMap attrs = e.getAttributes();
		if (attrs != null) {
			for (int i = 0; i < attrs.getLength(); i++) {
				map.put(path + "@" + attrs.item(i).getNodeName(), attrs.item(i)
						.getNodeValue());
			}
		}

		NodeList list = e.getChildNodes();
		if (list != null) {
			for (int i = 0; i < list.getLength(); i++) {
				Node node = list.item(i);
				if (e.getNodeValue() == null) {
					if (node.getNodeValue() != null) { /* text node */
						map.put(path, node.getNodeValue());
					}
				}
				if (countMap.containsKey(path + "/" + node.getNodeName())) {
					countMap.put(path + "/" + node.getNodeName(),
							countMap.get(path + "/" + node.getNodeName()) + 1);
				} else {
					countMap.put(path + "/" + node.getNodeName(), 0);
				}
				parseNode(node, path + "/" + node.getNodeName() + "#"
						+ countMap.get(path + "/" + node.getNodeName()));
			}
		}
	}
	
	
	public void parse(String xmlString) {
		parseDocument(xmlString);
	}

	
	public int getNodeCount(String path) {
		Integer i = countMap.get(path) == null ? countMap.get(formatPath(path, true))
				: countMap.get(path);
		return i == null ? 0 : i + 1;
	}


	public static String formatPath(String path, boolean isGetCount) {
		String t = path.replaceFirst("^/", "");
		t = t.replaceAll("/", "#0/").replaceAll("(#\\d+)#0\\/", "$1/");
		t = t.replaceAll("@", "#0@").replaceAll("(#\\d+)#0@", "$1@");
		if (!t.contains("@") && !t.matches(".*#\\d+$") && !isGetCount) {
			t += "#0";
		}		
		return "/" + t;
	}

	public String getNodeValue(String path) {
		return map.get(path) == null ? map.get(formatPath(path, false)) : map
				.get(path);
	}
	
	private void debug(){
		for (Map.Entry<String, String> entry : map.entrySet()) {
			System.out.println(entry.getKey() + ": " + entry.getValue());
		}
		System.out.println("~~~~~~~");
		for (Map.Entry<String, Integer> entry : countMap.entrySet()) {
			System.out.println(entry.getKey() + ": " + entry.getValue());
		}
	}
	public static void main(String[] args) throws Exception {
		MyXMLParser parser = new MyXMLParser();
		String xml = new String("<RootNode rAttr1='root_attr_1' rAttr2='root_attr2'>"
				+ "<other property='other prop'>123</other>"
				+ "<other property='other prop'>456</other>"
				+ "<level1 attr='level1_attr1'>"
				+ "1111111"
				+ "</level1>"
				+ "<level1 attr='level1_attr2'>"
				+ "中文"
				+ "</level1>"
				+ "<level1 attr='level1_attr3'>"
				+ "22222"
				+ "</level1>"
				+ "<level1 attr='level1_attr4' attr2='test'>"
				+ "<level2 attr='l2_attr1'><level3><![CDATA[<mytest>]]></level3></level2>"
				+ "</level1>" + "</RootNode>");
		// System.out.println(xml);
		parser.parse(xml);
		
		System.out.println("RootNode/level1 COUNT:" + parser.getNodeCount("/RootNode/level1"));
		for (int i = 0; i < parser.getNodeCount("/RootNode/level1"); i++) {
			System.out.println("~~"
					+ parser.getNodeValue("/RootNode/level1#" + i + ""));
		}
		System.out.println( parser.getNodeValue("/RootNode/level1#" + 3 + "/level2/level3"));
		System.out.println(parser.getNodeValue("/RootNode/level1#1@attr"));
		
		//----another xml test-----
		
		 parser.parse("<another><test1 attr='mytest'>hello</test1><test1>world</test1></another>");
		 System.out.println(parser.getNodeValue("/RootNode/level1#3/level2/level3"));
		 System.out.println(parser.getNodeValue("/another/test1#0@attr"));
		 System.out.println(parser.getNodeValue("/another/test1#1"));
		 System.out.println(parser.getNodeCount("/another/test1"));
	
	}

}

1
0
分享到:
评论

相关推荐

    pugixml, 带有XPath支持的C++的轻量级简单和快速XML解析器.zip

    pugixml, 带有XPath支持的C++的轻量级简单和快速XML解析器 pugixml pugixml是一个 C++ XML处理库,由具有丰富遍历/修改功能的DOM和基于XML的超快速XML解析器组成,用于构造XML树和复杂的数据驱动树查询的XPath 1.0...

    XML解析包xPath

    xPath.jar,XML解析包。XPath是获取xml中数据的一种方式,其简单语法易用。

    比较通用的xml解析方法

    DOM解析器会创建一个完整的XML文档对象模型,允许开发者通过节点层级来访问和修改XML内容。在Java中,我们可以使用JAXB(Java Architecture for XML Binding)或DOM4J库来实现DOM解析。例如,使用DOM4J解析XML文件...

    (第十章)一个xml解析器和构造器

    1. DOM解析器:DOM解析器将整个XML文档加载到内存中,创建一个树形结构,称为DOM树。这种解析方式允许开发者通过遍历树来访问和修改文档的任何部分,但消耗的内存资源较多,适合小型或中型XML文件。 2. SAX解析器:...

    c语言xml解析器, 支持xpath语法.zip

    本项目提供的是一款C语言实现的XML解析器,特别之处在于它还支持XPath(XML Path Language)语法。 XPath是一种在XML文档中查找信息的语言,通过它可以方便地选取节点、计算节点集、测试节点属性等。XPath表达式...

    XML通用解析工具类

    1. DOM解析器:它将整个XML文档加载到内存中,形成一个树形结构,允许开发者随机访问任何部分。优点是方便操作,缺点是对大文件内存消耗较大。 2. SAX解析器:采用事件驱动的方式,逐行读取XML,只在遇到特定元素时...

    pugixml, 带有XPath支持的C 的轻量级简单和快速XML解析器.zip

    pugixml, 带有XPath支持的C 的轻量级简单和快速XML解析器 pugixml pugixml是一个 C XML处理库,由具有丰富遍历/修改功能的DOM和基于XML的超快速XML解析器组成,用于构造XML树和复杂的数据驱动树查询的XPath 1.0实现...

    xml解析笔记(dom,xpath,xquery等)

    DOM是W3C推荐的一种XML文档的API,它将XML文档视为一个树形结构,每个节点代表XML文档的一个部分。DOM解析器会一次性加载整个XML文档到内存,然后通过节点操作进行访问和修改。这种方式适合处理小到中型的XML文档,...

    解析xml文件并且保存xpath

    博文链接中的资源可能包含了一个实现XML解析和XPath选取的示例代码。通过阅读和理解这些源码,可以深入理解XML解析和XPath的工作原理,这对于进行自定义处理或优化性能很有帮助。 七、工具支持 除了编程语言内置的...

    XPathUtil,根据Xpath解析xml文件

    之前找了好多感觉和自己的需求不太一样,这个可以根据Xpath解析出来xml里所有的信息,十分好用 举个例子 xmlPath = "E://upload/xml/1580242.163.xml"; XPathUtil util = XPathUtil.newInstance(xmlPath); Product ...

    Dom,Sax,Xpath解析XML实例

    在处理XML时,我们通常会使用三种主要的解析方式:DOM(Document Object Model)、SAX(Simple API for XML)和XPath(XML Path Language)。下面将详细介绍这三种解析方法,并结合实例进行讲解。 1. DOM解析: DOM...

    xpath解析xml

    总的来说,XPath是XML解析的重要工具,它使得在XML文档中寻找和操作数据变得简单而直观。结合Map集合,XPath可以帮助我们更加灵活地处理XML数据,减少Java代码的复杂性。理解并熟练掌握XPath的使用,对于任何处理XML...

    js中使用xpath来解析xml元素实用.pdf

    例如,`XMLDocument.prototype.selectNodes`方法首先创建一个命名空间解析器,然后使用`evaluate()`方法执行XPath表达式,得到一个结果集,再将结果集转换为数组返回。`XMLDocument.prototype.selectSingleNode`方法...

    支持xpath的高效xml解析库源代码

    PUGIXML是一个强大的XML解析库,它的XPath支持和高性能使其成为C++开发者的理想选择。通过深入理解和熟练运用PUGIXML,开发者可以更高效地处理XML数据,提高项目质量和开发效率。无论是解析大型XML文档,还是进行...

    Xpath 解析xml文件转化为csv文件

    在"tests2csv"这个例子中,很可能是一个测试项目,包含了一些XML文件,目标是将这些XML文件中的数据用XPath选取出来并转化为CSV格式。这可能涉及到多个XML文件的处理,以及对不同XML结构的理解和适配。 总结一下,...

    基于Xpath的xml文件查询和更新

    更新XML文件通常涉及DOM(Document Object Model)解析,将XML文件加载到内存中形成一个可操作的树形结构。例如,使用Python的`lxml`库: ```python from lxml import etree # 加载XML tree = etree.parse('...

    从XML文件抽出XPath - C and C++

    libxml2是一个功能强大的XML解析库,它提供了XPath API,可以直接在XML文档上执行XPath查询。使用libxml2时,我们需要先用`xmlParseDoc()`解析XML,得到`xmlDocPtr`,然后调用`xmlXPathNewContext()`创建XPath上下文...

    mybatis入门之xpath解析xml

    因此,无论是XML解析还是MyBatis的使用,XPath都是一个不可或缺的知识点,对于初学者来说,掌握XPath的入门知识是迈入这个领域的第一步。通过实际的练习和项目实践,可以进一步提升对XPath和MyBatis的运用能力。

    xpath读取XML节点

    在Java编程中,JDOM库是一个流行的解析和操作XML的工具,它提供了对XPath的支持,使得我们可以方便地通过XPath表达式来读取XML文档的节点。 首先,理解XPath的基本语法是非常重要的。XPath表达式由路径表达式组成,...

Global site tag (gtag.js) - Google Analytics