`
zljpp
  • 浏览: 260052 次
社区版块
存档分类
最新评论

lucene-解析xml

阅读更多
1、安装DOM4j
http://www.dom4j.org/
2、安装jaxen
http://jaxen.org/releases.html
3、代码
package extract;
import java.io.*;
import org.dom4j.*;
import org.dom4j.io.*;
import java.util.*;
public class XmlExtract {
private SAXReader reader;
private Document document;

/**
* @param args
*/
public XmlExtract(){
reader=new SAXReader();
try {
document=reader.read(new File("./htmls/abcde.xml"));
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
@SuppressWarnings("unchecked")
public void exxml(String path){ 
if (document==null) return; 
List l=document.selectNodes(path);
System.out.println(path);
Iterator it=l.iterator();
while (it.hasNext()){
Element ele=(Element) it.next();
List li=ele.elements();
Iterator i=li.iterator();
while (i.hasNext()){
Element e=(Element) i.next();
System.out.println("name:"+e.getName()+"\t text:"+e.getText());
}

}
}
public static void main(String[] args) {
// TODO Auto-generated method stub
XmlExtract xmlext=new XmlExtract(); 
xmlext.exxml("/Config/vmacore/threadPool"); 
}
}

4、效果与截图
/Config/vmacore/threadPool
name:TaskMax text:40
name:IoMax text:81
name:IoMin text:1
xml文件内容
<!-- Sample configuration file for running UFA stack for P2V and VMI -->
<Config>
<vmacore>
<threadPool>
<TaskMax>40</TaskMax>
<IoMax>81</IoMax>
<IoMin>1</IoMin>
</threadPool>
<impersonate>true</impersonate>
<!--
<useRefTracker>true</useRefTracker>
<printRefDetails>true</printRefDetails>
-->
</vmacore>
<plugins>
<ufa_slave>
<path>ufa-slave.dll</path>
<primarySnapshotDriver>vss</primarySnapshotDriver>
<alternativeSnapshotDriver>vsnap</alternativeSnapshotDriver>
<enableBlockLevelVolumeCloning>true</enableBlockLevelVolumeCloning>
<vstor2Instance>vstor2-ws60</vstor2Instance>
</ufa_slave>
<ufa_client>
<path>ufa-client.dll</path>
</ufa_client>
<ufa_sysReconfig>
<path>ufa-sysReconfig.dll</path>
</ufa_sysReconfig>
<ufa_sysMigration>
<path>ufa-sysMigration.dll</path>
</ufa_sysMigration>
<ufa_vmImporter>
<path>ufa-vmImporter.dll</path>
<deleteVmFromFailedClone>true</deleteVmFromFailedClone>
</ufa_vmImporter>
<ufa_agent>
<path>ufa-agent.dll</path>
<enableRemoteAccess>true</enableRemoteAccess>
<enableSoapAdapter>false</enableSoapAdapter>
<!--<soapPort>8086</soapPort>-->
<enableVmdbAdapter>true</enableVmdbAdapter>
<!--<vmdbAdapterListener>both</vmdbAdapterListener>-->
<!--<vmdbAdapterListener>tcp</vmdbAdapterListener>-->
<vmdbAdapterListener>namedPipe</vmdbAdapterListener>
<vmdbPipeName>vmware-ufad-ws60-beta3-vmdb</vmdbPipeName>
<!--<vmdbPort>9006</vmdbPort>-->
</ufa_agent>
</plugins>
<log>
<name>vmware-converter</name>
<level>verbose</level>
</log>
<!-- Remove the following node to disable SSL -->
<ssl>
<!-- Private key file -->
<privateKey>ssl/rui.key</privateKey>
<!-- Certificate file -->
<certificate>ssl/rui.crt</certificate>
</ssl>
</Config>
分享到:
评论

相关推荐

    MMAnalyzer 分词必导入jar包(lucene-core-2.4.1.jar je-analysis-1.5.3.jar)

    Lucene是一个高性能、全功能的全文搜索引擎库,它提供了一套完整的搜索解决方案,包括索引、查询解析、排序等。`lucene-core-2.4.1.jar`是Lucene的核心库,包含了Lucene的基础组件和API,如文档处理、索引操作、查询...

    最新版linux lucene-8.10.0.tgz

    - 将编译生成的jar文件添加到你的Java项目类路径中,或者如果你使用的是现代的构建工具如Maven或Gradle,可以在pom.xml或build.gradle文件中添加对应的依赖。 4. **基本概念**: - **索引**:Lucene的核心是建立...

    lucene-2.9.4-src.zip

    2. contrib模块:包含了一些社区贡献的扩展功能,如拼音支持、XML解析、邮件索引等。 3. test-framework模块:提供了测试基础设施,用于验证Lucene的功能和性能。 4. 示例(demo)模块:包含了一些简单的示例程序...

    Lucene分词器资源包

    3. **Lucene QueryParser**: `lucene-queryparser.jar` 提供了解析和构建用户查询的能力。它能将用户的自然语言查询转换为Lucene理解的查询语法,支持各种查询构造,例如布尔查询、短语查询、范围查询等。 4. **...

    lucene-2.9.4.tar.gz

    《Apache Lucene 2.9.4:搜索引擎技术的核心解析》 Apache Lucene是一个高性能、全文本搜索库,被广泛应用于各种搜索引擎的开发中。在本文中,我们将深入探讨lucene-2.9.4.tar.gz这个压缩包所包含的内容及其相关...

    lucene 对 xml建立索引

    - 当使用SAX解析XML时,解析器会遍历XML文档并触发一系列回调方法,如`startDocument()`、`endDocument()`、`startElement()`等。 #### 三、建立索引的过程 1. **解析XML文档** - 在建立索引之前,需要先将XML...

    lucene-2.1.0 jar包和事例

    《深入理解Lucene-2.1.0:API与实战解析》 Lucene是一个高性能、全文检索库,它为开发者提供了强大的文本搜索功能。在Java编程领域,Lucene以其高效和灵活的特性,成为了开发搜索引擎应用的首选工具。本文将围绕...

    最新版windows lucene-8.5.1.zip

    《Windows环境下Lucene 8.5.1的深度解析与应用》 Apache Lucene是一个开源全文搜索引擎库,它为开发者提供了在Java环境中构建全文检索应用的基础框架。在最新的8.5.1版本中,Lucene进一步提升了性能和功能,使其在...

    lucene-3.0.1-src.zip

    4. **build.xml**: 这是 Ant 构建脚本,用于编译、打包和测试 Lucene 项目。如果你熟悉 Java 开发,可以通过运行这个脚本来构建和运行测试。 5. **LICENSE.txt** 和 **NOTICE.txt**: 这两个文件分别包含了 Lucene ...

    lucene-1.rar

    5. **Query解析**:用户输入的查询字符串通过QueryParser转化为Query对象,Query对象描述了用户要查找的信息模式。 6. **Searcher**:Searcher是执行搜索操作的组件,它会根据Query对象在索引中查找匹配的文档,并...

    lucene3.6.1

    3. **更多工具**:此外, contrib 还包含了一些其他工具,如信息抽取、地理编码、XML解析等,这些工具可以扩展Lucene的应用范围,使其能够处理更复杂的数据类型和应用场景。 总结来说,Lucene 3.6.1不仅强化了其...

    lucene使用教程

    为了在项目中使用Lucene,需要在项目的构建文件(如Maven的`pom.xml`文件)中添加以下依赖项: ```xml &lt;lucene-version&gt;5.3.1&lt;/lucene-version&gt; &lt;groupId&gt;org.apache.lucene &lt;artifactId&gt;lucene-core ${...

    lucene-group-score-query

    深入学习这个项目,你可以了解如何在Lucene中自定义查询解析器、分组策略和评分函数,以及如何优化搜索性能。这将涉及到Lucene的核心概念,如倒排索引、Term查询、评分模型、Filter和Collector等。此外,你还将接触...

    lucene jar大全 包涵多个版本的jar包2.0-4.1等

    3. **Lucene 3.6.2**: 这个版本进一步增强了Lucene的功能,包括对复杂查询的处理能力和对多种格式文档的解析能力。3.6.2引入了新的分析器,如StopAnalyzer和StandardAnalyzer,以支持更精确的文本分析。同时,它还...

    solr相关的jar包

    - `xml-apis.jar`和`xercesImpl.jar`:XML解析和处理,Solr的请求和响应常以XML格式传输。 5. **Zookeeper相关** - 如果你的Solr部署在分布式环境中,可能需要`zookeeper.jar`,因为SolrCloud依赖Zookeeper进行...

    Adaptive-News-Storage-System-in-Java-and-XML-源码.rar

    4. **DOM和SAX解析**:Java提供了处理XML的API,如DOM(Document Object Model)用于将整个XML文档加载到内存,而SAX(Simple API for XML)是事件驱动的解析方式,适合处理大文件。 此外,系统可能还包括以下功能...

    jspxcms资料部分整理

    `context-component.xml`文件主要涉及路径解析器、认证策略以及上传文件的相关配置。而`context-shiro.xml`和`servlet-back.xml`分别配置了Shiro安全框架和后端日期转换、分页、上传文件的处理。`servlet-fore.xml`...

    Dom4j解析XML

    ### Dom4j解析XML及其中文问题解决 #### 一、Dom4j简介 Dom4j是一种用于处理XML的Java库,它提供了一种简洁而强大的API来读取、写入和操作XML数据。自2001年首次发布以来,Dom4j因其直观的接口和高效的性能而在...

    lucene+中文IK分词器 例子

    **Lucene+中文IK分词器实例解析** Lucene是一个高性能、全文检索库,由Apache软件基金会开发。它提供了一个简单但功能强大的API,用于在各种应用中实现全文索引和搜索。在处理中文文本时,由于中文词汇的复杂性和无...

    OSChina 所有jar

    7 commons-digester-2.0.jar XML解析,Velocity依赖 8 commons-email-1.2.jar 邮件发送包 9 commons-httpclient-3.1.jar HTTP客户端 10 commons-io-1.4.jar IO处理包 11 commons-lang-2.4.jar 语言处理包 12 ...

Global site tag (gtag.js) - Google Analytics