一、Lucene开发环境配置
step1.Lucene开发包下载
step2.Java开发环境配置
step3.Tomcat安装
step4.Lucene开发环境配置
解压下载的lucene-3.0.0.zip,可以看到lucene-core-3.0.0.jar和lucene-demos-3.0.0.jar这两个文件,将其解压(建议放在安装jdk的lib文件夹内),并把路径添加到环境变量的classpath。
二、Lucene开发包中Demo调试
控制台应用程序
step1.建立索引
>java org.apache.lucene.demo.IndexFiles [C:\Java](已经存在的任意文件路径)
将对C:\Java下所有文件建立索引,同时,在当前命令行位置将生成“index”文件夹。
step2.执行查询
>java org.apache.lucene.demo.SearchFiles
将会出现“Query:”提示符,在其后输入关键字,回车,即可得到查询结果。
Web应用程序
step1.将lucene-core-3.0.0.jar和lucene-demos-3.0.0jar这两个文件复制到安装Tomcat 的\common\lib中
step2.解压下载的lucene-3.0.0.zip,可以看到luceneweb.war文件。将该文件复制到安装Tomcat的\webapps
step3.重启Tomcat服务器。
step4.建立索引
>java org.apache.lucene.demo.IndexHTML -create -index [索引数据存放路径] [被索引文件路径](如:D:\lucene\temp\index D:\lucene\temp\docs)
step5. 打开安装Tomcat的\webapps\luceneweb\configuration.jsp文件,找到String indexLocation = "***",将"***"改为第四步中[索引数据存放路径],保存关闭。
step6.执行查询
http://localhost:8080/luceneweb
在文本框中输入关键字,执行,即可得到查询结果。
说明:本文采用lucene-3.0.0版本,运行step6 时查询报错,根据提示将安装Tomcat的webapps\luceneweb\results.jsp 中
[ QueryParser qp = new QueryParser("contents", analyzer); ] 修改为
[ QueryParser qp = new QueryParser(Version.LUCENE_CURRENT,"contents", analyzer); ]
注:本文参考YM's house
相关推荐
这个包包含了三个主要的JAR文件,分别是`lucene-core-3.0.0.jar`、`lucene-memory-3.0.0.jar`和`lucene-highlighter-3.0.0.jar`。 `lucene-core-3.0.0.jar`是Lucene的核心库,它提供了构建搜索引擎的基本构建块。这...
5. **存储与索引**:抓取到的内容可以被存储在本地文件系统或数据库中,同时Heritrix支持与Lucene集成,便于对抓取内容建立全文索引,便于后续分析和检索。 6. **日志和监控**:Heritrix提供详尽的日志记录和监控...
而 `lucene3.0.0` jar 包则是 Lucene 的一个重要版本,发布于2009年,它提供了丰富的文本分析、索引构建和搜索功能。此版本引入了一些新的特性,优化了性能,并修复了一些已知问题。 在 Lucene 3.0.0 中,主要包含...
在这个"lucene3.0.0 入门DEMO"中,我们将探讨如何使用 Lucene 3.0.0 版本进行基本操作。 首先,让我们了解Lucene的核心概念: 1. **索引**:在Lucene中,索引是文档内容的预处理结果,类似于数据库中的索引,用于...
1. **lucene-core-3.0.0.jar**:这是Apache Lucene的核心库,一个高性能的全文搜索引擎框架。它提供了文本分析、索引和查询的能力,使得开发者能够快速地在大量数据中搜索信息。 2. **mysql-connector-5.1.8.jar**...
文中提到的 Hibernate Search 版本为 3.0.0.GA。GA (General Availability) 表示该版本已经稳定可用,适合生产环境部署。这个版本支持 Hibernate ORM 3.x 和 Lucene 3.x。 ##### 2. 创建 POJO 类 下面通过一个具体...
配置文件 `/opt/redis-3.0.0/redis.conf` 包含了 Redis 的各项配置参数,如端口号等。 #### Tomcat 应用服务器 Tomcat 是一款开源的应用服务器,主要用于部署 Java Web 应用程序。启动 Tomcat: ``` cd /usr/local/...
`luence`可能指的是Lucene,这是一个全文搜索引擎库,如果你的项目需要对PDF内容进行全文检索,可能会用到。 源码的提供则为开发者提供了深入学习PDFBox内部实现的机会,通过阅读源码,可以更好地理解PDF处理的底层...
这种方式更加简洁直观,减少了XML配置文件的使用。 ##### 3. Hibernate EntityManager (3.3.2 GA) - **发布日期**:2008年03月14日 - **状态**:生产就绪(Production) EntityManager 是 Java Persistence API ...