`
wjboy49
  • 浏览: 284723 次
  • 性别: Icon_minigender_1
  • 来自: 湖南岳阳
社区版块
存档分类
最新评论

刚下载,开始学习lucene时看的文章

阅读更多

Lucene 2.0.0下载安装及测试

【下载】

下载链接:http://apache.mirror.phpchina.com/lucene/java/archive/

以选择lucene-2.0.0.zip 下载为例。

 

【安装】

1、在本地磁盘解压缩lucene-2.0.0.zip 文件;

2、将lucene-demos-2.0.0.jar和lucene-core-2.0.0.jar拷贝到JDK目录的lib目录下,例如:

D:\Program Files\Java\jdk1.5.0_05\lib

3、设置CLASSPATH:

%JAVA_HOME%\lib\lucene-demos-2.0.0.jar;%JAVA_HOME%\lib\lucene-core-2.0.0.jar;

 

【测试】

1、创建测试目录,选择测试文件:

我以E:\Lucene\txtfiles 的目录下的txt文件为例。
2007-04-04 19:12               257 0说明.txt
2006-06-23 17:37               108 120E升级包安装说明.txt
2007-12-08 19:14               105 192.txt
2007-10-16 15:33                75 1实验题目.txt
2006-06-09 11:21            12,409 2006-06-09 11.21.27 Crash.txt
2006-06-15 20:06            12,409 2006-06-15 20.06.07 Crash.txt
2006-10-02 20:19            11,736 2006-10-02 20.19.33 Crash.txt
2007-10-23 15:12                34 2实验红黑树.txt
2008-01-12 17:27            31,425 3rd_party_licenses.txt
2007-10-30 15:44                82 3实验题目.txt
2007-10-25 20:34                14 Account.txt
2000-10-17 16:03               190 ADDR_TABLE.txt
2006-08-05 14:11            17,464 apr License.txt
2007-08-22 22:57               926 autolist.txt
2006-08-05 14:07             5,817 BerkeleyDB License.txt
2002-07-20 11:35               663 BnetLog.txt
2005-09-01 10:59                20 buildnum.txt
2007-08-22 22:57           137,400 Changelog.txt
2007-03-10 20:43             4,187 codepage.txt
2008-01-30 15:14               182 ConsoleApplication1.csproj.FileList.txt
2004-06-05 02:14             3,761 CustomKeyInfo.txt
2007-03-11 16:06               923 customkeys.txt
2006-10-10 12:51            54,431 CustomKeysSample.txt
2008-01-02 21:08             7,331 D2080102.txt
2008-01-03 22:13            10,218 D2080103.txt
2008-01-04 15:56             4,495 D2080104.txt
2008-01-07 20:45             4,672 D2080107.txt
2001-06-30 19:18               454 D2Debug.txt
2008-01-30 14:50                40 dd_vserror80.txt
2008-01-30 14:50           612,432 dd_vsinstall80.txt
2007-12-09 21:15             8,479 Dreamweaver 8 序列号.txt
2007-06-05 09:41             3,104 eclipse上课文档.txt
2007-10-13 19:48                62 EditPlus注册码.txt
2007-08-02 19:46             7,738 epp231p524.txt
2005-11-10 00:39            11,378 eula.txt
2006-04-13 15:54            14,600 FAQ.txt
2007-12-05 19:32                 9 Fetion.txt
2007-07-25 13:31               624 history.txt
2007-07-28 14:58             1,888 historyRcords.txt
2008-01-21 10:52               311 IE History对象.txt
2008-01-21 10:54               447 IE location对象.txt
2008-01-21 10:57               320 IE navigator对象.txt
2008-01-21 10:55               440 IE screen对象.txt
2008-01-21 10:51             1,861 IE Windows对象.txt
2006-12-15 17:36             2,808 jvm.hprof.txt
2007-07-25 13:31                36 kiki.txt
2007-11-20 22:03             1,452 left.txt
2008-01-03 18:33            27,231 license-game.txt
2008-01-12 17:29            13,793 LICENSE.txt
2008-01-12 17:41               439 log.txt
2008-01-31 19:15            44,436 LoginServer.txt
2007-12-11 15:26             1,439 main[1].txt
2007-12-06 18:59               994 MyEclipse 注册码.txt
2006-09-29 17:59               297 MyEclipse5.0正式版的注册码.txt
2007-10-27 16:07             1,294 MySQLPool.txt
2007-11-13 13:26                67 ndp_src.zip.txt
2001-01-23 11:15             1,696 NOISECHS.TXT
2001-01-23 11:15             1,696 NOISECHT.TXT
2001-01-23 11:15           149,848 NOISEDEU.TXT
2001-01-23 11:15               755 NOISEENG.TXT
2001-01-23 11:15               755 NOISEENU.TXT
2001-01-23 11:15            19,684 NOISEESN.TXT
2001-01-23 11:15            49,196 NOISEFRA.TXT
2001-01-23 11:15            19,618 NOISEITA.TXT
2001-01-23 11:15             2,060 NOISEJPN.TXT
2001-01-23 11:15             1,486 NOISEKOR.TXT
2001-01-23 11:15               745 NOISENEU.TXT
2001-01-23 11:15            13,256 NOISENLD.TXT
2001-01-23 11:15            13,730 NOISESVE.TXT
2001-01-23 11:15               697 NOISETHA.TXT
2008-01-12 17:29             1,459 NOTICE.txt
2006-08-05 14:07             6,406 OpenSSL License.txt
2006-01-10 21:50            94,682 Patch.txt
2008-01-31 19:14            15,944 patchinfo.txt
2007-01-24 03:00            96,642 Patch中文改动列表.txt
2005-09-29 01:17            94,178 Patch中文版.txt
2007-01-24 02:01           114,145 Patch英文改动列表.txt
2005-09-29 01:38           111,407 Patch英文版.txt
2008-01-12 17:29             1,125 README.txt
2005-11-12 07:43            10,536 redist.txt
2005-06-20 19:51               167 Release-Notes.txt
2007-07-28 14:58                39 remainMoney.txt
2006-08-12 18:14             1,266 stormicl.txt
2007-10-14 01:11             5,433 Struts之AddressBooks学习笔记.txt
2007-01-24 21:48             2,395 Subversion license.txt
2008-01-12 17:29               632 SVN-REV.txt
2007-02-15 12:15             1,742 template.txt
2005-11-11 22:39                 0 text.txt
2005-11-11 22:51                 0 textfile.txt
2005-08-26 17:38            69,740 THIRDPARTYLICENSEREADME.txt
2006-08-05 14:08            18,327 TortoiseSVN License.txt
2007-07-05 08:28             9,576 Update.txt
2007-07-28 14:56                33 usermessage.txt
1998-05-22 00:00                58 users.txt
2005-11-12 00:20             1,036 vcvars.txt
1998-05-25 00:00            39,172 VFP6FAQ.TXT
2008-01-30 13:12               315 Visual Studio 2005注册升级.txt
2008-01-30 14:26        83,843,630 VSMsiLog7976.txt
2007-09-11 14:51             2,162 whatsnew.txt
2007-08-07 20:55            12,662 书籍网站.txt
2005-11-21 12:13            15,401 使用技巧集萃.txt
2005-01-27 03:23               822 使用说明.txt
2006-01-08 00:27                19 例子说明.txt
2007-01-24 04:23             1,935 剑心补丁使用说明(readme).txt
2007-12-08 21:54                61 卡巴斯基.txt
2007-12-23 20:41             1,350 史上最强天籁之声及欧美流行曲超级精选【 FLAC
分轨】.txt
2007-11-20 11:39                 0 大整数乘法.txt
2007-07-28 00:42                95 安装说明.txt
2007-12-01 17:01             1,903 密码强度检验.txt
2007-07-28 17:08               506 工程说明.txt
2007-10-01 23:03               119 手配struts.txt
2001-11-20 15:42             1,548 指定时间内关闭网页.txt
2008-01-28 15:48             4,020 数据库链接异常.txt
2007-10-31 19:42             3,584 新1建 文本文档.txt
2007-11-13 13:13                 0 新建 文本文档 (1).txt
2007-10-30 18:10             5,824 新建 文本文档 (2).txt
2007-10-30 18:13             1,962 新建 文本文档 (3).txt
2007-11-13 13:19               872 新建 文本文档 (4).txt
2007-11-13 13:19             1,544 新建 文本文档 (5).txt
2007-11-13 13:20             6,944 新建 文本文档 (6).txt
2007-11-13 13:21            16,666 新建 文本文档 (7).txt
2007-05-31 18:28             1,975 新建 文本文档.txt
2007-07-24 13:44                57 新版日语教程.txt
2007-11-20 11:39             5,576 最接近点对问题.txt
2004-01-22 05:44               336 毕业设计文件清单.txt
2007-08-21 10:47             1,736 汉化说明.txt
2007-06-16 19:12               834 猫吉又有个忙,需要大家帮忙一下.txt
2007-11-14 22:08             1,212 疑问即时记录.txt
2000-11-13 14:28                15 矩阵连乘.txt
2001-11-20 14:55             7,625 网络查询大全.txt
2007-07-17 15:30                26 说明.txt
2007-07-28 17:05                 0 读我!.txt
2000-11-13 15:03                16 贪心算法.txt
2008-01-22 20:03               237 项目常用.txt
             134 个文件     85,994,758 字节

2、建立索引

在DOS下,切换到目录(可以任意选择)E:\Lucene下,运行命令:

java org.apache.lucene.demo.IndexFiles txtfiles

(txtfiles显然是选择的文件的目录)

可以看到:

Indexing to directory 'index'...
adding txtfiles\0说明.txt
adding txtfiles\120E升级包安装说明.txt
adding txtfiles\192.txt
adding txtfiles\1实验题目.txt
adding txtfiles\2006-06-09 11.21.27 Crash.txt
adding txtfiles\2006-06-15 20.06.07 Crash.txt
adding txtfiles\2006-10-02 20.19.33 Crash.txt
adding txtfiles\2实验红黑树.txt
adding txtfiles\3rd_party_licenses.txt
adding txtfiles\3实验题目.txt
adding txtfiles\Account.txt
adding txtfiles\ADDR_TABLE.txt
adding txtfiles\apr License.txt
adding txtfiles\autolist.txt
adding txtfiles\BerkeleyDB License.txt
adding txtfiles\BnetLog.txt
adding txtfiles\buildnum.txt
adding txtfiles\Changelog.txt
adding txtfiles\codepage.txt
adding txtfiles\ConsoleApplication1.csproj.FileList.txt
adding txtfiles\CustomKeyInfo.txt
adding txtfiles\customkeys.txt
adding txtfiles\CustomKeysSample.txt
adding txtfiles\D2080102.txt
adding txtfiles\D2080103.txt
adding txtfiles\D2080104.txt
adding txtfiles\D2080107.txt
adding txtfiles\D2Debug.txt
adding txtfiles\dd_vserror80.txt
adding txtfiles\dd_vsinstall80.txt
adding txtfiles\Dreamweaver 8 序列号.txt
adding txtfiles\eclipse上课文档.txt
adding txtfiles\EditPlus注册码.txt
adding txtfiles\epp231p524.txt
adding txtfiles\eula.txt
adding txtfiles\FAQ.txt
adding txtfiles\Fetion.txt
adding txtfiles\history.txt
adding txtfiles\historyRcords.txt
adding txtfiles\IE History对象.txt
adding txtfiles\IE location对象.txt
adding txtfiles\IE navigator对象.txt
adding txtfiles\IE screen对象.txt
adding txtfiles\IE Windows对象.txt
adding txtfiles\jvm.hprof.txt
adding txtfiles\kiki.txt
adding txtfiles\left.txt
adding txtfiles\license-game.txt
adding txtfiles\LICENSE.txt
adding txtfiles\log.txt
adding txtfiles\LoginServer.txt
adding txtfiles\main[1].txt
adding txtfiles\MyEclipse 注册码.txt
adding txtfiles\MyEclipse5.0正式版的注册码.txt
adding txtfiles\MySQLPool.txt
adding txtfiles\ndp_src.zip.txt
adding txtfiles\NOISECHS.TXT
adding txtfiles\NOISECHT.TXT
adding txtfiles\NOISEDEU.TXT
adding txtfiles\NOISEENG.TXT
adding txtfiles\NOISEENU.TXT
adding txtfiles\NOISEESN.TXT
adding txtfiles\NOISEFRA.TXT
adding txtfiles\NOISEITA.TXT
adding txtfiles\NOISEJPN.TXT
adding txtfiles\NOISEKOR.TXT
adding txtfiles\NOISENEU.TXT
adding txtfiles\NOISENLD.TXT
adding txtfiles\NOISESVE.TXT
adding txtfiles\NOISETHA.TXT
adding txtfiles\NOTICE.txt
adding txtfiles\OpenSSL License.txt
adding txtfiles\Patch.txt
adding txtfiles\patchinfo.txt
adding txtfiles\Patch中文改动列表.txt
adding txtfiles\Patch中文版.txt
adding txtfiles\Patch英文改动列表.txt
adding txtfiles\Patch英文版.txt
adding txtfiles\README.txt
adding txtfiles\redist.txt
adding txtfiles\Release-Notes.txt
adding txtfiles\remainMoney.txt
adding txtfiles\stormicl.txt
adding txtfiles\Struts之AddressBooks学习笔记.txt
adding txtfiles\Subversion license.txt
adding txtfiles\SVN-REV.txt
adding txtfiles\template.txt
adding txtfiles\text.txt
adding txtfiles\textfile.txt
adding txtfiles\THIRDPARTYLICENSEREADME.txt
adding txtfiles\TortoiseSVN License.txt
adding txtfiles\Update.txt
adding txtfiles\usermessage.txt
adding txtfiles\users.txt
adding txtfiles\vcvars.txt
adding txtfiles\VFP6FAQ.TXT
adding txtfiles\Visual Studio 2005注册升级.txt
adding txtfiles\VSMsiLog7976.txt
adding txtfiles\whatsnew.txt
adding txtfiles\书籍网站.txt
adding txtfiles\使用技巧集萃.txt
adding txtfiles\使用说明.txt
adding txtfiles\例子说明.txt
adding txtfiles\剑心补丁使用说明(readme).txt
adding txtfiles\卡巴斯基.txt
adding txtfiles\史上最强天籁之声及欧美流行曲超级精选【 FLAC分轨】.txt
adding txtfiles\大整数乘法.txt
adding txtfiles\安装说明.txt
adding txtfiles\密码强度检验.txt
adding txtfiles\工程说明.txt
adding txtfiles\手配struts.txt
adding txtfiles\指定时间内关闭网页.txt
adding txtfiles\数据库链接异常.txt
adding txtfiles\新1建 文本文档.txt
adding txtfiles\新建 文本文档 (1).txt
adding txtfiles\新建 文本文档 (2).txt
adding txtfiles\新建 文本文档 (3).txt
adding txtfiles\新建 文本文档 (4).txt
adding txtfiles\新建 文本文档 (5).txt
adding txtfiles\新建 文本文档 (6).txt
adding txtfiles\新建 文本文档 (7).txt
adding txtfiles\新建 文本文档.txt
adding txtfiles\新版日语教程.txt
adding txtfiles\最接近点对问题.txt
adding txtfiles\毕业设计文件清单.txt
adding txtfiles\汉化说明.txt
adding txtfiles\猫吉又有个忙,需要大家帮忙一下.txt
adding txtfiles\疑问即时记录.txt
adding txtfiles\矩阵连乘.txt
adding txtfiles\网络查询大全.txt
adding txtfiles\说明.txt
adding txtfiles\读我!.txt
adding txtfiles\贪心算法.txt
adding txtfiles\项目常用.txt
Optimizing...
8750 total milliseconds

这时,可以在E:\Lucene下生成索引存放目录index,在目录index下是索引文件。

3、搜索测试:

在目录E:\Lucene下运行命令:

java org.apache.lucene.demo.SearchFiles

则显示:

Query:

键入搜索关键字进行搜索。

例如:

输入:

window

显示:

Searching for: window
9 total matching documents
1. txtfiles\D2080104.txt
2. txtfiles\D2080107.txt
3. txtfiles\D2080102.txt
4. txtfiles\D2080103.txt
5. txtfiles\IE Windows对象.txt
6. txtfiles\VFP6FAQ.TXT
7. txtfiles\Changelog.txt
8. txtfiles\Update.txt
9. txtfiles\FAQ.txt

输入:

n

显示:

Searching for: n
32 total matching documents
1. txtfiles\dd_vserror80.txt
2. txtfiles\NOISEDEU.TXT
3. txtfiles\NOISESVE.TXT
4. txtfiles\NOISEITA.TXT
5. txtfiles\eula.txt
6. txtfiles\NOISEESN.TXT
7. txtfiles\NOISECHS.TXT
8. txtfiles\NOISEFRA.TXT
9. txtfiles\NOISECHT.TXT
10. txtfiles\dd_vsinstall80.txt
more (y/n) ?

可以根据提示符分屏显示。

无论我们输入任何中文字符,结果都是:

Searching for:
0 total matching documents

可见,这里不支持中文搜索。

分享到:
评论

相关推荐

    Lucene学习源码.rar

    通过学习Lucene源码,我们可以定制自己的分词器、查询解析器,甚至优化搜索算法,以满足特定的搜索需求。例如,在中文环境下,可以使用IK Analyzer或者jieba分词库来增强对中文的支持。 总结,Lucene作为Java平台上...

    Lucene的的学习资料及案例

    本篇文章将围绕Lucene的核心概念、主要功能、使用方法以及提供的案例进行深入探讨。 ### Lucene核心概念 1. **索引**: Lucene通过构建索引来提高搜索效率。索引过程将文档内容转换为倒排索引结构,其中关键词指向...

    lucene学习资料收集

    这个资料集可能包含了关于如何理解和使用Lucene的各种资源,特别是通过博主huanglz19871030在iteye上的博客文章链接,可以深入学习Lucene的核心概念和技术细节。 【标签】:“源码”和“工具”这两个标签暗示了这个...

    Lucene-2.0学习文档

    《深入理解Lucene-2.0:...总之,学习Lucene-2.0涉及到对索引构建、搜索算法、排序机制的理解以及源码的阅读和分析。这不仅可以帮助开发者构建自己的全文检索系统,也为进一步探索信息检索领域的高级技术打下坚实基础。

    data.rar学习lucene需要的数据文件

    本篇文章将围绕“data.rar学习lucene需要的数据文件”这一主题,深入探讨如何利用提供的数据文件学习并掌握Lucene的核心概念和技术。 首先,我们需要了解Lucene是什么。Lucene是一个高性能、全文本搜索库,它提供了...

    一步一步跟我学习Lucene源码之lucene的各种Field

    在深入探讨Lucene Field之前,我们先来了解一下Lucene是什么。Lucene是一个开源的全文搜索引擎库,由Apache软件基金会开发,用Java编写。它提供了一个简单但功能强大的API,允许开发者在应用程序中添加搜索功能。...

    博客园文章搜索项目(Lucene)

    对学习lucene开发的人员来说这个项目非常有价值 值得参考">项目的页面都存在WebRoot WEB INF jsp下 网上搜索博客园网页的地址 输入到相应搜索框 该项目可以自动对博客园网站中的文章 项目中限制了文章数量 建立...

    lucene4.8学习资料和案例

    《Lucene 4.8学习指南与实战案例分析》 Lucene是一个强大的全文搜索引擎库,由Apache软件基金会开发,主要用于Java环境。版本4.8在功能和性能上都有显著提升,是许多开发者进行文本检索应用开发的重要工具。本文将...

    lucene入门小例子

    Lucene是中国大百科全书式的全文检索库,它在...这些都是深入理解和运用Lucene时需要关注的点。 总之,Lucene是一个强大且灵活的全文检索工具,通过这个入门小例子,你可以逐步揭开其神秘的面纱,踏入文本搜索的世界。

    Lucene全文检索引擎

    使用Lucene时,你可能需要考虑如何处理中文分词、如何优化搜索性能、如何实现多语言支持等问题。此外,对于大型数据集,可能需要了解如何分布式部署和管理索引。 总结来说,Lucene是一个强大的全文检索引擎,通过...

    LuceneDemo

    【Lucene全文检索技术详解】 Lucene是一款由Apache软件基金会开发的开源全文检索库,它为Java开发者提供了强大的文本...通过深入学习和实践Lucene,开发者可以提升处理文本数据的能力,更好地服务于信息检索的需求。

    lucene源码和程序

    Lucene是Apache软件基金会下的一个项目,它是一个高性能、全文本搜索库,完全用Java编写。作为一款开源的全文检索工具包,...通过学习和使用Lucene源码,你可以更深入地理解全文检索的工作机制,提升自己的开发技能。

    Lucene-2.3.1 源代码阅读学习

    《Lucene-2.3.1 源代码阅读学习》 Lucene是Apache软件基金会的一个开放源码项目,它是一个高性能、全文本搜索库,为开发者提供了在Java应用程序中实现全文检索功能的基础架构。本篇文章将深入探讨Lucene 2.3.1版本...

    Lucene5学习之Suggest关键字提示

    《深入探索Lucene5:Suggest关键字提示技术》 在信息检索领域,用户输入查询时,提供快速、准确的关键字提示能显著提升用户体验。Lucene,作为Java领域最流行的全文检索库,其5.x版本引入了Suggest组件,用于实现...

    lucene学习资料

    **Lucene学习资料** Lucene是一个高性能、可扩展的信息检索库,由Apache软件基金会开发,是Java编程语言中广泛使用的全文检索引擎库。它提供了文本分析、索引和搜索的基本功能,同时也支持高级搜索语法和查询操作。...

    lucene检索新闻数据演示

    【标题】"lucene检索新闻数据演示...学习和实践这个示例,可以深入理解Lucene的工作原理,提高全文检索的技能,同时对网页数据的处理和分析也有一定帮助。这在信息检索、大数据分析、内容推荐等领域有着广泛的应用。

    Lucene5学习之FunctionQuery功能查询

    **描述解析:** 博文链接给出的是一个在iteye博客平台上的文章,作者为"iamyida",该文章详细探讨了如何在Lucene5中使用FunctionQuery进行功能查询。由于描述为空,具体的细节需要通过提供的链接访问原文获取。 **...

    lucene.zip

    **Lucene简介** ...这个例子对于理解和学习如何在实际项目中使用Lucene进行信息检索是非常有价值的。通过深入研究和实践,我们可以掌握更多关于Lucene的高级特性和优化技巧,提升搜索系统的性能和用户体验。

    Lucene学习工具包.zip

    这个"Lucene学习工具包.zip"包含了学习Lucene所需的重要资料和资源,旨在帮助开发者深入理解和掌握Lucene的核心概念、功能以及使用方法。本文将详细解析Lucene的基本原理、主要特性,并提供学习路径和实践建议。 ##...

    lucene3 例子

    对于想要深入学习Lucene3或者需要解决相关问题的开发者,可以访问提供的博客链接获取更详尽的信息。在实际使用过程中,建议参考最新版本的Lucene,因为新版本通常会修复已知问题并提供更多的功能和优化。

Global site tag (gtag.js) - Google Analytics