`
kongshanxuelin
  • 浏览: 927036 次
  • 性别: Icon_minigender_1
  • 来自: 宁波
社区版块
存档分类
最新评论

网站全文检索的实现(基于lucene 2.0)

阅读更多

辛辛苦苦做好了一个网站,接下来就必须为用户提供全文检索的功能,本程序为您的网站提供全文检索的功能,你只需要修改一下配置文件即可,供大家学习参考,程序只有一个JSP页面,你可以把他放在任何J2EE容器下(如Tomcat等),系统采用全Ajax实现,请在c:\下建立索引目录,把index.rar解压后的文件拷贝到那,由于用到的jar较大,所以这里运行的包中省去了包,请自行到官方网站下载

分享到:
评论
10 楼 hil2000 2011-09-29  
请问下载地址在哪?
9 楼 ithero 2009-02-28  
用的是什么中文分词包
8 楼 aaliuhl 2009-02-06  
有时间瞧下,对这类东西最近兴致比较大!公司的一些项目都是用TRS,不过个人研究想用Lucene,好像Solr也有很多人用,好像要简单很多,貌似也是基于Lucene的。
7 楼 javacool_zhou 2009-02-06  
很感兴趣,参考下lz的demo自己做个看看
6 楼 jiyanliang 2008-12-26  
参考我的blog:使用Lucene+Paoding构建SSH2系统的站内搜索
http://jnotnull.iteye.com/blog/275327
5 楼 pipal 2008-12-26  
正在做搜索引擎,没头绪,不知道可以向你请教不?谢谢。
4 楼 englisher 2008-11-13  
就没有远代码么?
3 楼 phoenix007 2008-11-04  
好东西!收藏了。
2 楼 kongshanxuelin 2008-09-18  
主要包括Struts.jar,lucene-core-2.0.0.jar,poi-3.0.1-FINAL-20070705.jar,PDFBox-0.7.3.jar,只要启动时不报错即可
1 楼 world123 2008-09-18  
你好,请问用到哪些jar,可否列表出来?

相关推荐

    lucene2.0与其分词工具包

    Lucene是一款由Apache软件基金会开发的全文搜索引擎库,专门用于信息检索。它以其强大的搜索功能和高效的性能在Java开发领域中备受推崇。作为一款开源项目,Lucene为开发者提供了丰富的API,使得构建搜索引擎变得...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    **Lucene 2.0**: Lucene是Apache软件基金会的一个项目,提供了一个高效、可扩展的全文检索库。在Lucene 2.0版本中,主要包含以下核心功能: 1. **分词**: Lucene支持对文本进行分词,将大段文本分解成关键词,这是...

    开发自己的搜索引擎Lucene2.0+Heritrix

    全文检索与索引机制** - **索引原理**:Lucene 的核心在于其高效的索引机制。它通过建立反向索引的方式,使得每个关键词都可以快速地映射到包含该关键词的文档列表上。 - **模糊查询**:传统的数据库通常不支持...

    Lucene-2.0学习文档

    Lucene是一个开源的全文检索库,由Apache软件基金会开发并维护。它为Java开发者提供了强大的文本搜索功能,广泛应用于各种信息检索系统中。本篇文章将围绕"Lucene-2.0学习文档"的主题,结合Indexer.java、...

    Lucene2.0+Heritrix(ch4源代码)

    Lucene 2.0与Heritrix的结合使用,既能够充分利用Lucene强大的全文搜索能力,又能够利用Heritrix高效的网页抓取功能,构建出强大的信息检索系统。通过对源代码的学习和理解,开发者可以更深入地掌握这两者的内在工作...

    Lucene2.0+Nutch0.8 API帮助文档(CHM格式)

    《Lucene2.0+Nutch0.8 API帮助文档》是一个综合性的技术资源,它包含了对Lucene 2.0和Nutch 0.8这两个关键的开源搜索引擎库的详细接口和功能说明。这两个组件在信息检索、全文搜索以及网络爬虫领域有着广泛的应用。 ...

    Lucene.Net2.0(C#)

    Lucene.Net 2.0 是一个基于 .NET Framework 的全文检索库,它为开发人员提供了强大的文本搜索功能,支持C#编程语言。这个开源项目是Apache Lucene的.NET版本,旨在为.NET开发者提供与Java版本相同的功能和性能,使...

    Lucene.net 2.0源码

    Lucene.NET 2.0 是一个基于 Apache Lucene 的开源全文检索库,专为 .NET Framework 设计。它提供了一种强大而灵活的方式来在应用程序中实现全文搜索功能,支持处理海量数据,即使是亿级别的数据集也能轻松应对。...

    开发自己的搜索引擎-Lucene 2.0+Heritrix

    在IT领域,构建一个搜索引擎是一项复杂而技术性强的...在实际应用中,还可以结合其他工具和框架,如Solr(基于Lucene的企业级搜索平台)和Elasticsearch(分布式搜索和分析引擎),进一步增强搜索引擎的功能和性能。

    【大搜集:lucene学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>

    基于Java的全文索引引擎.doc lucene测试代码.txt lucene为数据库搜索建立增量索引.txt lucene数据库索引.txt 新闻系统全文检索的思绪.txt ... 关于lucene2.0的创建、检索和删除功能的完整实现.doc weblucene.txt

    lucene检索包

    为了提高Lucene二次开发的效率并更好地支持多种全文检索应用,研究人员设计实现了一个基于Lucene 2.0的改进版全文检索引擎工具包——**ELucene** (Enhanced Lucene)。 ##### ELucene的特点 - **定制化的索引配置**:...

    Lucene.Net实现全文搜索

    **Lucene.Net** 是一个基于 .NET 的高性能全文检索引擎库。它最初由 Java 版本的 Lucene 发展而来,旨在为 .NET 开发者提供一个强大而灵活的搜索解决方案。随着项目的演进,Lucene.Net 经历了从开源到商业化的转变。...

    lucene学习资料

    2. **关于lucene2.0的创建、检索和删除功能的完整实现.doc** Lucene 2.0版本的教程,可能讲解了如何利用Lucene API实现文档的索引创建、查询检索和文档删除操作。这涵盖了Lucene的核心功能,对于初学者是很好的实践...

    lucene.net 2.9.2 实现索引生成,修改,查询,删除实例

    Lucene.NET 2.9.2 是一个基于Apache Lucene的全文检索库,适用于.NET Framework。这个库提供了高效、可扩展的全文检索功能,适用于各种应用程序中的数据搜索需求。在这个实例中,我们将深入探讨如何使用Lucene.NET ...

    Incubating-Apache-Lucene.Net-2.0-004-11Mar07.bin.zip

    Apache Lucene.Net是一个高度成熟且广泛使用的全文搜索引擎库,它基于Java的Apache Lucene项目,但完全用C#重写,以适应.NET Framework。这个压缩包"Incubating-Apache-Lucene.Net-2.0-004-11Mar07.bin.zip"包含了...

    Lucene结合Sql建立索引

    Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能. 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅是一个工具,...

    lucene 中文分词 庖丁解牛

    3. Snowball Analyzer:基于Lucene的分词器,支持多国语言,但对中文支持有限,需配合其他中文分词库使用。 4. PKUAnnotator:北京大学开发的中文分词系统,具有较高的准确率和召回率。 五、选择与优化 不同的分词...

    Lucene关于几种中文分词的总结

    3. IK_CAnalyzer(MIK_CAnalyzer):这是基于Lucene 2.0开发的第三方分词器,由用户自行维护和更新。IKAnalyzer(包括MIK_CAnalyzer的改进版)以词典为基础,具有较好的分词效果和可扩展性,支持动态词典更新,适用...

    基于JFinal的开源博客系统JFinal_Blog2.0版本

    3、解决Lucene全文检索出现"too many open files "的bug问题; 4、解决Linux中tomcat容器乱码问题(URLEncoding="UTF-8"); 二、开源地址: 1、OSC介绍:http://www.oschina.net/p/jfinal_blog 2、GIT版本:...

Global site tag (gtag.js) - Google Analytics