`
mmdev
  • 浏览: 13243649 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

LUCENE.COM.CN 中国

 
阅读更多
LUCENE.COM.CN 中国

    Manning - Lucene in Action, A Guide to the Java Search Engine,

一本不错的关于lucene英文书 点此下载
欢迎您访问 LUCENE中国 ,希望一起协作开发应用与交流的朋友加入我们吧!

MSN: ceo@365a.com
QQ: 2895419
相关接口文档:
好友链接: 葛帅  田春峰
分享到:
评论

相关推荐

    PanGu.Lucene.Analyzer.rar

    Pangu,源自中国古代神话中的开天辟地之神,象征着对复杂问题的破解,这正是该分析器的设计理念。它针对中文语言的特点,如词的边界模糊、多音字、同义词等,提供了一套高效且精确的分词策略。 Pangu分析器的核心...

    Lucene的系统结构

    - 用户输入查询条件,如“中国+北京-海淀区中关村”,查询分析器会解析布尔运算符,对每个词进行切词,然后在索引中查找匹配的文档。 - 查询器遍历索引树,找到符合查询条件的文档,并返回结果集。 - 结果集...

    Lucene介绍的PPT

    - 博客中国和Lietu.com等网站也依赖于Lucene进行全文搜索。 **数据示例与倒排索引** 在数据库中,可以使用SQL进行多字段查询,但全文检索效率较低。相比之下,Lucene利用倒排索引来提高全文搜索性能。例如,考虑...

    Lucene用到的DLL及文件

    Pangu(盘古)通常是中国开发的开源分词库,用于处理中文文本。在Lucene的上下文中,分词是将输入的文档拆分成可搜索的词汇单元,这对于构建索引和执行查询至关重要。Pangu分词库支持精准分词和模糊分词,提高了对...

    lucene相关十几个包

    Lucene是中国大百科全书,它是Java开发的全文搜索引擎库,为信息检索提供了一套强大的工具。这个压缩包包含了十几个与Lucene相关的JAR文件,这些文件分别对应于不同的Lucene组件和版本,用于实现不同的功能。让我们...

    lucene入门小例子

    Lucene是中国大百科全书式的全文检索库,它在Java世界中扮演着核心角色,为开发者提供了强大的文本搜索功能。这个“lucene入门小例子”很可能是为了帮助初学者理解并掌握Lucene的基本用法而设计的一系列示例代码。 ...

    lucene 小资源

    Lucene是中国大文本检索领域的翘楚,它是一个开源的全文搜索引擎库,由Apache软件基金会开发。这个“lucene 小资源”可能包含了作者在学习和使用Lucene过程中积累的一些资料和经验,对于初学者或者想要深入理解...

    lucene实例

    Lucene是中国大百科全书,它是Java开发的全文搜索引擎库,为开发者提供了强大的文本搜索功能。这个"lucene实例"的压缩包文件很可能是为了演示或教学如何使用Lucene进行文本检索和分析。Lucene的核心功能包括文档索引...

    精通ajax+lucene做搜索引擎

    - **功能体验**:通过访问BaiduMap([http://map.baidu.com](http://map.baidu.com)),用户可以查看中国各地的地图信息。特别地,地图提供了缩放和平移的功能,允许用户根据需求调整地图的视图范围。 - **技术...

    lucene5 源码教程

    在中国,拼音检索是一种常见的搜索方式,因为用户可能会使用拼音来输入汉字。Lucene通过集成第三方库如Pinyin4j,可以实现基于拼音的搜索。开发者可以通过对文本进行拼音转换,然后建立索引,使用户能通过输入拼音...

    Lucene关于几种中文分词的总结

    private static String string = "中华人民共和国在 1949 年建立,从此开始了新中国的伟大篇章。"; public static void Standard_Analyzer(String str) throws Exception{ Analyzer analyzer = new ...

    LuceneInAction(第2版)_中文版.rar

    《Lucene In Action》是关于Apache Lucene搜索引擎库的一本权威指南,第二版更是全面更新,涵盖了Lucene的最新版本和特性。这本书以其深入浅出的讲解方式,为读者揭示了全文检索和索引的核心原理,以及如何在实际...

    solr IK分词需要的资料

    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> <filter class="org.apache.lucene.analysis.cn.smart.FilterFactory"/> <tokenizer class="org.apache.lucene....

    Lucene in action 中文版

    中文版的发布使得更多的中国读者能够便捷地学习这一强大的全文搜索技术。 Lucene是一个开源的全文检索库,它提供了高级的文本分析和高效的索引功能,常被用于构建复杂的搜索应用。书中的内容涵盖了Lucene的基础概念...

    Lucene索引分析工具

    盘古分词是专为中国语言设计的分词工具,尤其适用于中文。分词是搜索引擎中的关键步骤,因为有效的分词可以提高查询匹配的精确度。盘古分词在处理中文词汇时,能够准确地识别出词语边界,提高搜索结果的相关性。与...

    Lucene2.1 Source Code,分词源码

    在 Lucene 2.1 版本中,它已经支持了对中文的处理,包括中文分词,这使得它在中国市场应用广泛。 Lucene 的核心设计思想是将文本数据转化为倒排索引(Inverted Index),这是一种高效的数据结构,能够快速地定位到...

    依赖Lucene的电话号码查询优化

    电话号码通常由固定的数字序列组成,如中国的11位手机号码。由于其固定格式和无字母、特殊字符的特点,电话号码的查询优化需要针对其特殊性进行设计。 在Lucene中,我们可以通过自定义QueryParser实现对电话号码的...

    lucene Analyzer 庖丁解牛 中文分词

    这些方法可以处理一些常见的词汇组合,但也会产生歧义,如“中国银行”和“中国队”,分析器需要通过上下文判断正确的分词方式。 3. **停用词处理**:“的”、“和”、“在”等常用但对检索意义不大的词语被称为...

    lucene中文分词器(paoding解牛)

    Paoding这个名字来源于中国古代的一种宰牛技术,寓意其对中文文本的“解构”能力,如同庖丁解牛般精细入微。 Paoding的核心特点包括: 1. **智能词典**:Paoding使用了一种动态加载的词典机制,能够根据上下文信息...

Global site tag (gtag.js) - Google Analytics