阅读更多
Apache Lucene 3.5 发布了。



Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。

该版本进行了大量优化、改进和Bug修复,包括:

  • 大大降低了控制开放的IndexReader上的协议索引的RAM占用(3~5倍)。
  • 新增IndexSearcher.searchAfter,可在指定ScoreDoc后返回结果(例如之前页面的最后一个文档),以支持deep页用例。
  • 新增SearcherManager,以管理共享和重新开始跨多个搜索线程的IndexSearchers。基本的IndexReader实例如果不再进行引用,则会被安全关闭。
  • 新增SearcherLifetimeManager,为跨多个请求(例如:paging/drilldown)的索引安全地提供了一个一致的视图。
  • 将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
  • 新增NGramPhraseQuery,当使用n-gram分析时,可提升30%-50%的短语查询速度。
  • 重新开放了一个API(IndexReader.openIfChanged),如果索引没有变化,则返回空值,而不是旧的reader。
  • Vector改进:支持更多查询,如通配符和用于产生摘要的边界分析。
  • 修复了若干Bug。
详细信息参阅:http://lucene.apache.org/java/3_5_0/changes/Changes.html

下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java

  • 大小: 6.4 KB
26
1
评论 共 25 条 请登录后发表评论
25 楼 sinlack 2011-11-30 14:16
IK Analyzer
gaolei33 写道
jerryllx 写道
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持

用IK Analyzer吧


3.0.3后和paoding好像就有点不兼容了,试试IK Analyzer去。。谢谢
24 楼 dongguang352 2011-11-30 10:10
caoyangx 写道
3.4升级为3.5后,IndexWriter.optimize()变为遗弃方法。看CHANGES大概是这个方法不推荐用了,在某些不常见情况下,会出现线程安全问题。
不知道有什么方法替代?

•将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
23 楼 java_user 2011-11-30 09:31
java_user 写道
疼讯用的是lucene

吗?
22 楼 java_user 2011-11-30 09:31
疼讯用的是lucene
21 楼 haiyupeter 2011-11-29 21:17
三年前用过的Lucene,如今还是持续的发展着,必需要支持的。。
20 楼 ol_beta 2011-11-29 17:42
又强大了!!!!
19 楼 huangfoxAgain 2011-11-29 15:38
= =~ 更新真快

不过还是要作死的顶!!!
18 楼 chenzhiyao83 2011-11-29 15:37
最近在使用lucene时遇到一个问题,就是在搜索“www”时返回空,没有查询串,但是查询别的词语都是正常的,我怀疑是不是有设置敏感词啥的,但是我看了代码没有发现,不知道有谁遇到过这个问题,怎么解决的?
17 楼 lmcj001 2011-11-29 15:26
[i][/i]
[img][/img][/url][url]
[flash=200,200][/flash][url][/url][img][/img]
引用
16 楼 wuxi7227 2011-11-29 14:58
了解过,维护过。没有自己写过。
15 楼 冬天秋天 2011-11-29 14:28
这个,没有学习过……
14 楼 gaolei33 2011-11-29 11:06
jerryllx 写道
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持

用IK Analyzer吧
13 楼 gaolei33 2011-11-29 11:05
毕业设计用过,是用的3.1的
12 楼 白糖_ 2011-11-29 10:50
Java全文检索引擎,这个东西非常有前景
11 楼 jerryllx 2011-11-29 10:08
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持
10 楼 xuhang1128 2011-11-28 21:23
还是值得去学习的,还是开源的
9 楼 longware 2011-11-28 20:34
偶用的时候1.9~~
8 楼 paramore 2011-11-28 15:38
NGramPhraseQuery有意思
7 楼 caoyangx 2011-11-28 14:42
3.4升级为3.5后,IndexWriter.optimize()变为遗弃方法。看CHANGES大概是这个方法不推荐用了,在某些不常见情况下,会出现线程安全问题。
不知道有什么方法替代?
6 楼 Lucius-Yu 2011-11-28 13:50
非常不错,感谢。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • apache lucene(JAVA检索引擎工具包) v8.8.2 最新版

    apache lucene中文版是一款非常好用的检索工具包,使用方便,功能强大,有需要的朋友不要错过了,而且是完全开放的,你可以自由进行使用,可以支持多种检索功能。兼容多个操作系统,下载后可以直接使用,没有任何...

  • Lucene全文检索引擎工具包-其他

    Lucene是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在...

  • Lucene—全文检索工具包

    一、Lucene简介 ...在Java开发环境⾥Lucene是⼀个成熟的免费开源工具,是⽬前最为流行的基于 Java 开源全文检索工具包。 数据总体分为两种: 结构化数据:指具有固定格式或有限长度的数据,如数据库、元数据等

  • Lucene 是一个基于 Java 的全文信息检索工具包,

    Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文...

  • Apache Lucene Java 全文检索引擎架构

    Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在...

  • Lucene全文检索

    Lucene全文检索

  • 基于java的全文搜索引擎lucene 车东_基于Java的全文检索引擎Lucene的分析与研究

    论文写作指导:请加QQ229366758摘要:Lucene 是一个用Java 写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。介绍了基于Java的全文检索引擎Lucene,包括下载与配置,以及基本概念与实现...

  • Apache Lucene全文检索和IKAnalyzer分词工具类

    * Apache Lucene全文检索和IKAnalyzer分词工具类 * <p>Company: 91注册码 * time:2014-04-22 * @author www.91zcm.com * @date * @version 1.1 */ public class LuceneUtil { /**索引创建的路径**/ ...

  • Apache Lucene 8.0.0 发布,Java 全文搜索引擎

    开发四年只会写业务代码,分布式高并发都不会还做程序员? >>> Lucene PMC 宣布推出 Ap...

  • Lucene:基于Java的全文检索引擎简介

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体...

  • 【Lucene】Apache Lucene全文检索引擎架构之入门实战

    Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,...

  • 全文检索工具Lucene入门教程

    Apache Lucene是完全用Java编写的高性能,功能齐全的,全文检索引擎工具包,通过lucene可以让程序员快速开发一个全文检索功能。 1.1什么是全文检索 在我们的生活中数据总体分为两种:结构化数据 和非结构化数据 。...

  • Lucene:基于Java的全文检索引擎简介

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体...

  • Lucene全文检索从入门到精通(精细讲解含代码笔记答疑服务)

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

  • Java全文检索(Lucene)

    全文检索(Lucene) 1.数据的分类 1>结构化数据 格式固定,长度固定,数据类型固定 如:数据库中的数据 2>非结构化数据 word文档,pdf文档,邮件,html,txt 格式不固定,长度不固定,数据类型不固定 2.数据的...

  • Lucene全文检索Java实例工程

    Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

  • Lucene:基于Java的全文检索引擎简介 笔记 by 车东

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较...

  • Umi-OCR-main.zip

    Umi-OCR-main.zip

  • 基于springboot+Web的毕业设计选题系统源码数据库文档.zip

    基于springboot+Web的毕业设计选题系统源码数据库文档.zip

Global site tag (gtag.js) - Google Analytics