阅读更多
Apache Lucene 3.5 发布了。



Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。

该版本进行了大量优化、改进和Bug修复,包括:

  • 大大降低了控制开放的IndexReader上的协议索引的RAM占用(3~5倍)。
  • 新增IndexSearcher.searchAfter,可在指定ScoreDoc后返回结果(例如之前页面的最后一个文档),以支持deep页用例。
  • 新增SearcherManager,以管理共享和重新开始跨多个搜索线程的IndexSearchers。基本的IndexReader实例如果不再进行引用,则会被安全关闭。
  • 新增SearcherLifetimeManager,为跨多个请求(例如:paging/drilldown)的索引安全地提供了一个一致的视图。
  • 将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
  • 新增NGramPhraseQuery,当使用n-gram分析时,可提升30%-50%的短语查询速度。
  • 重新开放了一个API(IndexReader.openIfChanged),如果索引没有变化,则返回空值,而不是旧的reader。
  • Vector改进:支持更多查询,如通配符和用于产生摘要的边界分析。
  • 修复了若干Bug。
详细信息参阅:http://lucene.apache.org/java/3_5_0/changes/Changes.html

下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java

  • 大小: 6.4 KB
26
1
评论 共 25 条 请登录后发表评论
25 楼 sinlack 2011-11-30 14:16
IK Analyzer
gaolei33 写道
jerryllx 写道
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持

用IK Analyzer吧


3.0.3后和paoding好像就有点不兼容了,试试IK Analyzer去。。谢谢
24 楼 dongguang352 2011-11-30 10:10
caoyangx 写道
3.4升级为3.5后,IndexWriter.optimize()变为遗弃方法。看CHANGES大概是这个方法不推荐用了,在某些不常见情况下,会出现线程安全问题。
不知道有什么方法替代?

•将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
23 楼 java_user 2011-11-30 09:31
java_user 写道
疼讯用的是lucene

吗?
22 楼 java_user 2011-11-30 09:31
疼讯用的是lucene
21 楼 haiyupeter 2011-11-29 21:17
三年前用过的Lucene,如今还是持续的发展着,必需要支持的。。
20 楼 ol_beta 2011-11-29 17:42
又强大了!!!!
19 楼 huangfoxAgain 2011-11-29 15:38
= =~ 更新真快

不过还是要作死的顶!!!
18 楼 chenzhiyao83 2011-11-29 15:37
最近在使用lucene时遇到一个问题,就是在搜索“www”时返回空,没有查询串,但是查询别的词语都是正常的,我怀疑是不是有设置敏感词啥的,但是我看了代码没有发现,不知道有谁遇到过这个问题,怎么解决的?
17 楼 lmcj001 2011-11-29 15:26
[i][/i]
[img][/img][/url][url]
[flash=200,200][/flash][url][/url][img][/img]
引用
16 楼 wuxi7227 2011-11-29 14:58
了解过,维护过。没有自己写过。
15 楼 冬天秋天 2011-11-29 14:28
这个,没有学习过……
14 楼 gaolei33 2011-11-29 11:06
jerryllx 写道
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持

用IK Analyzer吧
13 楼 gaolei33 2011-11-29 11:05
毕业设计用过,是用的3.1的
12 楼 白糖_ 2011-11-29 10:50
Java全文检索引擎,这个东西非常有前景
11 楼 jerryllx 2011-11-29 10:08
请问一下,能支持中文分词吗,如能支持,有人能详细介绍一下,如不支持,哪款工具能兼容,上次我用lucene3.3与MMAnalyzer1.5报ClassNotFound错误,请问哪个版本支持
10 楼 xuhang1128 2011-11-28 21:23
还是值得去学习的,还是开源的
9 楼 longware 2011-11-28 20:34
偶用的时候1.9~~
8 楼 paramore 2011-11-28 15:38
NGramPhraseQuery有意思
7 楼 caoyangx 2011-11-28 14:42
3.4升级为3.5后,IndexWriter.optimize()变为遗弃方法。看CHANGES大概是这个方法不推荐用了,在某些不常见情况下,会出现线程安全问题。
不知道有什么方法替代?
6 楼 Lucius-Yu 2011-11-28 13:50
非常不错,感谢。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • apache lucene(JAVA检索引擎工具包) v8.8.2 最新版

    apache lucene中文版是一款非常好用的检索工具包,使用方便,功能强大,有需要的朋友不要错过了,而且是完全开放的,你可以自由进行使用,可以支持多种检索功能。兼容多个操作系统,下载后可以直接使用,没有任何...

  • Lucene全文检索引擎工具包-其他

    Lucene是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在...

  • Lucene—全文检索工具包

    一、Lucene简介 ...在Java开发环境⾥Lucene是⼀个成熟的免费开源工具,是⽬前最为流行的基于 Java 开源全文检索工具包。 数据总体分为两种: 结构化数据:指具有固定格式或有限长度的数据,如数据库、元数据等

  • Lucene 是一个基于 Java 的全文信息检索工具包,

    Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文...

  • Apache Lucene Java 全文检索引擎架构

    Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在...

  • Lucene全文检索

    Lucene全文检索

  • 基于java的全文搜索引擎lucene 车东_基于Java的全文检索引擎Lucene的分析与研究

    论文写作指导:请加QQ229366758摘要:Lucene 是一个用Java 写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。介绍了基于Java的全文检索引擎Lucene,包括下载与配置,以及基本概念与实现...

  • Apache Lucene全文检索和IKAnalyzer分词工具类

    * Apache Lucene全文检索和IKAnalyzer分词工具类 * <p>Company: 91注册码 * time:2014-04-22 * @author www.91zcm.com * @date * @version 1.1 */ public class LuceneUtil { /**索引创建的路径**/ ...

  • Apache Lucene 8.0.0 发布,Java 全文搜索引擎

    开发四年只会写业务代码,分布式高并发都不会还做程序员? >>> Lucene PMC 宣布推出 Ap...

  • Lucene:基于Java的全文检索引擎简介

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体...

  • 【Lucene】Apache Lucene全文检索引擎架构之入门实战

    Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,...

  • 全文检索工具Lucene入门教程

    Apache Lucene是完全用Java编写的高性能,功能齐全的,全文检索引擎工具包,通过lucene可以让程序员快速开发一个全文检索功能。 1.1什么是全文检索 在我们的生活中数据总体分为两种:结构化数据 和非结构化数据 。...

  • Lucene:基于Java的全文检索引擎简介

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体...

  • Lucene全文检索从入门到精通(精细讲解含代码笔记答疑服务)

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

  • Java全文检索(Lucene)

    全文检索(Lucene) 1.数据的分类 1>结构化数据 格式固定,长度固定,数据类型固定 如:数据库中的数据 2>非结构化数据 word文档,pdf文档,邮件,html,txt 格式不固定,长度不固定,数据类型不固定 2.数据的...

  • Lucene全文检索Java实例工程

    Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

  • Lucene:基于Java的全文检索引擎简介 笔记 by 车东

    Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较...

  • 电镀生产线中西门子S7-300 PLC控制程序详解及其应用

    内容概要:本文详细介绍了应用于电镀生产线的西门子S7-300 PLC控制系统的程序设计、硬件配置以及调试过程中积累的实际经验。主要内容涵盖温度控制、条码记录、行车定位、故障排查等方面的技术细节。文中展示了多个关键功能模块的具体实现方法,如PID温度控制、条码数据处理、行车定位判断等,并分享了一些实用的调试技巧和注意事项。此外,还讨论了硬件配置中的重要细节,如模块地址分配、网络拓扑设计等。 适合人群:从事自动化控制领域的工程师和技术人员,尤其是对PLC编程有一定基础的人群。 使用场景及目标:适用于需要深入了解和掌握电镀生产线自动化控制技术的专业人士。目标是帮助读者理解S7-300 PLC在电镀生产线中的具体应用,提高实际项目的开发效率和可靠性。 其他说明:文章不仅提供了详细的程序代码示例,还分享了许多来自一线的真实案例和实践经验,对于解决实际工程中的问题具有很高的参考价值。

  • COMSOL仿真中固体超声导波的二维建模与分析:基于汉宁窗调制的200kHz正弦激励信号

    内容概要:本文详细介绍了使用COMSOL Multiphysics进行固体超声导波的二维仿真过程。作者通过建立一个10mm×100mm的铝板模型,应用汉宁窗调制的5周期200kHz正弦激励信号,研究了超声导波在铝板中的传播特性及其模式转换现象。文中涵盖了从模型构建、材料参数设置、网格划分、边界条件设定、激励信号施加到求解设置以及结果分析的完整流程。特别强调了汉宁窗调制的作用,即减少频谱泄漏并提高信号质量。 适合人群:从事超声检测、材料科学、物理学等相关领域的研究人员和技术人员,尤其是那些希望深入了解COMSOL仿真工具及其在超声导波研究中应用的人群。 使用场景及目标:适用于需要精确模拟超声波在固体介质中传播的研究项目,旨在验证理论预测、优化实验设计、评估不同材料和结构对超声波的影响。此外,还可以用于教学目的,帮助学生掌握COMSOL软件的操作方法和超声导波的基础知识。 其他说明:文中提供了详细的参数设置指导和代码片段,有助于读者快速复现仿真过程。同时,作者分享了一些实用技巧,如如何正确设置网格大小、选择合适的窗函数等,以确保仿真结果的准确性。

Global site tag (gtag.js) - Google Analytics