阅读更多

3顶
0踩

互联网

转载新闻 Lucene 2.9 release

2009-09-28 11:16 by 见习记者 chenlb 评论(3) 有3632人浏览

This release has many improvements since release 2.4.1, including:

  • Per segment searching and caching (can lead to much faster reopen among other things)
  • Near real-time search capabilities added to IndexWriter
  • New Query types
  • Smarter, more scalable multi-term queries (wildcard, range, etc)
  • A freshly optimized Collector/Scorer API
  • Improved Unicode support and the addition of Collation contrib
  • A new Attribute based TokenStream API
  • A new QueryParser framework in contrib with a core QueryParser replacement impl included.
  • Scoring is now optional when sorting by Field, or using a custom Collector, gaining sizable performance when scores are not required.
  • New analyzers (PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer)
  • New fast-vector-highlighter for large documents
  • Lucene now includes high-performance handling of numeric fields. Such fields are indexed with a trie structure, enabling simple to use and much faster numeric range searching without having to externally pre-process numeric values into textual values.

See CHANGES for details.

 

While we generally try and maintain full backwards compatibility between major versions, Lucene 2.9 has a variety of breaks that are spelled out in the 'Changes in backwards compatibility policy' section of CHANGES. We recommend that you recompile your application with Lucene 2.9 rather than attempting to “drop” it in. This will alert you to any issues you may have to fix if you are affected by one of the backward compatibility breaks.

 

Binary and source distributions are available here.

 

Maven artifacts are available here.

3
0
评论 共 3 条 请登录后发表评论
3 楼 CapsLk 2009-11-03 19:26
SmartChineseAnalyzer官方提醒要慎重考虑使用。
2 楼 chenlb 2009-09-29 18:16
SmartChineseAnalyzer

项目地址: http://code.google.com/p/imdict-chinese-analyzer/
1 楼 longware 2009-09-29 10:28
good news

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • Lucene2.9 范围查询Range Query

    Apache Lucene 2.9的改进 数字的处理方式的支持,尤其是在范围查询(如“给我找出价格在0.5到9.99英镑之间的CD”)的场景下。在2.9版之前,Lucene的查询完全基于文本,因此对于数字的处理则变成了基于字符串的精确...

  • Lucene文件检索项目实战

    1、需求分析 假设有一批文档,格式有DOC、DOCX、PPT、PPTX、TXT、PDF这几种,实现一个...概括如下,文件存储系统中存放了不同类型的文件,后台通过程序提取出文件名和文件内容,使用Lucene对文件名和文件内容进行...

  • Lucene总结四:Lucene的索引文件格式(2)

    上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。下面对这三种信息一一介绍。 4.1. 正向信息 ...

  • Lucene 基本原理(四)索引的构成

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将...

  • Lucene实现SearchManager近实时搜索

    lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通 过线程跟踪,在相对很短的时间反映给给用户程序的调用 NRTManager通过管理IndexWriter对象,并将IndexWriter的一些方法(增...

  • Lucene的索引文件格式

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程...

  • 深入Lucene的索引文件

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将...

  • lucene Version parameter

    Version:(Lucene 2.9以后出现) 如果你使用Version.LUCENE_CURRENT变量,以后当你升级lucene的时候可能会发生相当大的改变。如果向后兼容对你来说比较重要,你还是需要使用比较精确的版本号。如Version.LUCENE_30,...

  • Lucene.Net 站内搜索

    Lucene.Net 站内搜索 一 全文检索: like查询是全表扫描(为性能杀手)Lucene.Net搜索引擎,开源,而sql搜索引擎是收费的Lucene.Net只是一个全文检索开发包(只是帮我们存数据取数据,并没有界面,可以看作一个数据库...

  • Lucene Change Log (Release 3.0.0 [2009-11-25])

    Lucene Change Log $Id: CHANGES.txt 881216 2009-11-17 09:45:02Z uschindler $ ======================= Release 3.0.0 2009-11-25 ======================= Changes in backwards compatibility policy ...

  • Spring+lucene+mybatis+FastDFS+memcached, maven web 开发 dependencies

    maven Spring web开发jar 依赖坐标dependencies 1.7 UTF-8 UTF-8 4.1.6.RELEASE 4.12 2.5.4 1.6.2.RELEASE org.apache.poi poi-scratchpad

  • Lucene索引删除详解

     原来的版本中Lucene的删除一直是由IndexReader来完成的,在Lucene2.9中虽可以用IndexWriter来删除,但是其真实的实现是在IndexWriter中保存了readerpool,当IndexWriter向索引文件提交删除的时候,仍然是从...

  • Lucene学习总结之三:Lucene的索引文件格式(2)

    上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。下面对这三种信息一一介绍。 4.1. 正向信息 ...

  • Lucene4 TokenStream

    package org.apache.lucene.analysis; /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for

  • Lucene3.0原理与代码分析

    Lucene 3.0 原理与代码分析 作者: forfuture1978 http://forfuture1978.iteye.com 本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。 http://www.iteye.com - 做最棒的软件开发交流社区 第 1 / ...

  • 网络安全中的系统信息收集与防护机制探讨

    内容概要:本文档深入介绍了网络安全领域中的系统信息收集方法以及常见的保护措施。主要分为三大板块:获取网络和服务信息的方法、克服CDN和WAF等障碍的技术手段。其中包括对服务厂商、网络架构的理解,对于协议应用、内部网络设备的认识,以及面对各种安全措施如CDN服务、负载均衡器、Web应用防火墙时,如何进行有效的信息搜集。同时推荐了多个相关工具如Masscan、Nmap、Wafw00f及Kali自带动态二进制翻译工具。 适合人群:适合从事网络安全工作的专业人士和技术爱好者,特别是对信息安全有浓厚兴趣的学习者。 使用场景及目标:帮助技术人员提升网络安全领域的实战技能,掌握高效的信息收集技巧,了解并能够对抗多种常见的网络防护技术。 其他说明:文中提供了详细的演示案例和实际操作指导,辅以丰富的外部资源链接支持进一步学习。

  • 基于WPF开发的视频播放器

    基于WPF开发的视频播放器,实现视频的手动添加,播放,暂停,停止,音量,播放速度,以及进度显示。主要采用以下技术: 开发技术:WPF,.Net6.0 开发工具:Visual Studio 2022 具体可参考个人CSDN博客。

  • 中国分地区地级市泰尔指数数据集(2000-2019).zip

    中国分地区地级市泰尔指数数据集(2000-2019).zip

  • Pillow_SIMD-6.0.0.post0+avx2-cp35-cp35m-win32.whl.rar

    python whl离线安装包 pip安装失败可以尝试使用whl离线安装包安装 第一步 下载whl文件,注意需要与python版本配套 python版本号、32位64位、arm或amd64均有区别 第二步 使用pip install XXXXX.whl 命令安装,如果whl路径不在cmd窗口当前目录下,需要带上路径 WHL文件是以Wheel格式保存的Python安装包, Wheel是Python发行版的标准内置包格式。 在本质上是一个压缩包,WHL文件中包含了Python安装的py文件和元数据,以及经过编译的pyd文件, 这样就使得它可以在不具备编译环境的条件下,安装适合自己python版本的库文件。 如果要查看WHL文件的内容,可以把.whl后缀名改成.zip,使用解压软件(如WinRAR、WinZIP)解压打开即可查看。 为什么会用到whl文件来安装python库文件呢? 在python的使用过程中,我们免不了要经常通过pip来安装自己所需要的包, 大部分的包基本都能正常安装,但是总会遇到有那么一些包因为各种各样的问题导致安装不了的。 这时我们就可以通过尝试去Python安装包大全中(whl包下载)下载whl包来安装解决问题。

Global site tag (gtag.js) - Google Analytics