资讯月刊下载
[开源软件] jsearch v1.0 发布,基于java8的高性能全文检索工具 ...
jsearch是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。 jsearch起源于superword项目。在superword项目的辅助阅读模块中,需要对大量的PDF电子文本进行高效灵活地索引和搜索,当时基于简洁高效灵活的考虑,使用Java8自己实现基于倒排的索引和搜索功能,后来考虑到基于Java8实现一个高性能的全文检索工具包是一个不错的主意,于是将 ...
[开源软件] Apache Lucene 4.7 和 Solr 4.7 发布
Apache软件基金会近日发布了最新的Lucene 4.7和Solr 4.7版本。Apache Lucene是一个使用Java开发的高性能的全文检索引擎,Solr是基于Lucene的企业级搜索平台。 此次发布的新版本中包括一些bug修复、功能改进、性能优化等,其中Lucene 4.7的主要改进如下: 新增2个常驻内存的字典(FST terms dictionary和FSTOrd terms d ...
[企业架构] Apache Lucene 4.5 和 Solr 4.5 发布
Apache软件基金会近日发布了最新的Lucene 4.5和Solr 4.5版本。 Apache Lucene是一个基于Java、高性能的全文检索引擎,Lucene 4.5的主要改进包括: 在DocValues字段中增加了对缺省值的支持 新的Lucene45Codec和Lucene45DocValues工具,支持缺省值和大多数堆栈外的数据结构 新的内存DocIdSet实现,在小型集中,该实现要 ...
[开源软件] Apache Lucene 4.4 和 Solr 4.4 发布
Apache软件基金会今天发布了Apache Lucene 4.4版本和Solr 4.4版本。 Apache Lucene是一个基于Java、高性能的全文检索引擎,4.4版本包含了一些bug修复、优化和改进,主要如下: 新的复制模块,用于复制服务器和客户端之间的索引修订 新的基于infix的搜索建议器AnalyzingInfixSuggester 新的过滤器PatternCaptureGrou ...
[企业架构] Apache Lucene 4.3 和 Solr 4.3 发布
Apache Lucene/Solr项目团队今天发布了最新的Lucene 4.3和Solr 4.3版本。 Apache Lucene是一个基于Java、高性能的全文检索引擎,4.3版本的主要改进包括: 显著改善了最小匹配布尔查询的性能,查询速度提升了40倍 新增了SortingAtomicReader(允许根据条件排序索引)和SortingMergePolicy(允许在段被合并之前排序文档) ...
[企业架构] Apache Lucene 4.2 和 Solr 4.2 发布
Apache软件基金会今天发布了Lucene 4.2和Solr 4.2正式版本。 Apache Lucene是一个基于Java的、高性能的全文检索引擎,你可以利用它来为你的应用程序加入索引和检索功能。Lucene是目前最为流行的基于 Java 开源全文检索工具包。 Lucene 4.2版本的主要亮点包括: 包含了一个新的默认编解码器(Lucene42Codec),带来了更高效的docva ...
[开源软件] Apache Lucene 4.1 和 Solr 4.1 发布
Apache软件基金会今天发布了Apache Lucene 4.1和Apache Solr 4.1。 Lucene 4.1的主要新特性包括: 新的默认编解码器(Lucene41Codec),基于先前实验的“块”索引格式,在提高性能的同时,也合并了“Appending”、“Pulsing”功能。 新的搜索建议实现AnalyzingSuggester和FuzzySuggester(允许对输入内容模 ...
[开源软件] Apache Lucene 3.6.2 和 Solr 3.6.2 发布
Apache Lucene 3.6.2和Apache Solr 3.6.2发布了。 Lucene 3.6.2包含了一些优化改进和bug修复,主要包括: 修复了当内存中项目索引需要超过2.1GB RAM时的ArrayIndexOutOfBoundsException异常问题。 修复了查询解析器中的一个布尔查询解析bug 修复了BooleanScorer2中的bug,现在使用scorer vis ...
[开源软件] Apache Lucene 4.0和Solr 4.0发布,基于Java的全文检 ...
Apache项目近日同时发布了Lucene 4.0和Solr 4.0两个版本。 Apache Lucene是一个基于Java的、高性能的全文检索引擎,你可以利用它来为你的应用程序加入索引和检索功能。Lucene是目前最为流行的基于 Java 开源全文检索工具包。 Solr是基于Lucene的高性能开源企业搜索平台,它对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言。Solr高度可 ...
[开源软件] Lucene.Net 成为 Apache 顶级开源项目
Apache基金会近日宣布,Lucene.Net已经从孵化器中毕业,成为了Apache的顶级开源项目。 Lucene.Net项目也从当前的 孵化器站点移到了apache.org主站。 Lucene.Net是Lucene的.Net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。开发人员可以基于Lucene.Ne ...
[企业架构] Apache Lucene 3.6 和 Solr 3.6 发布,基于Java的全文 ...
Apache Lucene团队今天发布了最新的3.6版本。 Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。 该版本中的主要特性如下: 除了支持Java 5和Java 6外,该版本添加了 ...
[编程语言] Apache Solr 3.5发布,基于Lucene 的全文检索服务器
随着Apache Lucene 3.5的发布,基于该版本的Apache Solr 3.5也发布了。 Solr是一个高性能、基于Apache Lucene项目、开源的企业搜索平台。它对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言。它的主要功能包括:强大的全文检索、结果高亮显示,分面搜索、动态聚类、数据库整合、富文档(如Word、PDF)处理和地理空间搜索等。Solr高度可扩展, ...
[编程语言] Apache Lucene 3.5 发布,基于Java的全文检索工具包
Apache Lucene 3.5 发布了。 Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。 该版本进行了大量优化、改进和Bug修复,包括: 大大降低了控制开放的IndexReade ...
[编程语言] J2EE 全文检索工具:DBSight 4.1.0 发布
DBsight是一套基于Java的全文检索解决方案。 DBsight的核心使用 Java开源界最为流行的Lucene框架编写,同时配合流行的 Java模板技术freemarker,velocity用于前台展现和维护用户自定义的检索展示风格。 DBSight 4.1.0 发布。该版本更新和改进如下: 增加了全局的命名数据源定义,用于简化产品环境的发布 兼容 JDBC 4.1 修复了 JSONP ...
[企业架构] Solr 1.4.1发布,基于Lucene的全文检索工具实现
近日,Solr 1.4.1发布了!此版本是一个bug修复版,同时也将Lucene升级到了Lucene 2.9.3。作为Java开源世界最为著名的全文检索工具来说,Lucene名气之大是在是可想而知了。而Solr是基于Lucene的一个企业级全文检索工具实现。 Solr底层基于Lucene,而操作完全基于web方式Solr同时提供检索高亮标记,动态集群,数据库整合,多种文档支持的特性,因此是用来制作 ...