`
healthandbeauty
  • 浏览: 168130 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

lucene MMAnalyzer 全文检索 支持英文

阅读更多
我们业务需求要支持英文检索 没办法  。说这个分词器MMAnalyzer
1、支持英文、数字、中文(简体)混合分词

2、常用的数量和人名的匹配

3、超过22万词的词库整理

4、实现正向最大匹配算法

5、词典的动态扩展

6、分词效率: 第一次分词需要1-2秒(读取词典),之后速度基本与Lucene自带分词器持平。内存消耗: 30M+

但是我把这个je-analysis-1.5.1.jar 加入到eclipse里面后不能把jeasy.analysis.MMAnalyzer这个类引入加入进来。这是咋回事,请高人指点。在此先谢了。

在线等待。。。。。
分享到:
评论
1 楼 healthandbeauty 2009-07-17  
o(∩_∩)o...。。。。
问题解决了。

相关推荐

    MMAnalyzer 分词jar包(lucene-core-2.4.1.jar je-analysis-1.5.3.jar)

    在Java环境中,Apache Lucene是一个广泛使用的全文搜索引擎库,它提供了丰富的文本处理工具,包括分词功能。 标题提到的"MMAnalyzer 分词jar包"是基于Lucene的一个中文分词组件,名为Jeasy Analysis,具体版本为...

    MMAnalyzer 分词必导入jar包(lucene-core-2.4.1.jar je-analysis-1.5.3.jar)

    Lucene是一个高性能、全功能的全文搜索引擎库,它提供了一套完整的搜索解决方案,包括索引、查询解析、排序等。`lucene-core-2.4.1.jar`是Lucene的核心库,包含了Lucene的基础组件和API,如文档处理、索引操作、查询...

    MMAnalyzer分词jar包

    尽管MMAnalyzer并不直接依赖于Lucene进行分词,但许多使用MMAnalyzer的项目可能会结合Lucene来构建全文检索系统。Lucene提供了一套完整的文本处理方案,包括索引、搜索、高亮显示等功能,与MMAnalyzer配合可以构建...

    MMAnalyzer涉及的jar包 (2).zip

    2. **lucene-core-2.4.1.jar**:Lucene是Apache软件基金会的一个开源全文检索库,它为MMAnalyzer提供了底层的索引和搜索支持。在MMAnalyzer中,Lucene主要用于高效地存储和检索分词结果,以便进行后续的数据分析或...

    lucene-core-2.9.4.jar.zip

    在信息检索和文本处理领域,Apache Lucene是一个广泛使用的开源全文搜索引擎库。标题中的"lucene-core-2.9.4.jar.zip"是一个包含Lucene核心库2.9.4版本的压缩文件,它在Java开发环境中扮演着关键角色,尤其是对于...

    lucene-初级学习资料.ppt

    Lucene 是一个强大的全文搜索引擎库,它是用 Java 编写的开放源代码软件。它并不是一个完整的搜索引擎系统,而是一个提供核心搜索功能的 API,允许开发者构建自己的搜索引擎应用程序。Lucene 提供了对文本数据的索引...

    lucene 分组统计

    通过使用 `FieldCache`,Lucene 能够快速访问索引中的字段数据而无需每次都重新计算或检索,从而显著提高查询性能。在进行分组统计时,`FieldCache` 提供了一种高效的途径来访问和操作索引字段数据。 #### 三、...

    Lucene学习总结

    在本文中,我们将深入探讨Apache Lucene,这是一个广泛使用的全文搜索引擎库,专为软件开发者设计,以便在他们的应用程序中实现高效、快速的全文检索功能。Lucene提供了丰富的API,可以帮助开发者构建自己的搜索引擎...

    Lucene中文分词组件 JE-Analysis 1.4.0

    支持英文、数字、中文(简体)混合分词 常用的数量和人名的匹配 超过22万词的词库整理 实现正向最大匹配算法 //采用正向最大匹配的中文分词算法,相当于分词粒度等于0 MMAnalyzer analyzer = new ...

    基于正向最大匹配和朴素贝叶斯算法的文本分类源码

    "lucene-core-2.3.2.jar"可能包含了对朴素贝叶斯分类器的支持,Lucene是一个强大的全文搜索引擎库,它内部实现了多种文本处理和分类算法。 在实际应用中,使用FMM进行预处理得到分词结果后,这些词语会转化为数值...

    Window下Solr1.4安装部署

    Apache Solr 是一个高性能、基于Lucene的全文检索服务。它提供了丰富的功能集,包括高度可扩展性、易于部署和强大的搜索功能。Solr 1.4版本是在2009年发布的稳定版本之一,尽管现在已经有更高版本可用,但在某些情况...

Global site tag (gtag.js) - Google Analytics