`
kong0itey
  • 浏览: 305976 次
社区版块
存档分类
最新评论

[转载]paoding分词引擎与lucene3的兼容

    博客分类:
  • java
阅读更多
1.用下面“需要替换的类”中的3个.java文件替换庖丁中的同样包名和类名下的.java文件

2.把paoding的PaodingTokenizer类的164行注释掉,就不会报错,像下面这样

super.close();
// input.close();//这句导致报错

,已经在lucene3.0.3试过

3.选择庖丁的源代码,重新打jar包,jar已经打好了,在下面可以下载
分享到:
评论

相关推荐

    Paoding中文分词

    4. “lucene”:这是一个开源全文检索库,表明“Paoding中文分词”可能与Lucene有集成或兼容性,可以用于提高搜索和索引效率。 **压缩包子文件的文件名称列表解析** 1. `analyzer.bat` 和 `analyzer.sh`:这两个...

    与lucene3.0兼容的庖丁jar包

    在使用lucene3与paoding集成的时候可能会出现以下错误: Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementToken()Z at org.apache.lucene.index....

    中文分词器Paoding(庖丁)

    很好用的中文分词器,能很好的与搜索引擎框架整合,此jar兼容支持Lucene3.0以上版本。

    适合lucene3.0用的paoding-analysis的jar包

    总的来说,Paoding-Analysis是Lucene3.0处理中文搜索的得力助手,而提供的与Spring兼容的jar包则消除了集成过程中的潜在障碍。通过正确地集成和使用,开发者可以构建出强大的中文搜索引擎,为用户提供更精准、更便捷...

    兼容solr4.10.2的ik-mmseg4j-paoding分词器

    能兼容solr-4.10.2的分词器,大礼包全放送.包括IK分词器,mmseg4j分词器,庖丁分词器.都是经本人测试可用,其中mmseg4j与庖丁都是下载源码,修改重编译并测试生成的.希望大家喜欢.至于与solr的整合方式,网上很多,这里就不...

    最新庖丁分词源代码(for lucene3.0)

    庖丁分词是一款知名的中文分词工具,专为Apache Lucene搜索引擎库设计和优化。Lucene是一个开源全文检索库,广泛应用于各种信息检索系统。在本压缩包中,你将找到针对Lucene 3.0版本优化的庖丁分词源代码。 1. **...

    paoding-analysis3.0.jar

    在 "paoding-analysis3.0_for_lucene-core-3.3" 这个压缩包中,包含了 Paoding 分词器的特定版本,确保与 Lucene 3.3.0 版本兼容。 Paoding Analysis 的特点主要包括: 1. **高性能**:采用了高效的分词算法,使得...

    Lucene使用

    Lucene采用3.03版,太新版和 ik paoding不兼容。 ----------------------------------------- 极易分词只支持1.9-2.4版,未测试 IKAnalyzer分词 2012版不支持,采用3.2.8版 在使用2012版时异常:...

    solr安装设置资料

    Apache Solr是一款开源的高性能全文搜索引擎,基于Lucene库构建。它提供了一个高度可扩展的企业级搜索平台,能够支持大量的文档数据,并具备强大的查询功能。Solr适用于各种规模的应用场景,包括网站搜索、电子商务...

    solr 企业搜索引擎教程

    - **兼容性**:Solr创建的索引与Lucene搜索引擎库完全兼容,这意味着Solr可以读取并利用其他Lucene应用程序中已有的索引。 - **数据导入**:从1.3版本开始,Solr支持从数据库(JDBC)、RSS提要、Web页面和文件中导入...

    开源企业搜索引擎SOLR的 应用教程

    Paoding是一个高效的中文分词器,同样可以集成到Solr中。 1. 下载Paoding插件。 2. 配置schema.xml中的Analyzer以使用Paoding。 **2.3 多核(MultiCore)配置** - **2.3.1 MultiCore的配置方法** 多核配置可以让...

    java常用lib库说明

    - **兼容性**:与主流的Java持久化框架(如Hibernate)高度兼容,易于集成。 #### Hibernate与连接池的选择 - **DBCP**:Data Source Pooling for JDBC,是Apache Commons Pool的一个子项目,用于实现数据库连接池...

    java开源包3

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包1

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包11

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包2

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包6

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

Global site tag (gtag.js) - Google Analytics