论坛首页 Java企业应用论坛

发布IKAnalyzer中文分词器V3.1.5GA

浏览 13015 次
精华帖 (0) :: 良好帖 (2) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2010-05-18  
楼主,public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory
0 请登录后投票
   发表时间:2010-05-18  
ctxyzhanwei 写道
楼主,public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory


碰到这种问题,先检查自己的编译环境吧,IK不可能没测试就发布的。

另外,建议使用3.1.6GA,支持1.5的jdk

如果你使用lucene2.9-3.0.,建议使用3.2.3Stable 版本
0 请登录后投票
   发表时间:2010-05-20  
<fieldType name="text" class="solr.TextField" > 
    <analyzer type="index"> 
        <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> 
……  
 
    </analyzer> 
    <analyzer type="query"> 
        <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> 
    ……  
    </analyzer> 
</fieldType> 


想问下这个配置是什么意思?? <analyzer type="index">  和    <analyzer type="query">  用来做什么的?
谢谢!!!
0 请登录后投票
   发表时间:2010-05-20  
ww362715 写道
<fieldType name="text" class="solr.TextField" > 
    <analyzer type="index"> 
        <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> 
……  
 
    </analyzer> 
    <analyzer type="query"> 
        <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> 
    ……  
    </analyzer> 
</fieldType> 


想问下这个配置是什么意思?? <analyzer type="index">  和    <analyzer type="query">  用来做什么的?
谢谢!!!


不好意思,这个可不是IK的知识,是Solr的标准配置,请参考solr的文档吧,谢谢
0 请登录后投票
   发表时间:2010-05-21  
linliangyi2007 写道
ctxyzhanwei 写道
楼主,public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory


碰到这种问题,先检查自己的编译环境吧,IK不可能没测试就发布的。

另外,建议使用3.1.6GA,支持1.5的jdk

如果你使用lucene2.9-3.0.,建议使用3.2.3Stable 版本

我用的是lucene3.0.1,IK用的是3.2.0Stable,用3.2.3的也是这个样子,莫非我下的不是完整版的?
0 请登录后投票
   发表时间:2010-05-21  
ctxyzhanwei 写道
linliangyi2007 写道
ctxyzhanwei 写道
楼主,public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory


碰到这种问题,先检查自己的编译环境吧,IK不可能没测试就发布的。

另外,建议使用3.1.6GA,支持1.5的jdk

如果你使用lucene2.9-3.0.,建议使用3.2.3Stable 版本

我用的是lucene3.0.1,IK用的是3.2.0Stable,用3.2.3的也是这个样子,莫非我下的不是完整版的?


那么你怎么会用到solr的API?你的solr版本多少?还是你没看API文档啊!!
0 请登录后投票
   发表时间:2010-05-21  
linliangyi2007 写道
ctxyzhanwei 写道
linliangyi2007 写道
ctxyzhanwei 写道
楼主,public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory


碰到这种问题,先检查自己的编译环境吧,IK不可能没测试就发布的。

另外,建议使用3.1.6GA,支持1.5的jdk

如果你使用lucene2.9-3.0.,建议使用3.2.3Stable 版本

我用的是lucene3.0.1,IK用的是3.2.0Stable,用3.2.3的也是这个样子,莫非我下的不是完整版的?


那么你怎么会用到solr的API?你的solr版本多少?还是你没看API文档啊!!

啊。。。 搞错了。。嘿嘿。我把它一起搞进去了。
0 请登录后投票
   发表时间:2010-06-09  
可不可以大概的讲下正向迭代最细粒度切分算法!!
thank you
0 请登录后投票
   发表时间:2010-06-09  
ww362715 写道
可不可以大概的讲下正向迭代最细粒度切分算法!!
thank you


输入“中华人民共和国” 输出 中华|华人|人民|共和|共和国|人民共和国|中华人民共和国

这些都是包含在词库中的有效词,从左到右(正向),按照最细粒度(能成词的都切分)输出,在对文章扫描过程中,使用了迭代匹配,这样只要扫过一遍,就能输出所有交叉的次元。
0 请登录后投票
   发表时间:2010-06-09  
linliangyi兄,你可以用IKANALYZER参加“龙芯杯”开源软件大奖赛

这里是官网
http://www.freeloongson.com/
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics