发布IKAnalyzer中文分词器V3.1.5GA

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 13015 次

锁定老帖子主题：发布IKAnalyzer中文分词器V3.1.5GA 精华帖 (0) :: 良好帖 (2) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
ctxyzhanwei 等级: 初级会员性别: 文章: 6 积分: 30 来自: 武汉	发表时间：2010-05-18 楼主，public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2010-05-18 ctxyzhanwei 写道楼主，public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory 碰到这种问题，先检查自己的编译环境吧，IK不可能没测试就发布的。另外，建议使用3.1.6GA，支持1.5的jdk 如果你使用lucene2.9-3.0.，建议使用3.2.3Stable 版本
返回顶楼	回帖地址 0 0 请登录后投票

ww362715 等级: 初级会员性别: 文章: 2 积分: 30 来自: 福州	发表时间：2010-05-20 <fieldType name="text" class="solr.TextField" > <analyzer type="index"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> …… </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> …… </analyzer> </fieldType> 想问下这个配置是什么意思？？ <analyzer type="index"> 和 <analyzer type="query"> 用来做什么的？谢谢！！！
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2010-05-20 ww362715 写道 <fieldType name="text" class="solr.TextField" > <analyzer type="index"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> …… </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> …… </analyzer> </fieldType> 想问下这个配置是什么意思？？ <analyzer type="index"> 和 <analyzer type="query"> 用来做什么的？谢谢！！！不好意思，这个可不是IK的知识，是Solr的标准配置，请参考solr的文档吧，谢谢
返回顶楼	回帖地址 0 0 请登录后投票

ctxyzhanwei 等级: 初级会员性别: 文章: 6 积分: 30 来自: 武汉	发表时间：2010-05-21 linliangyi2007 写道 ctxyzhanwei 写道楼主，public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory 碰到这种问题，先检查自己的编译环境吧，IK不可能没测试就发布的。另外，建议使用3.1.6GA，支持1.5的jdk 如果你使用lucene2.9-3.0.，建议使用3.2.3Stable 版本我用的是lucene3.0.1，IK用的是3.2.0Stable,用3.2.3的也是这个样子，莫非我下的不是完整版的？
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2010-05-21 ctxyzhanwei 写道 linliangyi2007 写道 ctxyzhanwei 写道楼主，public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory 碰到这种问题，先检查自己的编译环境吧，IK不可能没测试就发布的。另外，建议使用3.1.6GA，支持1.5的jdk 如果你使用lucene2.9-3.0.，建议使用3.2.3Stable 版本我用的是lucene3.0.1，IK用的是3.2.0Stable,用3.2.3的也是这个样子，莫非我下的不是完整版的？那么你怎么会用到solr的API？你的solr版本多少？还是你没看API文档啊！！
返回顶楼	回帖地址 0 0 请登录后投票

ctxyzhanwei 等级: 初级会员性别: 文章: 6 积分: 30 来自: 武汉	发表时间：2010-05-21 linliangyi2007 写道 ctxyzhanwei 写道 linliangyi2007 写道 ctxyzhanwei 写道楼主，public final class IKTokenizerFactory extends BaseTokenizerFactory 中缺少org.apache.solr.analysis.BaseTokenizerFactory 碰到这种问题，先检查自己的编译环境吧，IK不可能没测试就发布的。另外，建议使用3.1.6GA，支持1.5的jdk 如果你使用lucene2.9-3.0.，建议使用3.2.3Stable 版本我用的是lucene3.0.1，IK用的是3.2.0Stable,用3.2.3的也是这个样子，莫非我下的不是完整版的？那么你怎么会用到solr的API？你的solr版本多少？还是你没看API文档啊！！啊。。。搞错了。。嘿嘿。我把它一起搞进去了。
返回顶楼	回帖地址 0 0 请登录后投票

ww362715 等级: 初级会员性别: 文章: 2 积分: 30 来自: 福州	发表时间：2010-06-09 可不可以大概的讲下正向迭代最细粒度切分算法！！ thank you
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2010-06-09 ww362715 写道可不可以大概的讲下正向迭代最细粒度切分算法！！ thank you 输入“中华人民共和国” 输出中华\|华人\|人民\|共和\|共和国\|人民共和国\|中华人民共和国这些都是包含在词库中的有效词，从左到右（正向），按照最细粒度（能成词的都切分）输出，在对文章扫描过程中，使用了迭代匹配，这样只要扫过一遍，就能输出所有交叉的次元。
返回顶楼	回帖地址 0 0 请登录后投票

comsci 等级: 性别: 文章: 989 积分: 2110 来自: 成都	发表时间：2010-06-09 linliangyi兄，你可以用IKANALYZER参加“龙芯杯”开源软件大奖赛这里是官网 http://www.freeloongson.com/
返回顶楼	回帖地址 0 0 请登录后投票

« 上一页 1 2 3 4 5 下一页 »

论坛首页 → Java企业应用版

跳转论坛: