发布IKAnalyzer中文分词器V3.1.3GA生日祝福版

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 8116 次

锁定老帖子主题：发布IKAnalyzer中文分词器V3.1.3GA生日祝福版精华帖 (3) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (1)
作者	正文
linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2009-09-25 最后修改：2009-09-25 相关推荐: 如何编写技术解决方案如何写好一份解决方案如何写好解决方案解决方案怎么写好的售前解决方案需要这样写更多相关推荐生日祝福谨以此版本献给我的老婆，今天是她的生日，在这里，要祝福她生日快乐，天天无忧无虑。感谢她一直以来对我从事开源项目的支持和鼓励，想对她说：谢谢你，亲爱的，有你在我身边，每一天都洋溢着满满的幸福感觉！ V3.1.3GA版本变更： 1.开放了对中文停止词表的支持，用户可以通过文件配置或API来扩展自己的停止词表类：org.wltea.analyzer.dic.Dictionary 方法：public static void loadExtendStopWords(List<String> extStopWords) 说明：加载用户扩展的停止词列表，从版本V3.1.3起参数1：List<String> extStopWords，扩展的停止词列表返回值：无 IKAnalyzer.cfg.xml文件的配置 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典 --> <entry key="ext_dict">/mydict.dic; /com/mycompany/dic/mydict2.dic;</entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">/ext_stopword.dic</entry> </properties> 注意：添加停止词可能会对部分的人名切分造成影响，如：陈忠和的“和”，胡适之的“之”，这些被认为是停止词的字通常可能是人名的一部分。 2.修订了3.1.2GA中，对中文词头单字切分的bug。下载：IKAnalyzer3.1.3GA完整包更多详细请参看《IKAnalyzer中文分词器V3.1.3使用手册》声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

josephlong 等级: 初级会员文章: 8 积分: 30 来自: ...	发表时间：2009-09-25 你的版本不能支持新的solr1.3，我在用 public　class　ChineseTokenizerFactory　extends　BaseTokenizerFactory　{　　　@Override　　public　TokenStream　create(Reader　reader)　{　　return　new　IKAnalyzer().tokenStream("text",　reader);　　}　　的时候错 solr1.3用Tokenizer不是用TokenStream 请问这个问题如何解决呀谢谢
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2009-09-25 最后修改：2009-09-25 josephlong 写道你的版本不能支持新的solr1.3，我在用 public　class　ChineseTokenizerFactory　extends　BaseTokenizerFactory　{　　　@Override　　public　TokenStream　create(Reader　reader)　{　　return　new　IKAnalyzer().tokenStream("text",　reader);　　}　　的时候错 solr1.3用Tokenizer不是用TokenStream 请问这个问题如何解决呀谢谢 1.请将详细的异常告诉我。 2.从代码上看返回的是TokenStream对象，而你说的是Tokenizer。就lucene而言，Tokenizer是继承与TokenStream的。 3.IK有自己的IKTokenizer.class是继承Tokenizer类的。 4.你可以自己使用IKSegmentation类实现自己的分词器接口，IKSegmentation是一个与lucene无关的单独的分词器，请参考使用手册。
返回顶楼	回帖地址 0 0 请登录后投票

dingyuan 等级: 初级会员性别: 文章: 82 积分: 30 来自: 广州	发表时间：2009-09-25 恭喜恭喜，今天也是我生日
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2009-09-25 dingyuan 写道恭喜恭喜，今天也是我生日生日快乐，呵呵
返回顶楼	回帖地址 0 0 请登录后投票

josephlong 等级: 初级会员文章: 8 积分: 30 来自: ...	发表时间：2009-09-25 这个就是详细的呀，我是在网上看到ik和solr整合的我也照着做了，出现下面说的情况，你有官方的整合方案吗？ linliangyi2007 写道 josephlong 写道你的版本不能支持新的solr1.3，我在用 public　class　ChineseTokenizerFactory　extends　BaseTokenizerFactory　{　　　@Override　　public　TokenStream　create(Reader　reader)　{　　return　new　IKAnalyzer().tokenStream("text",　reader);　　}　　的时候错 solr1.3用Tokenizer不是用TokenStream 请问这个问题如何解决呀谢谢 1.请将详细的异常告诉我。 2.从代码上看返回的是TokenStream对象，而你说的是Tokenizer。就lucene而言，Tokenizer是继承与TokenStream的。 3.IK有自己的IKTokenizer.class是继承Tokenizer类的。 4.你可以自己使用IKSegmentation类实现自己的分词器接口，IKSegmentation是一个与lucene无关的单独的分词器，请参考使用手册。
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2009-09-25 josephlong 写道这个就是详细的呀，我是在网上看到ik和solr整合的我也照着做了，出现下面说的情况，你有官方的整合方案吗？晕死！请你把程序执行时抛出的异常发给我好吧，我要的不是你的代码啊，而是执行后抛的异常。
返回顶楼	回帖地址 0 0 请登录后投票

josephlong 等级: 初级会员文章: 8 积分: 30 来自: ...	发表时间：2009-09-25 关键是这个代码都没有编译过去呀，他们的不是一个对象类型，所以无法编译明白了吗 linliangyi2007 写道 josephlong 写道这个就是详细的呀，我是在网上看到ik和solr整合的我也照着做了，出现下面说的情况，你有官方的整合方案吗？晕死！请你把程序执行时抛出的异常发给我好吧，我要的不是你的代码啊，而是执行后抛的异常。
返回顶楼	回帖地址 0 0 请登录后投票

linliangyi2007 等级: 性别: 文章: 992 积分: 1266 来自: 福州	发表时间：2009-09-25 最后修改：2009-09-25 josephlong 写道关键是这个代码都没有编译过去呀，他们的不是一个对象类型，所以无法编译明白了吗 linliangyi2007 写道 josephlong 写道这个就是详细的呀，我是在网上看到ik和solr整合的我也照着做了，出现下面说的情况，你有官方的整合方案吗？晕死！请你把程序执行时抛出的异常发给我好吧，我要的不是你的代码啊，而是执行后抛的异常。你的JDK版本不对，class loader没法载入，用JDK6.0的吧。或者下载IK的源码，在本地进行重新编译。
返回顶楼	回帖地址 0 0 请登录后投票

josephlong 等级: 初级会员文章: 8 积分: 30 来自: ...	发表时间：2009-09-26 晕，我已经说了 solr1.3用Tokenizer做为返回类型，而例子是TokenStream 所以报错呀，明白了吗！ linliangyi2007 写道 josephlong 写道关键是这个代码都没有编译过去呀，他们的不是一个对象类型，所以无法编译明白了吗 linliangyi2007 写道 josephlong 写道这个就是详细的呀，我是在网上看到ik和solr整合的我也照着做了，出现下面说的情况，你有官方的整合方案吗？晕死！请你把程序执行时抛出的异常发给我好吧，我要的不是你的代码啊，而是执行后抛的异常。你的JDK版本不对，class loader没法载入，用JDK6.0的吧。或者下载IK的源码，在本地进行重新编译。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: