lucene2.4.0 demo 中文支持搭建

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 3566 次

锁定老帖子主题：lucene2.4.0 demo 中文支持搭建精华帖 (0) :: 良好帖 (4) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
renavatior 等级: 初级会员性别: 文章: 30 积分: 60 来自: 杭州	发表时间：2009-02-10 相关推荐: 北大天网搜索引擎TSE源码搜索引擎介绍自顶向下学搜索引擎——北大天网搜索引擎TSE分析及完全注释[1]寻找搜索引擎入口【多图•原创】手把手教你在手机上注册谷歌google新账号（gmail邮箱），关键步骤的注意事项和经验分享，手机验证这一步的解决建议等（2025年最新界面）科研必备的14个学术搜索引擎更多相关推荐企业应用由于自己的毕业设计要对html文件建索引,所以参考了 lucene2.4.0的demo,由于现在网上对这个demo的搭建都是较早版本,所以有很多的问题,现在把我的步骤阐述一下: step1:首先需要准备好lucene-core-2.4.0.jar和IKAnalyzer2.0.2OBF.jar(不要使用IKAnalyzer1.4版本,它不怎么支持lucene-core-2.4.0.jar). step2:在elipse里面建立一个java工程,把demo的原代码拷贝过来. step3:把这个demo代码中的全部StandardAnalyzer修改为IK_CIKAnalyzer,此时你去调试demo会出现类似一下错误: Parse Aborted: Lexical error at line 63, column 16. Encountered: "\u987b" (39035), after : "" step4:解决上面的问题需要: 第一：先下载一个javacc 第二：修改HtmlParser.jj文件的 options { IGNORE_CASE = true; STATIC = false;} 为： options { IGNORE_CASE = true; STATIC = false;UNICODE_INPUT=true;} 第三：运行javacc HtmlParser.jj 第四：把产生出来的7个java文件覆盖原先的java源文件此时去建立索引试没有问题了, 但是如果要使用luceneweb来搜索还要修改jsp编码问题 step5:把luceneweb下面的5个jsp文件都加上 <%@ page contentType="text/html; charset=GBK" %> step6:还需要修改results.jsp 把62行的 queryString = request.getParameter("query"); 改为 queryString = new String( request.getParameter("query").getBytes("ISO8859-1"),"GBK"); 并且把这个results.jsp里面的SdandardAnalyzer也要改为IK_CAnalyzer,并且不要忘记在results.jsp头部把IK_CAnalyzer导入 step7:如果还不行,需要修改一下你的tomcat(我的是6.0.10版本)的配置文件server.xml :把46行附近的代码改为: <Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" useBodyEncodingForURI="true" /> OK了声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

kafei819000 等级: 初级会员文章: 9 积分: 30 来自: ...	发表时间：2009-02-16 就不知道你在说些什么 lucene2.4在2.3的基础上有了很大的改变，许多方法已经不建议使用，并且在建立索引时的算法也已经彻底换掉，你的帖子是要说明lucene2.4的功能呢？还是要说明和以前的区别？搭建这个demo说明什么意义？而你说的demo是lucene自带的，如果你想要深入研究lucene，那么在javaeye上有好多关于这方面的帖子可以参考的。
返回顶楼	回帖地址 0 0 请登录后投票

renavatior 等级: 初级会员性别: 文章: 30 积分: 60 来自: 杭州	发表时间：2009-02-18 这个demo,是支持中文的,原先只能支持英文,这样对有些人上手方便点而已了
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: