IKAnalyzer 中文分词高亮

sblig

浏览: 226073 次
性别:
来自: 杭州

最近访客更多访客>>

ws07

scotttom020

itsuntc

JOEDING1974

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

创建索引

public void execute() {
		System.out.println("开始创建索引工单");
		Analyzer analyzer = new IKAnalyzer();//
		IndexWriter iwriter = new IndexWriter(path, analyzer, false);// false 增量索引
		creatCspIndex(iwriter);
		iwriter.close();
		System.out.println("完成创建索引工单");
	}

public  void creatCspIndex(IndexWriter iwriter) {
	 proSet = prossDAO.queryProblemProcessList(start,end);
        List  contListMap = proSet.getDataResult();

	for (String key : contListMap.keySet()) {
	      if (null == contMap.get(key)) {
			continue;
		}
		Document doc = new Document();
		doc.add(new Field("title",key,Field.Store.YES,Field.Index.ANALYZED));
		doc.add(new Field("content",contMap.get(key),Field.Store.YES,Field.Index.ANALYZED));
			iwriter.addDocument(doc);		
	}

搜索高亮

Directory directory = null;
IndexSearcher is = null;
TopDocs topDocs2 = null;
String keyword = "第二章提示用户要求另外收费";
Query query2 = IKQueryParser.parse("content", keyword); //
File indexDir = new File(path);
directory = SimpleFSDirectory.open(indexDir);
IndexReader reader = IndexReader.open(new SimpleFSDirectory(
				indexDir));
is = new IndexSearcher(reader);
is.setSimilarity(new IKSimilarity());
topDocs2 = is.search(query2, 5);//搜索前5个最相似的
ScoreDoc[] scoreDocs = topDocs2.scoreDocs;

//高亮设置
Analyzer analyzer = new IKAnalyzer();//设定分词器
//设定高亮显示的格式，也就是对高亮显示的词组加上前缀后缀
SimpleHTMLFormatter simpleHtmlFormatter = new SimpleHTMLFormatter("<font color='red'><B>","</B></font>");
Highlighter highlighter = new Highlighter(simpleHtmlFormatter,new QueryScorer(query2));
highlighter.setTextFragmenter(new SimpleFragmenter(150));
//设置每次返回的字符数.想必大家在使用搜索引擎的时候也没有一并把全部数据展示出来吧，当然这里也是设定只展示部分数据
for(int i=0;i<scoreDocs.length;i++){
   Document doc = is.doc(scoreDocs[i].doc);
   TokenStream tokenStream = analyzer.tokenStream("",new StringReader(doc.get("content")));
   String str = highlighter.getBestFragment(tokenStream, doc.get("content"));
}

分享到：

oracle sql 带order by ss desc 进行的分 ... | 线程池

2012-08-07 14:45
浏览 1070
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IKAnalyzer 中文分词高亮

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IKAnalyzer 中文分词 高亮

评论

发表评论

相关推荐

[Java性能剖析]远程调试配置

[jdk工具命令]Java SE 文档

[jdk命令工具]jconsole远程项目监控

[jvm参数]JVM简单配置

struts2 高危漏洞修复

转：调查服务器响应时间的利器 tcprstat

跟我学Spring3 学习笔记七 初始化与销毁

跟我学Spring3 学习笔记六 注入

动态生成class

FtpUtil ftp工具类 过滤文件名

java 高性能网络编程 NIO

java 高性能网络编程 mina

代理 下载网页，挖掘数据

java nio 编程学习 一

MongoDB 实战笔记 四

Json 添加元素拼接JSON字符串(转)

MongoDB 实战笔记 三

MongoDB 实战笔记 二

MongoDB 实战笔记 一

Struts 学习笔记 二

最近访客更多访客>>

IKAnalyzer 中文分词高亮

跟我学Spring3 学习笔记七初始化与销毁

跟我学Spring3 学习笔记六注入

FtpUtil ftp工具类过滤文件名

代理下载网页，挖掘数据

java nio 编程学习一

MongoDB 实战笔记四

MongoDB 实战笔记三

MongoDB 实战笔记二

MongoDB 实战笔记一

Struts 学习笔记二