lucene4.3全文搜索引擎—为索引域的加权 -

zhh9106

浏览: 58515 次
性别:
来自: 广州

最近访客更多访客>>

coldg

mysterious_9527

sdy330441359

viken

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

lucene4.3全文搜索引擎—为索引域的加权

博客分类：

lucene4.3学习笔记

lucene4.3 lucene全文搜索引擎 lucene4.3索引的加权

上文讲到对索引的管理，增删查改。今晚就讲讲，为索引域添加"权"了，有时在搜索的时候，会根据需要的不同，对不同的关键值或者不同的关键索引分配不同的权值，让权值高的内容更容易被用户搜索出来，而且排在前面。

为索引域添加权是再创建索引之前，把索引域的权值设置好，这样，在进行搜索时，lucene会对文档进行评分，这个评分机制是跟权值有关的，而且其它情况相同时，权值跟评分是成正相关的。

private String[] ids={"1","2","3","4","5","6"};
	
	private String[] emails={"sam@163.com","holiday@163.com","issac@163.com","summer@qq.com","coco@sina.cn","roy@gmail.com"};
	
	private String[] contents={"hello,how are you,@163.com,p,lucene,lucene","hi,I am fine!,@163.com,p,lucene","what is your name,@163.com,p,lucene","my name is summer,@qq.com,p,lucene,lucene","what is your number,@sina.cn,p,lucene,lucene","I will tell you,just wait a minute,@gmail.com,p,lucene"};
	
	private String [] names={"sam","holiday","issac","summer","coco","roy"};
	
	private int[] attachs={2,3,2,4,5,7};
	
	private Directory directory=null;
	
	private Map<String,Float> powerScores=new HashMap<String,Float>();

	
	
	
	public IndexUtil() throws IOException
	{
		powerScores.put("@163.com", 2.0f);
		powerScores.put("@qq.com", 1.5f);
		
		directory=FSDirectory.open(new File("E:/lucene/index02"));
		
	}
	
	/**
	 * 建立索引
	 * @throws IOException
	 */
	public void index() throws IOException 
	{
		IndexWriter indexWriter=new IndexWriter(directory,new IndexWriterConfig(Version.LUCENE_43,new StandardAnalyzer(Version.LUCENE_43)));
		
		for(int i=0;i<ids.length;i++)
		{
			Document document=new Document();
			
			Field contentField=new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED);
			document.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
			document.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));
			document.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
			document.add(contentField);
		
			
			String contentPower=contents[i].substring(contents[i].lastIndexOf("@"),contents[i].lastIndexOf("p")-1);
			
			System.out.println(contentPower);
			
			if(powerScores.containsKey(contentPower))
			{
				//为索引域添加权，例如，这里的例子是，如果这个域有包含@163.com的就为2.0，如果为@qq.com的就为1.5，如果为其它的就为0.5，默认值是1.0
				//3.5版本有个为文档添加权的，但是现在4.3版本已经没有了
				contentField.setBoost(powerScores.get(contentPower));
			}
			else
			{
				contentField.setBoost(0.5f);
			}
			
			
			indexWriter.addDocument(document);
		}
		
		if(indexWriter!=null) indexWriter.close();
	}

其实上面的代码跟上一篇索引的增删查改的代码几乎一样，笔者是在原有代码的基础上，加上一些对某个索引域权值的设置。至于测试的例子还是一样的，但是测试的结果会截然不同，笔者这里就不贴出测试结果了。

ps（纯属吐槽）：因为博主白天还要上课，所以只能每天晚上抽出一点时间来弄这些文章了，之前因为有项目要做，连发文章的时间都被占有了，希望在这段时间能把这些文章快点弄好。好了，又差不多一点了，又是睡觉的节奏了，明天早上满课啊，惨啊！！

0
顶

3
踩

分享到：

java基础--java关键字static，final | lucene4.3全文搜索引擎—索引的增删查改

2014-03-26 00:38
浏览 2288
评论(3)
分类:开源软件
查看更多

3 楼 smilingtodie 2014-04-12

谢谢！

2 楼 zhh9106 2014-03-26

你误会了，是一名学生

1 楼 wzhw2008 2014-03-26

博主是为人师表的老师？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene4.3全文搜索引擎—为索引域的加权

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene4.3全文搜索引擎—为索引域的加权

评论

发表评论

相关推荐

lucene4.3全文搜索引擎—索引的增删查改

lucene4.3—搜索

lucene4.3—索引的建立

最近访客更多访客>>