lucence hello world

nullpoint

浏览: 132615 次
性别:
来自: 北京

最近访客更多访客>>

xqzfd

yao00jun

给我用用

heganghg

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

lucene 全文检索

/*
	 * lucence version 3.0.3
	 * 全文检索
	 * 
	 * 倒排索引：单词指向文档。以关键词和分词为单位，先读取文档内容，拆分关键词，关键词定位。
	 * 因为词语的数量是有限的，所以索引量不会随着文本内容的增长也线性增长。
	 * 
	 * 引入lucence jar包
	 */
	public static void main(String[] args) throws Exception {
		//A创建索引
		//简单例子，创建索引保存在内存中
		Directory dir = new RAMDirectory();
		//分词器使用lucence标准的，参数Version指定使用的lucence版本
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		/*
		 * IndexWriter 创建和维护索引
		 * param1 
		 * param2 指定创建索引使用的分词器
		 * param3 是否覆盖已有索引
		 * param4 最大Field长度
		 * 
		 */
		IndexWriter writer = new IndexWriter(
				dir,analyzer,true,IndexWriter.MaxFieldLength.UNLIMITED);
		//添加索引
		String[] docs ={
				"hello java",
				"search aha java",
				"friday hello"
		};
		/*
		 * Document是Field的容器，被搜索的单元，搜索结果是已doc的形式返回
		 * 每个Field拥有Key，Value
		 */
		for(int i = 0;i<docs.length;i++){
			Document d = new Document();
			d.add(new Field("name" //key
							,docs[i]//value
							,Store.YES//是否存储在索引中
							,Index.ANALYZED//该Field是否被索引
			));
			writer.addDocument(d);//将doc交给writer处理
		}
		writer.close();
		
		
		//B 搜索
		//创建搜索对象
		//参数是索引目录，指定为上面创建的索引
		Searcher searcher = new IndexSearcher(dir);
		QueryParser parser = new QueryParser(
							Version.LUCENE_30 //指定版本
							,"name" //默认搜索的Feild（key）
							,analyzer//搜索用的分词器，和上面创建索引使用一样的
							);
		Query query = parser.parse("hello"/*需要解析搜索的关键词*/);
		//搜索，取结果的前5条
		ScoreDoc[] tds = searcher.search(query,5).scoreDocs;
		System.out.println(tds.length);//符合结果doc数
		for(int i=0;i<tds.length;i++){
			Document doc = searcher.doc(tds[i].doc);
			//打印doc中key是name的Field的value
			System.out.println(doc.get("name"));
		}
		/*输出结果
		 * 	2
			hello java
			friday hello
		 */
	}

1
顶

4
踩

分享到：

protected访问权限又理解了一下 | 局域网流量监控原理（java）

2011-04-27 12:24
浏览 1150
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucence hello world

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucence hello world

评论

发表评论

相关推荐

java 工程中静态常量类问题

java计算排列结果内容

java 序列化

HttpClient 登陆iteye

java 调用 oracle 存储过程

log4j 配置

tomcat 使用log4j记录分割日志

java 正则

javabean 嵌套属性赋值

eclipse 取消汉化

java 进度条上传

java 调用 webservice

java nio SocketChannel 服务器端与多客户端 信息交互（聊天功能）

java nio buffer

java Integer

Apache Commons DbUtils

solr服务器的搭建与简单使用

protected访问权限又理解了一下

局域网流量监控原理（java）

apache commons beanutils

最近访客更多访客>>

java nio SocketChannel 服务器端与多客户端信息交互（聊天功能）