`

一、初步认识lucene

 
阅读更多

环境搭建:

1、lucene-core-3.5.0.jar

2、mmseg4j-all-1.8.5-with-dic.jar(中文分词器)

3、lucene-highlighter-3.5.0.jar、lucene-memory-3.5.0.jar(高亮显示)

 

在全文索引工具中,都是由这样的三部分组成
  1、索引部分(I am a boy)
  2、分词部分
  3、搜索部分

 

    /**


	 * 建立索引


	 */


	public void index() {


		


		//1、创建Directory


		//Directory directory = new RAMDirectory();//建立在内存中


		Directory directory = null;


		try {


			directory = FSDirectory.open(new File("D:/test/index01"));


		} catch (IOException e1) {


			e1.printStackTrace();


		}


		//2、创建IndexWriter


		IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_36, new StandardAnalyzer(


			Version.LUCENE_36));


		IndexWriter writer = null;


		


		try {


			writer = new IndexWriter(directory, config);


			


			//3、创建Document对象


			Document document = null;


			//4、为Document添加Field


			Collection<File> files = FileUtils.listFiles(new File("D:/test/lucene"),


				FileFileFilter.FILE, null);


			for (File file : files) {


				document = new Document();


				document.add(new Field("content", new FileReader(file)));


				document.add(new Field("filename", file.getName(), Field.Store.YES,


					Field.Index.NOT_ANALYZED));


				document.add(new Field("path", file.getAbsolutePath(), Field.Store.YES,


					Field.Index.NOT_ANALYZED));//是否存储路径,是否进行分词


				


				writer.addDocument(document);


			}


			


			//5、通过IndexWriter添加对象到索引中


		} catch (CorruptIndexException e) {


			e.printStackTrace();


		} catch (LockObtainFailedException e) {


			e.printStackTrace();


		} catch (IOException e) {


			e.printStackTrace();


		} finally {


			if (writer != null) {


				try {


					writer.close();


				} catch (CorruptIndexException e) {


					e.printStackTrace();


				} catch (IOException e) {


					e.printStackTrace();


				}


			}


		}


		


	}


	


	/**


	 * 搜索


	 */


	public void searcher() {


		


		try {


			//1、创建Directory


			Directory directory = FSDirectory.open(new File("D:/test/index01"));


			//2、创建IndexReader


			IndexReader reader = IndexReader.open(directory);


			//3、根据IndexReader创建IndexSearcher


			IndexSearcher searcher = new IndexSearcher(reader);


			//4、创建搜索的Query


			QueryParser parser = new QueryParser(Version.LUCENE_36, "content",


				new StandardAnalyzer(Version.LUCENE_36));//content表示搜索的Field


			Query query = parser.parse("File");//表示内容中含有“File”的


			//5、根据searcher搜索并返回TopDocs


			TopDocs topDocs = searcher.search(query, 10);//只搜索10条


			//6、根据TopDocs对象获取ScoreDoc对象


			ScoreDoc[] sds = topDocs.scoreDocs;


			for (ScoreDoc scoreDoc : sds) {


				//7、根据searcher和ScoreDoc对象获取具体的Document对象


				Document document = searcher.doc(scoreDoc.doc);


				//8、根据Document对象获取需要的值


				System.out.println(document.get("filename"));


				System.out.println(document.get("path"));


			}


			


			//9、关闭reader


			reader.clone();


		} catch (Exception e) {


			e.printStackTrace();


		}


	}
分享到:
评论

相关推荐

    Lucene初探,一个初级的LuceneDemo

    通过学习和实践这个LuceneDemo,你可以对Lucene有一个初步的认识,了解如何创建、索引和搜索文档。随着深入学习,你会发现Lucene的强大之处在于其高度定制化的能力,可以满足各种复杂的搜索需求。在实际项目中,结合...

    Lucene搜索引擎开发权威经典

    通过阅读书中的第1章“LUCENE基础”,读者可以建立起对Lucene基本架构和工作流程的初步认识,为进一步的学习打下坚实基础。 总之,《Lucene搜索引擎开发权威经典》是一本全面介绍Lucene的书籍,适合想要从事搜索...

    Lucene.Net实现的搜索引擎框架(改自CSDN资源)

    **Lucene.Net搜索引擎框架概述** Lucene.Net是一个开源全文搜索...通过以上内容,你应该对Lucene.Net搜索引擎框架有了初步的认识。在实践中不断探索,你将能够熟练掌握这个强大的搜索工具,并能运用到各种.NET项目中。

    SOLR学习笔记

    ### SOLR学习笔记 ...通过本文的介绍,相信读者已经对 Solr 的基本概念和安装配置过程有了初步的认识。在未来的学习过程中,还可以深入探索 Solr 的更多高级特性,如分布式搜索、复制和索引更新机制等。

    Solr In Action 英文完整版

    读者在完成本章的学习后,应该能够对Solr有一个初步的认识,并理解如何开始利用Solr构建自己的搜索应用。随着对Solr的深入学习,用户将能够更有效地利用其提供的功能,为用户提供更好的搜索体验。 通过以上内容的...

    我的学习资料打包,包括ES,MongoDB,Oracle,TS,NodeJS相关的学习过程

    1. 首先,对每个技术有一个初步的理解,了解它们的基本概念和应用场景。 2. 其次,通过阅读文档和教程,掌握每个技术的核心概念和操作。 3. 接着,实践编写代码,通过实际项目来加深理解。 4. 最后,参与社区讨论,...

    Hadoop阶段初识学习笔记

    通过以上介绍,我们对Hadoop有了初步的认识。作为一种强大的大数据处理工具,Hadoop不仅提供了分布式存储和计算的能力,而且还具备高度的可扩展性和容错性,这使得它成为现代大数据处理领域的关键技术之一。

    JAVA WEB典型模块与项目实战大全

    1.4 核心框架初步认识  1.5 小结  第2章 myedipse开发工具对各种框架的支持  2.1 使用jsp的两种模式  2.2 struts框架的实现  2.3 hibernate框架的实现  2.4 jpa框架的实现  2.5 spring框架的实现  ...

    opencms资料

    通过对简单页面的创建和配置,可以对OpenCMS的基本操作有一个初步的认识。 #### 四、OpenCMS XML内容管理 ##### 4.1 创建一个简单的XSD - **定义XML Schema**:用于描述XML文档的结构。 - **创建XML内容类型**:...

Global site tag (gtag.js) - Google Analytics