`
endual
  • 浏览: 3558828 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Lucene自带示例精简

 
阅读更多

Lucene自带示例精简,只留下了主要代码。以备查看
对文件夹生成索引

Java代码  收藏代码
  1. package  zhch.illq.lucene;  
  2.   
  3. import  java.io.File;  
  4. import  java.io.FileReader;  
  5. import  java.io.IOException;  
  6.   
  7. import  net.paoding.analysis.analyzer.PaodingAnalyzer;  
  8.   
  9. import  org.apache.lucene.analysis.standard.StandardAnalyzer;  
  10. import  org.apache.lucene.document.DateTools;  
  11. import  org.apache.lucene.document.Document;  
  12. import  org.apache.lucene.document.Field;  
  13. import  org.apache.lucene.index.IndexWriter;  
  14. import  org.apache.lucene.store.FSDirectory;  
  15. import  org.apache.lucene.util.Version;  
  16.   
  17. public   class  LuceneIndex {  
  18.   
  19.     static   final  File INDEX_DIR =  new  File( "d:\\temp\\index" );  
  20.   
  21.     // 主要代码 索引docDir文件夹下文档,索引文件在INDEX_DIR文件夹中   
  22.     public   static   void  main(String[] args) {  
  23.         File docDir = new  File( "d:\\temp\\neirong" );  
  24.         try  {  
  25.             IndexWriter standardWriter = new  IndexWriter(FSDirectory.open(INDEX_DIR),  new  StandardAnalyzer(  
  26.                     Version.LUCENE_CURRENT), true , IndexWriter.MaxFieldLength.LIMITED);  
  27.             // 如果是索引中文内容,可以使用Paoding中文分词器   
  28.             IndexWriter writer = new  IndexWriter(FSDirectory.open(INDEX_DIR),  new  PaodingAnalyzer(),  true ,  
  29.                     IndexWriter.MaxFieldLength.LIMITED);  
  30.             String[] files = docDir.list();  
  31.             for  (String fileStr : files) {  
  32.                 File file = new  File(docDir, fileStr);  
  33.                 if  (!file.isDirectory()) {  
  34.                     writer.addDocument(document(file));  
  35.                 }  
  36.             }  
  37.             writer.optimize();  
  38.             writer.close();  
  39.   
  40.         } catch  (IOException e) {  
  41.             System.out.println(" caught a "  + e.getClass() +  "\n with message: "  + e.getMessage());  
  42.         }  
  43.     }  
  44.   
  45.     public   static  Document document(File f)  throws  java.io.FileNotFoundException {  
  46.   
  47.         Document doc = new  Document();  
  48.   
  49.         // 添加path,索引(可查询)但不切词   
  50.         doc.add(new  Field( "path" , f.getPath(), Field.Store.YES, Field.Index.NOT_ANALYZED));  
  51.   
  52.         // 添加最后修改日期   
  53.         doc.add(new  Field( "modified" , DateTools.timeToString(f.lastModified(), DateTools.Resolution.MINUTE),  
  54.                 Field.Store.YES, Field.Index.NOT_ANALYZED));  
  55.   
  56.         // 添加内容,指定一个Reader,文件内容解析但不存储,这里的Reader使用系统默认的编码读入   
  57.         doc.add(new  Field( "contents" new  FileReader(f)));  
  58.         return  doc;  
  59.     }  
  60. }  


对索引进行查询

Java代码  收藏代码
  1. package  zhch.illq.lucene;  
  2.   
  3. import  java.io.BufferedReader;  
  4. import  java.io.File;  
  5. import  java.io.IOException;  
  6. import  java.io.InputStreamReader;  
  7.   
  8. import  net.paoding.analysis.analyzer.PaodingAnalyzer;  
  9.   
  10. import  org.apache.lucene.analysis.Analyzer;  
  11. import  org.apache.lucene.analysis.standard.StandardAnalyzer;  
  12. import  org.apache.lucene.document.Document;  
  13. import  org.apache.lucene.index.IndexReader;  
  14. import  org.apache.lucene.queryParser.QueryParser;  
  15. import  org.apache.lucene.search.IndexSearcher;  
  16. import  org.apache.lucene.search.Query;  
  17. import  org.apache.lucene.search.ScoreDoc;  
  18. import  org.apache.lucene.search.Searcher;  
  19. import  org.apache.lucene.search.TopScoreDocCollector;  
  20. import  org.apache.lucene.store.FSDirectory;  
  21. import  org.apache.lucene.util.Version;  
  22.   
  23. public   class  LuceneSearch {  
  24.   
  25.     /** Simple command-line based search demo. */   
  26.     public   static   void  main(String[] args)  throws  Exception {  
  27.   
  28.         String index = "d:\\temp\\index" ;  
  29.         String field = "contents" ;  
  30.         String queries = null ;  
  31.         boolean  raw =  false ;  
  32.         // 要显示条数   
  33.         int  hitsPerPage =  10 ;  
  34.   
  35.         // searching, so read-only=true   
  36.         IndexReader reader = IndexReader.open(FSDirectory.open(new  File(index)),  true );  // only   
  37.   
  38.         Searcher searcher = new  IndexSearcher(reader);  
  39.         Analyzer standardAnalyzer = new  StandardAnalyzer(Version.LUCENE_CURRENT);  
  40.         // 如果是索引中文内容,可以使用Paoding中文分词器   
  41.         Analyzer analyzer = new  PaodingAnalyzer();  
  42.   
  43.         BufferedReader in = new  BufferedReader( new  InputStreamReader(System.in));  
  44.         QueryParser parser = new  QueryParser(field, analyzer);  
  45.         while  ( true ) {  
  46.             if  (queries ==  null // prompt the user   
  47.                 System.out.println("Enter query: " );  
  48.   
  49.             String line = in.readLine();  
  50.   
  51.             if  (line ==  null  || line.length() == - 1 )  
  52.                 break ;  
  53.   
  54.             line = line.trim();  
  55.             if  (line.length() ==  0 )  
  56.                 break ;  
  57.   
  58.             Query query = parser.parse(line);  
  59.             System.out.println("Searching for: "  + query.toString(field));  
  60.   
  61.             doPagingSearch(in, searcher, query, hitsPerPage, raw, queries == null );  
  62.         }  
  63.         reader.close();  
  64.     }  
  65.   
  66.     public   static   void  doPagingSearch(BufferedReader in, Searcher searcher, Query query,  int  hitsPerPage,  boolean  raw,  
  67.             boolean  interactive)  throws  IOException {  
  68.   
  69.         TopScoreDocCollector collector = TopScoreDocCollector.create(hitsPerPage, false );  
  70.         searcher.search(query, collector);  
  71.         ScoreDoc[] hits = collector.topDocs().scoreDocs;  
  72.   
  73.         int  end, numTotalHits = collector.getTotalHits();  
  74.         System.out.println(numTotalHits + " total matching documents" );  
  75.   
  76.         int  start =  0 ;  
  77.   
  78.         end = Math.min(hits.length, start + hitsPerPage);  
  79.   
  80.         for  ( int  i = start; i < end; i++) {  
  81.             Document doc = searcher.doc(hits[i].doc);  
  82.             String path = doc.get("path" );  
  83.             if  (path !=  null ) {  
  84.                 System.out.println((i + 1 ) +  ". "  + path);  
  85.                 System.out.println("   modified: "  + doc.get( "modified" ));  
  86.   
  87.             } else  {  
  88.                 System.out.println((i + 1 ) +  ". "  +  "No path for this document" );  
  89.             }  
  90.   
  91.         }  
  92.   
  93.     }  
  94.   

分享到:
评论

相关推荐

    lucene示例 demo+jar包

    "lucene示例 demo+jar包"中提到的 jar 包是 Lucene 库的运行时依赖,它们包含了 Lucene 的所有类和方法。开发人员需要这些 jar 包来编译和运行使用 Lucene 的程序。通常,开发者会将这些 jar 文件添加到项目的类路径...

    Lucene示例 BM25相似度计算

    本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、执行查询,并比较默认的TF-IDF相似度与BM25相似度的区别。 首先,我们需要了解什么是Lucene。Lucene是一个由...

    Lucene7.4官方示例

    Lucene7.4官方示例,内含若干官方实例,可用于学习Lucene

    lucene3.0.3搜索的使用示例

    这个"lucene3.0.3搜索的使用示例"压缩包文件很可能是为了帮助用户理解并学习如何在项目中应用Lucene 3.0.3版本的功能。 在Lucene 3.0.3中,主要包含了以下核心概念和知识点: 1. **索引(Indexing)**:这是Lucene...

    lucene 索引小示例

    《Lucene索引小示例解析》 Lucene是一个高性能、全文检索库,它由Apache软件基金会开发并维护。在Java编程环境中,Lucene被广泛应用于构建搜索功能,特别是对于大量文本数据的高效检索。本篇文章将通过一个简单的小...

    Lucene 全文检索的 各种例子

    在`lucene-test-master`这个压缩包中,我们可以期待找到一系列示例代码,演示如何使用上述步骤和不同分词器来实现Lucene的全文检索功能。这些示例将有助于开发者理解如何在实际项目中集成和调整Lucene,以满足特定的...

    Lucene入门示例

    **Lucene入门示例** Lucene是一个开源的全文搜索引擎库,由Apache软件基金会开发并维护。它提供了文本分析、索引创建、文档检索等核心功能,广泛应用于各种搜索应用的开发。本文将从一个简单的Lucene入门示例出发,...

    lucene facet查询示例

    本示例将深入探讨如何在Lucene中实现facet查询,包括区间查询和多维度查询,以及关键概念——key-field-value模型。 **一、Lucene Facet的概念** Facets是信息组织的一种方法,类似于图书馆的分类标签。在搜索结果...

    Lucene简单实例记录

    从给定的文件信息中,我们可以提取出关于Apache Lucene的基本使用和实例的详细知识点,以下是对这些知识点的深入解析: ### Lucene简介 Apache Lucene是一个高性能、全功能的文本搜索引擎库,由Java编写,提供了对...

    Lucene使用代码实例之搜索文档

    以下是一个简单的示例代码,演示了如何使用Lucene搜索包含关键词"lucene"的文档: ```java public class TxtFileSearcher { public static void main(String[] args) throws Exception{ String queryStr = ...

    Lucene6.6.2API示例

    《深入理解Lucene 6.6.2 API与IKAnalyzer分词器》 在信息技术领域,搜索引擎技术扮演着至关重要的角色,而Lucene作为开源全文检索库,为开发者提供了强大的文本搜索功能。本文将深入探讨Lucene 6.6.2版本的API使用...

    Lucene与DB结合示例

    在这个示例中,作者简单地使用了Lucene自带的分词器进行中文分词,但由于其功能相对有限,因此效果可能不如专门的中文分词工具如HanLP、IK Analyzer或jieba分词器。Lucene的分词过程包括将输入文本拆分成单独的词语...

    lucene 站内搜索示例

    本示例提供了使用 Lucene 实现站内搜索的具体步骤和代码示例,帮助开发者将其无缝集成到自己的Java项目中。 首先,我们需要了解 Lucene 的基本概念。Lucene 是基于倒排索引的搜索引擎,其核心在于将文本数据转换为...

    lucene 3.0 java示例

    这个“lucene 3.0 java示例”压缩包提供了一个具体的实例,演示如何在Java应用程序中使用Lucene 3.0版本来查询数据库。 在Lucene中,主要涉及以下几个核心概念: 1. **索引**:Lucene通过构建索引来提高搜索效率。...

    lucene4.0实例

    在“Lucene40Demo”这个示例中,我们可以看到以下关键步骤: 1. 创建索引:首先,我们需要创建一个IndexWriter对象,配置好目录(Directory)和Analyzer,然后逐个添加Document到索引中。 2. 分析文本:使用...

    经典的lucene实例代码及详细解析以及lucene结构流程介绍

    经典的Lucene实例代码及详细解析以及Lucene结构流程介绍 Lucene是一个功能强大且灵活的开源搜索引擎库,它提供了一个简单易用的API,允许开发者快速构建搜索应用程序。下面将对Lucene的实例代码和结构流程进行详细...

    lucene入门代码示例

    最受欢迎的java开源全文搜索引擎开发工具包。 提供了完整的查询引擎和... Lucene的目的是为软件开发人员提供一个简单易用的工具包, 以方便在目标系统中实现全文检索功能, 或者是以此为基础建立起完整的全文检索引擎。

    Lucene与数据库结合示例(加双关键字高亮)

    “Lucene与数据库结合示例(加双关键字高亮)”这个标题表明,我们将讨论如何将开源全文搜索引擎Lucene与关系型数据库MySQL整合在一起,并且在搜索结果中实现关键词高亮显示,以提升用户体验。这通常涉及到数据的...

    Lucene5学习之创建索引入门示例

    **Lucene5学习之创建索引入门示例** 在IT领域,搜索引擎的开发与优化是一项关键技术,而Apache Lucene作为一款高性能、全文本搜索库,是许多开发者进行文本检索的首选工具。本文将深入探讨如何使用Lucene5来创建一...

Global site tag (gtag.js) - Google Analytics