- 浏览: 3558828 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (1491)
- Hibernate (28)
- spring (37)
- struts2 (19)
- jsp (12)
- servlet (2)
- mysql (24)
- tomcat (3)
- weblogic (1)
- ajax (36)
- jquery (47)
- html (43)
- JS (32)
- ibatis (0)
- DWR (3)
- EXTJS (43)
- Linux (15)
- Maven (3)
- python (8)
- 其他 (8)
- JAVASE (6)
- java javase string (0)
- JAVA 语法 (3)
- juddiv3 (15)
- Mule (1)
- jquery easyui (2)
- mule esb (1)
- java (644)
- log4j (4)
- weka (12)
- android (257)
- web services (4)
- PHP (1)
- 算法 (18)
- 数据结构 算法 (7)
- 数据挖掘 (4)
- 期刊 (6)
- 面试 (5)
- C++ (1)
- 论文 (10)
- 工作 (1)
- 数据结构 (6)
- JAVA配置 (1)
- JAVA垃圾回收 (2)
- SVM (13)
- web st (1)
- jvm (7)
- weka libsvm (1)
- weka屈伟 (1)
- job (2)
- 排序 算法 面试 (3)
- spss (2)
- 搜索引擎 (6)
- java 爬虫 (6)
- 分布式 (1)
- data ming (1)
- eclipse (6)
- 正则表达式 (1)
- 分词器 (2)
- 张孝祥 (1)
- solr (3)
- nutch (1)
- 爬虫 (4)
- lucene (3)
- 狗日的腾讯 (1)
- 我的收藏网址 (13)
- 网络 (1)
- java 数据结构 (22)
- ACM (7)
- jboss (0)
- 大纸 (10)
- maven2 (0)
- elipse (0)
- SVN使用 (2)
- office (1)
- .net (14)
- extjs4 (2)
- zhaopin (0)
- C (2)
- spring mvc (5)
- JPA (9)
- iphone (3)
- css (3)
- 前端框架 (2)
- jui (1)
- dwz (1)
- joomla (1)
- im (1)
- web (2)
- 1 (0)
- 移动UI (1)
- java (1)
- jsoup (1)
- 管理模板 (2)
- javajava (1)
- kali (7)
- 单片机 (1)
- 嵌入式 (1)
- mybatis (2)
- layui (7)
- asp (12)
- asp.net (1)
- sql (1)
- c# (4)
- andorid (1)
- 地价 (1)
- yihuo (1)
- oracle (1)
最新评论
-
endual:
https://blog.csdn.net/chenxbxh2 ...
IE6 bug -
ice86rain:
你好,ES跑起来了吗?我的在tomcat启动时卡在这里Hibe ...
ES架构技术介绍 -
TopLongMan:
...
java public ,protect,friendly,private的方法权限(转) -
贝塔ZQ:
java实现操作word中的表格内容,用插件实现的话,可以试试 ...
java 读取 doc poi读取word中的表格(转) -
ysj570440569:
Maven多模块spring + springMVC + JP ...
Spring+SpringMVC+JPA
Lucene自带示例精简,只留下了主要代码。以备查看
对文件夹生成索引
- package zhch.illq.lucene;
- import java.io.File;
- import java.io.FileReader;
- import java.io.IOException;
- import net.paoding.analysis.analyzer.PaodingAnalyzer;
- import org.apache.lucene.analysis.standard.StandardAnalyzer;
- import org.apache.lucene.document.DateTools;
- import org.apache.lucene.document.Document;
- import org.apache.lucene.document.Field;
- import org.apache.lucene.index.IndexWriter;
- import org.apache.lucene.store.FSDirectory;
- import org.apache.lucene.util.Version;
- public class LuceneIndex {
- static final File INDEX_DIR = new File( "d:\\temp\\index" );
- // 主要代码 索引docDir文件夹下文档,索引文件在INDEX_DIR文件夹中
- public static void main(String[] args) {
- File docDir = new File( "d:\\temp\\neirong" );
- try {
- IndexWriter standardWriter = new IndexWriter(FSDirectory.open(INDEX_DIR), new StandardAnalyzer(
- Version.LUCENE_CURRENT), true , IndexWriter.MaxFieldLength.LIMITED);
- // 如果是索引中文内容,可以使用Paoding中文分词器
- IndexWriter writer = new IndexWriter(FSDirectory.open(INDEX_DIR), new PaodingAnalyzer(), true ,
- IndexWriter.MaxFieldLength.LIMITED);
- String[] files = docDir.list();
- for (String fileStr : files) {
- File file = new File(docDir, fileStr);
- if (!file.isDirectory()) {
- writer.addDocument(document(file));
- }
- }
- writer.optimize();
- writer.close();
- } catch (IOException e) {
- System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());
- }
- }
- public static Document document(File f) throws java.io.FileNotFoundException {
- Document doc = new Document();
- // 添加path,索引(可查询)但不切词
- doc.add(new Field( "path" , f.getPath(), Field.Store.YES, Field.Index.NOT_ANALYZED));
- // 添加最后修改日期
- doc.add(new Field( "modified" , DateTools.timeToString(f.lastModified(), DateTools.Resolution.MINUTE),
- Field.Store.YES, Field.Index.NOT_ANALYZED));
- // 添加内容,指定一个Reader,文件内容解析但不存储,这里的Reader使用系统默认的编码读入
- doc.add(new Field( "contents" , new FileReader(f)));
- return doc;
- }
- }
对索引进行查询
- package zhch.illq.lucene;
- import java.io.BufferedReader;
- import java.io.File;
- import java.io.IOException;
- import java.io.InputStreamReader;
- import net.paoding.analysis.analyzer.PaodingAnalyzer;
- import org.apache.lucene.analysis.Analyzer;
- import org.apache.lucene.analysis.standard.StandardAnalyzer;
- import org.apache.lucene.document.Document;
- import org.apache.lucene.index.IndexReader;
- import org.apache.lucene.queryParser.QueryParser;
- import org.apache.lucene.search.IndexSearcher;
- import org.apache.lucene.search.Query;
- import org.apache.lucene.search.ScoreDoc;
- import org.apache.lucene.search.Searcher;
- import org.apache.lucene.search.TopScoreDocCollector;
- import org.apache.lucene.store.FSDirectory;
- import org.apache.lucene.util.Version;
- public class LuceneSearch {
- /** Simple command-line based search demo. */
- public static void main(String[] args) throws Exception {
- String index = "d:\\temp\\index" ;
- String field = "contents" ;
- String queries = null ;
- boolean raw = false ;
- // 要显示条数
- int hitsPerPage = 10 ;
- // searching, so read-only=true
- IndexReader reader = IndexReader.open(FSDirectory.open(new File(index)), true ); // only
- Searcher searcher = new IndexSearcher(reader);
- Analyzer standardAnalyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
- // 如果是索引中文内容,可以使用Paoding中文分词器
- Analyzer analyzer = new PaodingAnalyzer();
- BufferedReader in = new BufferedReader( new InputStreamReader(System.in));
- QueryParser parser = new QueryParser(field, analyzer);
- while ( true ) {
- if (queries == null ) // prompt the user
- System.out.println("Enter query: " );
- String line = in.readLine();
- if (line == null || line.length() == - 1 )
- break ;
- line = line.trim();
- if (line.length() == 0 )
- break ;
- Query query = parser.parse(line);
- System.out.println("Searching for: " + query.toString(field));
- doPagingSearch(in, searcher, query, hitsPerPage, raw, queries == null );
- }
- reader.close();
- }
- public static void doPagingSearch(BufferedReader in, Searcher searcher, Query query, int hitsPerPage, boolean raw,
- boolean interactive) throws IOException {
- TopScoreDocCollector collector = TopScoreDocCollector.create(hitsPerPage, false );
- searcher.search(query, collector);
- ScoreDoc[] hits = collector.topDocs().scoreDocs;
- int end, numTotalHits = collector.getTotalHits();
- System.out.println(numTotalHits + " total matching documents" );
- int start = 0 ;
- end = Math.min(hits.length, start + hitsPerPage);
- for ( int i = start; i < end; i++) {
- Document doc = searcher.doc(hits[i].doc);
- String path = doc.get("path" );
- if (path != null ) {
- System.out.println((i + 1 ) + ". " + path);
- System.out.println(" modified: " + doc.get( "modified" ));
- } else {
- System.out.println((i + 1 ) + ". " + "No path for this document" );
- }
- }
- }
-
}
相关推荐
"lucene示例 demo+jar包"中提到的 jar 包是 Lucene 库的运行时依赖,它们包含了 Lucene 的所有类和方法。开发人员需要这些 jar 包来编译和运行使用 Lucene 的程序。通常,开发者会将这些 jar 文件添加到项目的类路径...
本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、执行查询,并比较默认的TF-IDF相似度与BM25相似度的区别。 首先,我们需要了解什么是Lucene。Lucene是一个由...
Lucene7.4官方示例,内含若干官方实例,可用于学习Lucene
这个"lucene3.0.3搜索的使用示例"压缩包文件很可能是为了帮助用户理解并学习如何在项目中应用Lucene 3.0.3版本的功能。 在Lucene 3.0.3中,主要包含了以下核心概念和知识点: 1. **索引(Indexing)**:这是Lucene...
《Lucene索引小示例解析》 Lucene是一个高性能、全文检索库,它由Apache软件基金会开发并维护。在Java编程环境中,Lucene被广泛应用于构建搜索功能,特别是对于大量文本数据的高效检索。本篇文章将通过一个简单的小...
在`lucene-test-master`这个压缩包中,我们可以期待找到一系列示例代码,演示如何使用上述步骤和不同分词器来实现Lucene的全文检索功能。这些示例将有助于开发者理解如何在实际项目中集成和调整Lucene,以满足特定的...
**Lucene入门示例** Lucene是一个开源的全文搜索引擎库,由Apache软件基金会开发并维护。它提供了文本分析、索引创建、文档检索等核心功能,广泛应用于各种搜索应用的开发。本文将从一个简单的Lucene入门示例出发,...
本示例将深入探讨如何在Lucene中实现facet查询,包括区间查询和多维度查询,以及关键概念——key-field-value模型。 **一、Lucene Facet的概念** Facets是信息组织的一种方法,类似于图书馆的分类标签。在搜索结果...
从给定的文件信息中,我们可以提取出关于Apache Lucene的基本使用和实例的详细知识点,以下是对这些知识点的深入解析: ### Lucene简介 Apache Lucene是一个高性能、全功能的文本搜索引擎库,由Java编写,提供了对...
以下是一个简单的示例代码,演示了如何使用Lucene搜索包含关键词"lucene"的文档: ```java public class TxtFileSearcher { public static void main(String[] args) throws Exception{ String queryStr = ...
《深入理解Lucene 6.6.2 API与IKAnalyzer分词器》 在信息技术领域,搜索引擎技术扮演着至关重要的角色,而Lucene作为开源全文检索库,为开发者提供了强大的文本搜索功能。本文将深入探讨Lucene 6.6.2版本的API使用...
在这个示例中,作者简单地使用了Lucene自带的分词器进行中文分词,但由于其功能相对有限,因此效果可能不如专门的中文分词工具如HanLP、IK Analyzer或jieba分词器。Lucene的分词过程包括将输入文本拆分成单独的词语...
本示例提供了使用 Lucene 实现站内搜索的具体步骤和代码示例,帮助开发者将其无缝集成到自己的Java项目中。 首先,我们需要了解 Lucene 的基本概念。Lucene 是基于倒排索引的搜索引擎,其核心在于将文本数据转换为...
这个“lucene 3.0 java示例”压缩包提供了一个具体的实例,演示如何在Java应用程序中使用Lucene 3.0版本来查询数据库。 在Lucene中,主要涉及以下几个核心概念: 1. **索引**:Lucene通过构建索引来提高搜索效率。...
在“Lucene40Demo”这个示例中,我们可以看到以下关键步骤: 1. 创建索引:首先,我们需要创建一个IndexWriter对象,配置好目录(Directory)和Analyzer,然后逐个添加Document到索引中。 2. 分析文本:使用...
经典的Lucene实例代码及详细解析以及Lucene结构流程介绍 Lucene是一个功能强大且灵活的开源搜索引擎库,它提供了一个简单易用的API,允许开发者快速构建搜索应用程序。下面将对Lucene的实例代码和结构流程进行详细...
最受欢迎的java开源全文搜索引擎开发工具包。 提供了完整的查询引擎和... Lucene的目的是为软件开发人员提供一个简单易用的工具包, 以方便在目标系统中实现全文检索功能, 或者是以此为基础建立起完整的全文检索引擎。
“Lucene与数据库结合示例(加双关键字高亮)”这个标题表明,我们将讨论如何将开源全文搜索引擎Lucene与关系型数据库MySQL整合在一起,并且在搜索结果中实现关键词高亮显示,以提升用户体验。这通常涉及到数据的...
**Lucene5学习之创建索引入门示例** 在IT领域,搜索引擎的开发与优化是一项关键技术,而Apache Lucene作为一款高性能、全文本搜索库,是许多开发者进行文本检索的首选工具。本文将深入探讨如何使用Lucene5来创建一...