`
- 浏览:
1520432 次
- 性别:
- 来自:
北京
-
- Y_indexer.java建索引
-
packagecom.hapark.lucene;
-
importjava.io.BufferedReader;
-
importjava.io.File;
-
importjava.io.FileInputStream;
-
importjava.io.IOException;
-
importjava.io.InputStreamReader;
-
importjava.util.ArrayList;
-
importjava.util.Date;
-
importorg.apache.lucene.analysis.Analyzer;
-
importorg.apache.lucene.analysis.standard.StandardAnalyzer;
-
importorg.apache.lucene.document.Document;
-
importorg.apache.lucene.document.Field;
-
importorg.apache.lucene.index.IndexWriter;
-
publicclassY_indexer{
-
publicstaticvoidmain(String[]args)throwsException{
-
-
FilefileDir=newFile("d:\\y");
-
-
FileindexDir=newFile("d:\\index");
-
AnalyzerluceneAnalyzer=newStandardAnalyzer();
-
IndexWriterindexWriter=newIndexWriter(indexDir,luceneAnalyzer,
-
true);
-
ArrayListlist=newArrayList();
- getList(fileDir,list);
-
File[]textFiles=(File[])list.toArray(newFile[0]);
- System.out.println(textFiles.length);
-
longstartTime=newDate().getTime();
-
-
for(inti=0;i<textFiles.length;i++){
-
if(textFiles[i].isFile()
-
&&textFiles[i].getName().endsWith(".html")){
-
System.out.println("File"+textFiles[i].getCanonicalPath()
-
+"正在被索引....");
- Stringtemp=FileReaderAll(textFiles[i].getCanonicalPath(),
-
"GBK");
- System.out.println(temp);
-
Documentdocument=newDocument();
-
FieldFieldPath=newField("path",textFiles[i].getPath(),
- Field.Store.YES,Field.Index.NO);
-
FieldFieldBody=newField("body",temp,Field.Store.YES,
- Field.Index.TOKENIZED,
- Field.TermVector.WITH_POSITIONS_OFFSETS);
-
FieldFieldTitle=newField("title",temp,Field.Store.YES,
- Field.Index.TOKENIZED,
- Field.TermVector.WITH_POSITIONS_OFFSETS);
- document.add(FieldPath);
- document.add(FieldBody);
- document.add(FieldTitle);
- indexWriter.addDocument(document);
- }
- }
-
- indexWriter.optimize();
- indexWriter.close();
-
-
longendTime=newDate().getTime();
- System.out
-
.println("这花费了"
- +(endTime-startTime)
-
+"毫秒来把文档增加到索引里面去!"
- +fileDir.getPath());
- }
-
-
-
publicstaticvoidgetList(Filefile,ArrayListlist){
-
if(file.isDirectory()&&file.getName().indexOf(".")!=0){
- File[]file2=file.listFiles();
-
for(inti=0;i<file2.length;i++)
- getList(file2[i],list);
-
}else{
- list.add(file);
- }
- }
-
publicstaticStringFileReaderAll(StringFileName,Stringcharset)
-
throwsIOException{
-
BufferedReaderreader=newBufferedReader(newInputStreamReader(
-
newFileInputStream(FileName),charset));
-
Stringline=newString();
-
Stringtemp=newString();
-
while((line=reader.readLine())!=null){
- temp+=line;
- }
- reader.close();
-
returntemp;
- }
- }
- Y_searcherlucene搜索
-
packagecom.hapark.lucene;
-
importjava.io.IOException;
-
importjava.util.ArrayList;
-
importjava.util.Date;
-
importjava.util.List;
-
importorg.apache.lucene.analysis.Analyzer;
-
importorg.apache.lucene.analysis.standard.StandardAnalyzer;
-
importorg.apache.lucene.queryParser.ParseException;
-
importorg.apache.lucene.queryParser.QueryParser;
-
importorg.apache.lucene.search.Hits;
-
importorg.apache.lucene.search.IndexSearcher;
-
importorg.apache.lucene.search.Query;
-
publicclassY_searcher{
-
publicListsearch(){
-
ListsearchResult=newArrayList();
-
try{
-
Hitshits=null;
-
Stringkey="苏";
-
Queryquery=null;
-
IndexSearchersearcher=newIndexSearcher("d:\\yuyang");
-
Analyzeranalyzer=newStandardAnalyzer();
-
QueryParserqp=newQueryParser("title",analyzer);
- query=qp.parse(key);
-
if(searcher!=null){
-
Datestart=newDate();
-
hits=searcher.search(query);
-
if(hits.length()==0){
-
System.out.println("对不起。没你想要的结果!");
- }
-
else{
-
for(inti=0;i<hits.length();i++){
-
Dateend=newDate();
-
-
System.out.println("文件的路径:"+hits.doc(i).get("path"));
-
-
System.out.println(hits.doc(i).get("title"));
-
System.out.println("检索完成,用时"+(end.getTime()-start.getTime())+"毫秒");
- }
- }
- }
- }
-
catch(ParseExceptionex){
- }
-
catch(IOExceptione){
- }
-
returnsearchResult;
- }
-
publicstaticvoidmain(Stringargs[]){
-
Y_searchery_s=newY_searcher();
- y_s.search();
- }
- }
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
doc.add(new Field("title", "Lucene入门", Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("content", "这是Lucene 3.0的实例", Field.Store.YES, Field.Index.ANALYZED)); ``` 3. **查询...
《Lucene 3.6 入门实例教程》是一份专...总之,《Lucene 3.6 入门实例教程》是学习Lucene的理想资源,它将理论知识与实践操作紧密结合,使开发者能够快速掌握全文检索技术,为构建高效、精准的搜索应用打下坚实的基础。
标题与描述:“Lucene简单入门程序实例”这一标题与描述明确指出文章将引导读者通过一个实际的示例来了解和掌握Lucene的基本操作。Lucene是一个高性能、全功能的文本搜索引擎库,它允许用户对文档进行索引和搜索。本...
**Lucene 3.0 入门实例及关键知识点** ...总之,Lucene 3.0 入门实例提供了理解全文搜索引擎工作原理的基础,通过实践,开发者能够熟练掌握如何在自己的应用程序中集成和利用 Lucene 实现高效、精准的文本搜索功能。
【Lucene 入门教程】 Lucene 是一个由Apache软件基金会开发的开源全文检索引擎工具包,它并非一个完整的搜索引擎,而是提供了一个强大的架构,允许开发人员轻松地在他们的应用程序中集成全文检索功能。Lucene 支持...
这个入门实例将引导我们了解如何使用Lucene 3.0版本进行基本的索引和搜索操作。以下是对Lucene 3.0关键知识点的详细讲解: 1. **Lucene的架构**: Lucene的核心组件包括文档(Document)、字段(Field)、索引...
这个压缩包中的源码很可能是演示了如何构建和使用Lucene索引进行搜索的简单实例,对于初学者来说是一份很好的学习资料。通过阅读源码,你可以了解如何实际操作Lucene,从而加深对Lucene的理解。同时,实践是最好的...
《最新全文检索 Lucene-5.2.1 入门经典实例》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,广泛应用于各种信息检索系统。在5.2.1版本中,Lucene提供了更为高效和强大的搜索功能,为开发者提供了构建...
`lucene入门小实例.txt` 文件中可能包含了一个简单的Lucene使用示例,例如: 1. 创建 `Directory` 对象,比如使用 `FSDirectory.open()` 打开一个文件系统的目录来存储索引。 2. 实例化 `Analyzer`,如使用 `...
lucene实例是一个比较详细的例子,包括lucene的入门到高级实例,代码里有比较详细的实例,所有的实例都是通过junit来测试的。实例包括各种搜索:如通配符查询、模糊查询、查询结果的分页、中文分词器、自定义分词器...
标题 "第一个lucene的简单实例" 提到的是关于Apache Lucene的初步应用,这是一个全文搜索引擎库,常用于Java开发中。Lucene提供了高效的文本搜索功能,使得开发者能够快速地在大量数据中查找相关信息。 描述中的 ...
**Lucene 3.0 全文检索入门实例** Lucene 是一个开源的全文检索库,由 Apache 软件基金会开发。它提供了一个高级、灵活的搜索功能框架,允许开发者在自己的应用中轻松地集成全文检索功能。本文将重点介绍如何使用 ...
Java搜索工具——Lucene实例总结(一) 在Java开发中,搜索引擎已经成为不可或缺的一部分,而Apache Lucene正是一个强大的全文搜索引擎库。这篇博文将带你深入理解Lucene的基本概念和使用方式,帮助你快速入门并掌握...
**Lucene 入门实例详解** Lucene 是一个开源全文搜索引擎库,由 Apache 软件基金会维护。它提供了一个可扩展的、高性能的搜索框架,使得开发者能够快速地在大量文本数据中实现全文检索功能。这个入门实例将帮助我们...
NULL 博文链接:https://kylinsoong.iteye.com/blog/719415
【标题】:“第一个Lucene 3.6 (3.X) 入门实例” ...总之,Lucene 3.6入门实例涉及从设置开发环境、创建索引到实现搜索功能的全过程。理解这些基本步骤和核心概念,是掌握Lucene并进一步构建高效检索系统的基石。
2. **Lucene入门**:解释Lucene的核心概念,如Document、Field、Analyzer和IndexWriter,以及如何建立和管理索引。 3. **Struts与Lucene整合**:演示如何在Struts的Action类中调用Lucene进行搜索,以及如何在JSP页面...
在这个入门案例中,我们将深入理解如何使用 Lucene 3.6 版本来构建基本的文本搜索引擎。 首先,我们需要了解 Lucene 的核心概念: 1. **索引(Indexing)**:Lucene 的工作始于创建索引,将文档内容转化为可搜索的...
Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对