- 浏览: 178117 次
- 性别:
- 来自: 苏州
文章分类
最新评论
-
jiasky:
好像是在练书法。
Oracle Function -
blackangel_can:
这样的代码见得多了。
Javascript Print(*) -
tianhendi:
Apache Solr and Tomcat6 Search engine -
laserdance:
我想问下,你怎么从Tomcat等服务器中把上述文件xml准确定 ...
Java parse XML methods(4) -
cskysnew:
第二种如果去掉synchronized,就不是线程安全的,应该 ...
Singlton ture or not?
1.simply practice the lucene api for search document and data, post code first
lucene version :2.2.0
set up the index of files
java 代码
- package com.aaron.lucene;
- import java.io.File;
- import java.io.FileReader;
- import java.io.Reader;
- import java.util.Date;
- import org.apache.lucene.analysis.Analyzer;
- import org.apache.lucene.analysis.standard.StandardAnalyzer;
- import org.apache.lucene.document.Document;
- import org.apache.lucene.document.Field;
- import org.apache.lucene.index.IndexWriter;
- /**
- * This class demonstrate the process of creating index with Lucene for text
- * files
- */
- public class TxtFileIndexer {
- public static void main(String[] args) throws Exception {
- // indexDir is the directory that hosts Lucene's index files
- File indexDir = new File("C:/bin/lucence/Index");
- // dataDir is the directory that hosts the text files that to be indexed
- File dataDir = new File("C:/bin/lucence/Data");
- Analyzer luceneAnalyzer = new StandardAnalyzer();
- File[] dataFiles = dataDir.listFiles();
- IndexWriter indexWriter = new IndexWriter(indexDir, luceneAnalyzer,
- true);
- long startTime = new Date().getTime();
- for (int i = 0; i < dataFiles.length; i++) {
- if (dataFiles[i].isFile()
- && dataFiles[i].getName().endsWith(".txt")) {
- System.out.println("Indexing file "
- + dataFiles[i].getCanonicalPath());
- Document document = new Document();
- Reader txtReader = new FileReader(dataFiles[i]);
- document.add(new Field("path", dataFiles[i].getPath(),
- Field.Store.YES, Field.Index.UN_TOKENIZED));
- document.add(new Field("contents", txtReader));
- indexWriter.addDocument(document);
- }
- }
- indexWriter.optimize();
- indexWriter.close();
- long endTime = new Date().getTime();
- System.out.println("It takes " + (endTime - startTime)
- + " milliseconds to create index for the files in directory "
- + dataDir.getPath());
- }
- }
Search key word
java 代码
- package com.aaron.lucene;
- import java.io.File;
- import org.apache.lucene.document.Document;
- import org.apache.lucene.index.Term;
- import org.apache.lucene.search.Hits;
- import org.apache.lucene.search.IndexSearcher;
- import org.apache.lucene.search.TermQuery;
- import org.apache.lucene.store.FSDirectory;
- /**
- * This class is used to demonstrate the
- * process of searching on an existing
- * Lucene index
- *
- */
- public class TextFileSearcher {
- public static void main(String[] args) throws Exception {
- String queryStr = "lucene";
- //This is the directory that hosts the Lucene index
- File indexDir = new File("C:/bin/lucence/Index");
- FSDirectory directory = FSDirectory.getDirectory(indexDir);
- IndexSearcher searcher = new IndexSearcher(directory);
- if (!indexDir.exists()) {
- System.out.println("The Lucene index is not exist");
- return;
- }
- Term term = new Term("contents", queryStr.toLowerCase());
- TermQuery luceneQuery = new TermQuery(term);
- Hits hits = searcher.search(luceneQuery);
- for (int i = 0; i < hits.length(); i++) {
- Document document = hits.doc(i);
- System.out.println("File: " + document.get("path"));
- }
- }
- }
发表评论
-
移动电商
2016-04-19 18:13 571海外旅行购物电商平台-购轻松,是我们从零开发的App应用,欢迎 ... -
Top 10 Books For Advanced Level Java Developers
2013-11-03 21:59 532Top 10 Books For Advanced Level ... -
RESTful
2013-10-28 22:28 682要使API易用、易于接受和足够灵活,应该遵循以下原则: An ... -
Androd app
2012-08-19 21:35 816an android app -
Jenkins-CI
2012-06-30 08:26 818Jenkins for java and .net CI. -
JNLP
2009-04-20 13:26 1172<?xml version="1.0" ... -
Eclipse3.4 + Axis2 Configuration
2009-03-12 19:53 16111) Download the axis2 v1.4 plug ... -
XML configuration for Spring jsf hibernate
2008-07-16 13:51 1124faces-comfig.xml <?xml ver ... -
Final Usage
2008-04-29 21:05 917final在Java中并不常用,然而它却为我们提供了诸如在C语 ... -
Java tips
2008-03-03 21:39 760// 程序1 class Singleton { priv ... -
Java Connect Pool
2008-02-24 19:13 2020import java.io.*; import java.s ... -
Apache Solr and Tomcat6 Search engine
2008-01-04 13:51 2601Today, test the Solr and Tomcat ... -
Java Multiple process (PID)
2007-12-11 11:29 5955Java的多进程运行模式分析 一般我们在java中运行其它类中 ... -
Glassfish V2 And NetBean6
2007-12-05 16:33 1551Dowload Netbean6 from http://ne ... -
Spring用回调HibernateCallBack方法
2007-11-05 15:45 2958Spring用回调HibernateCallBack方法实现持 ... -
Java中的浅复制与深复制
2007-11-05 13:10 1194Java中的浅复制与深复制 分析一下Java中关于浅复制与深复 ... -
Future pattern
2007-11-04 19:54 2164个人理解 Future 模式就是在主线程中当需要进行比较耗时的 ... -
Log4j Configuration (Recitation)
2007-10-14 20:41 2319一、常用输出格式 %c 列出logger名字空间的全称,如加 ... -
JasperReport usage
2007-09-27 22:07 1206jasperreport tools enhance and ... -
Java中的序列化(转)
2007-09-08 07:29 12251、序列化是干什么的? 简单说就是为了保存在内存中的各种 ...
相关推荐
lucene,lucene教程,lucene讲解。 为了对文档进行索引,Lucene 提供了五个基础的类 public class IndexWriter org.apache.lucene.index.IndexWriter public abstract class Directory org.apache.lucene.store....
lucene3.0 lucene3.0 lucene3.0 lucene3.0 lucene3.0
【Lucene 4.7.0 全套JAR包详解】 Lucene是一个开源全文搜索引擎库,由Apache软件基金会开发并维护。它提供了一个高级、灵活的文本搜索API,允许开发者轻松地在应用程序中实现复杂的搜索功能。这次提供的“lucene-...
本压缩包包含的是Lucene 3.5.0版本的全部源码,对于想要深入理解Lucene工作原理、进行二次开发或者进行搜索引擎相关研究的开发者来说,是一份非常宝贵的学习资源。 Lucene 3.5.0是Lucene的一个重要版本,它在3.x...
《Lucene in Action》是关于Apache Lucene的权威指南,这本书深入浅出地介绍了全文搜索引擎的构建和优化。Lucene是一个高性能、全文本搜索库,它允许开发人员在应用程序中轻松实现复杂的搜索功能。这本书主要面向...
Lucene是一款强大的全文搜索引擎库,广泛应用于各种数据检索场景。在C#环境下,利用Lucene进行时间区间搜索是提高数据检索效率和精确度的重要手段。本篇将深入探讨如何在C#中实现Lucene的时间区间查询匹配,以及涉及...
《Annotated Lucene 中文版 Lucene源码剖析》是一本深入探讨Apache Lucene的书籍,专注于源码解析,帮助读者理解这个强大的全文搜索引擎库的工作原理。Lucene是一款开源的Java库,它提供了高效的文本搜索功能,被...
【Lucene 简介】 Lucene 是一个强大的开源全文搜索库,由 Java 编写,主要用于为应用程序添加全文检索功能。它不是一个完整的全文搜索引擎应用,而是一个工具包,允许开发者将其集成到自己的软件中,以实现高效、...
在IT领域,搜索引擎技术是至关重要的,而Lucene作为一个开源全文搜索引擎库,广泛应用于各种文本检索系统中。本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、...
**Lucene 2.0 API 和 Lucene 3.0 API 深度解析** Lucene 是一个由 Apache 软件基金会开发的全文搜索引擎库,它为开发者提供了在 Java 应用程序中实现高性能、可扩展的全文搜索功能的能力。Lucene 的 API 设计得相当...
"计算机专业外文翻译(lucene相关)" 本文翻译了论文"Scale-up x Scale-out: A Case Study using Nutch/Lucene",介绍了计算机专业领域中关于Lucene相关的知识点。 Scale-up vs Scale-out 论文中讨论了两个相对...
**Lucene原理详解** Lucene是一个高性能、全文检索库,由Apache软件基金会开发并维护,是Java编程语言中广泛使用的搜索引擎库。它提供了一个简单但功能强大的API,用于索引和搜索文本数据,使得开发者可以轻松地在...
《全面解析Lucene jar包:从基础到应用》 在信息技术高速发展的今天,搜索引擎已经成为我们获取信息不可或缺的工具。在Java领域,Lucene作为一个强大的全文搜索引擎库,深受开发者喜爱。本文将详细介绍“lucene所有...
标题"Lucene资料大全(包括Lucene_in_Action书等)"表明这是一个包含全面Lucene学习资源的集合,其中最显著的是《Lucene_in_Action》这本书。这是一本广泛认可的关于Apache Lucene的权威指南,通常被简称为LIA,它深入...
《Lucene in Action 第二版》是一本深入探讨Apache Lucene全文检索库的专业书籍,它在Java开发领域具有很高的权威性。这本书详细介绍了如何利用Lucene进行高效的文本搜索和索引构建,是Java开发者和信息检索爱好者的...
**Lucene.NET 中文分词技术详解** Lucene.NET 是一个高性能、全文检索库,它是Apache Lucene项目在.NET平台上的实现。作为一个开源的搜索引擎框架,Lucene.NET为开发者提供了强大的文本搜索功能。而在处理中文文档...
《Lucene与关系型数据库对比:深度解析与应用探索》 在信息爆炸的时代,数据管理和检索成为了企业乃至个人日常工作中不可或缺的部分。随着技术的发展,不同的数据处理方式应运而生,其中Lucene与关系型数据库作为两...
赠送jar包:lucene-core-7.7.0.jar; 赠送原API文档:lucene-core-7.7.0-javadoc.jar; 赠送源代码:lucene-core-7.7.0-sources.jar; 赠送Maven依赖信息文件:lucene-core-7.7.0.pom; 包含翻译后的API文档:lucene...
Apache Lucene是一个开源全文搜索引擎库,它为Java开发者提供了强大的文本搜索功能。在这个"Lucene 5 主要jar包"中,我们找到了一系列与Lucene 5.0.0相关的jar文件,这些文件是构建和运行基于Lucene的搜索应用程序的...
经典的Lucene实例代码及详细解析以及Lucene结构流程介绍 Lucene是一个功能强大且灵活的开源搜索引擎库,它提供了一个简单易用的API,允许开发者快速构建搜索应用程序。下面将对Lucene的实例代码和结构流程进行详细...