`
qindongliang1922
  • 浏览: 2172301 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117113
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:125453
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:59557
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71037
社区版块
存档分类
最新评论

Lucene4.3开发之第一步小试牛刀(一)

阅读更多
首页,本篇适合对于刚学lucene的朋友们,在这之前笔者还是喜欢啰嗦几句,想要学好一门技术,首先就得从思想层次上全面了解这种技术的作用,适用范围,以及优缺点,对于这些理论,大家可以先在Google,或百度上深入了解一下,也可以到其官方网站上看文档或者WIKI,只有在思想层面上,大概了解这个技术的总体架构,那么学起来,就可以很快上手,举个例子,先“会当凌绝顶”一下,然后在爬山,肯定会容易一些,笔者想说的就是这个道理。



下面就开始进入正题,本篇的入门代码,相对简单,主要是先把lucene添加的Demo给搭建起来,后续的修改,删除,查询会在后面的文章中一一补上,笔者觉得学习这东西还是得脚踏实地一步一步来比较好,只要真真正正理解每一行代码的意思,我们就算有收获了,有时候学习步伐太快,反而会根基不牢,效果不好。

需要准备的Jar包
lucene-core-4.3.1.jar

lucene-analyzers-common-4.3.1.jar


package com.qin;

import java.io.File;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.StringField;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

/**
 * Lucene的演示Demo类
 * 
 * **/
public class CommonLuceneBasic {
	
	/**
	 * 抽象的父类文件夹
	 * */
	public static Directory directory;
	  /**
	   * 返回IndexWriter
	   * */
	  public static IndexWriter getWriter() throws Exception{
		  Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_43);//设置标准分词器 ,默认是一元分词
		  IndexWriterConfig iwc=new IndexWriterConfig(Version.LUCENE_43, analyzer);//设置IndexWriterConfig
		 //  iwc.setRAMBufferSizeMB(3);//设置缓冲区大小
		  return new IndexWriter(directory,iwc);
	  }
	  /**
	   * @indexPath  索引存放路径
	   * **/
	  public static void add(String indexWriterPath){
		  IndexWriter writer=null;
		  try{
		 directory=FSDirectory.open(new File(indexWriterPath));//打开存放索引的路径
		 writer=getWriter();
		 Document doc=new Document();
		 doc.add(new StringField("id", "1", Store.YES));//存储
		 doc.add(new StringField("name", "张飞", Store.YES));//存储
		 doc.add(new StringField("content", "也许放弃,才能靠近你!", Store.YES));//存储
		 writer.addDocument(doc);//添加进写入流里
		 writer.forceMerge(1);//优化压缩段,大规模添加数据的时候建议,少使用本方法,会影响性能
		 writer.commit();//提交数据 
		 System.out.println("添加成功");
		  }catch(Exception e){
			  
			  e.printStackTrace();
			  
		  }finally{
			  
			  if(writer!=null){
				  try{
				  writer.close();//关闭流
				  }catch(Exception e){
					  e.printStackTrace();
				  }
			  }
			  
			  
		  }
		  
		  
	  }
	  
	  public static void main(String[] args) {
		String path="E:\\临时索引";
		  add(path);//调用添加方法
		  
	}
	 
	
	
	

}


添加成功之后,我们就可以通过Luke工具,进行索引查看,如果还有不知道Luke工具是什么,或者不知道怎么使用,可以参照我的上一篇日志如何使用luke
http://qindongliang1922.iteye.com/admin/blogs/1913232


分享到:
评论

相关推荐

    lucene4.3源码

    Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会...

    lucene4.3 按坐标距离排序

    总的来说,"lucene4.3 按坐标距离排序"是利用Lucene的地理空间功能来优化搜索体验的一个重要特性。通过对地理位置数据的有效处理和排序,开发者能够为用户提供更精确、更具相关性的搜索结果,从而提升应用的整体价值...

    lucene4.3工具类

    lucene4.3增删改查的的一个工具类,对新手来说是一份不可多得的入门资料。

    lucene 4.3所用到的包

    全文检索lucene 4.3 所用到的3个jar包,包含lucene-queryparser-4.3.0.jar、 lucene-core-4.3.0.jar、lucene-analyzers-common-4.3.0.jar。

    Lucene4.3src 源代码

    lucene4.3源代码 censed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for additional information ...

    lucene-4.3.1资源

    Lucene是一个开源的全文搜索引擎库,由Apache软件基金会开发并维护。在Java编程环境中,它为开发者提供了强大的文本检索功能,使得在海量数据中快速查找相关信息变得简单易行。本篇文章将详细探讨Lucene 4.3.1版本的...

    基于lucene4.3的知识图谱搜索引擎XunTa(一种用"知识点"来找人的搜人引擎).zip

    1.XunTa是在lucene4.3上创建的通过“知识点”来找人的搜人引擎。  输入一个关键词(或组合),XunTa返回一个排名列表,排在前面的人是与该关键词(组合)最相关的“达人”。  可访问 http://www.xunta.so立即体验...

    lucene的IKAnalyzer以及兼容4.3

    Lucene是一个强大的全文检索库,广泛应用于搜索引擎和信息检索系统中。在中文处理方面,IKAnalyzer是一个优秀的开源中文分词器,专为Lucene设计,旨在提高中文分词的准确性和效率。本文将深入探讨IKAnalyzer的特性和...

    基于lucene的开发JavaEE项目

    综上所述,基于Lucene的JavaEE项目开发涉及众多技术点,从基础的索引创建到复杂的查询策略,再到性能优化和故障排除,每一个环节都需要深入理解和实践。只有熟练掌握这些知识点,才能在实际项目中充分发挥Lucene的...

    lucene2.9开发指南

    - **建立索引**:这是Lucene搜索的第一步,涉及将数据转换为可搜索的索引结构。这通常包括读取数据源(如文件或数据库),然后将内容解析为文档,并使用分析器对文档内容进行分词。 - **搜索索引**:一旦索引建立...

    Lucene3.4开发入门.pdf

    Lucene3.4开发入门.pdf

    lucene第一步---6.分页

    本篇文章将带你迈出使用Lucene的第一步,重点关注如何实现分页检索,这对于构建高效、用户友好的搜索系统至关重要。 Lucene的核心功能包括文档索引、查询解析和结果排序。在分页检索方面,我们需要考虑如何有效地...

    Lucene.net开发最全文档

    **Lucene.net 开发完全指南** Lucene.net 是一个开源的全文搜索引擎库,它是 Apache Lucene 的 .NET 版本,适用于 .NET 平台。Lucene.net 提供了高效、可扩展的搜索功能,广泛应用于网站内容检索、文档搜索、数据库...

    Lucene开发手册

    Lucene是一个开源的全文检索库,由Apache软件基金会开发,主要用Java编写。作为一套API,Lucene提供了构建高效、可扩展的搜索引擎所需的核心工具。它并非一个完整的搜索引擎产品,而是一个搜索引擎框架,允许开发者...

    Lucene开发详解.pdf

    它是Lucene的核心组件之一,对于中文的支持通常需要通过扩展此类来实现。 2. **org.apache.lucene.document**:该包定义了文档的结构,用于存储索引中的文档信息。 3. **org.apache.lucene.index**:该包提供了索引...

    基于lucene.net开发的个人知识库

    这个项目,即“基于Lucene.Net开发的个人知识库”,展示了如何利用这一工具来整理、检索和管理个人知识。 Lucene.Net是一个开源的、高性能的全文搜索引擎库,它提供了高级的索引和搜索功能,适用于各种数据源,包括...

    lucene开发流程

    开发流程的第一步是从各种数据源(如新闻、论坛、博客)中获取信息。这通常涉及到与数据库交互,通过SQL查询或API接口来获取需要的数据。 2. **数据预处理**: 获取到原始数据后,需要对其进行预处理,这包括读取...

    Lucene搜索引擎开发权威经典(附盘源码)【于天恩】.zip

    《Lucene搜索引擎开发权威经典》是由于天恩编著的一本深入探讨Lucene搜索引擎开发的专业书籍,这本书结合源码分析,旨在帮助读者掌握Lucene的核心技术和应用实践。Lucene是Apache软件基金会的一个开放源代码项目,它...

    Lucene开发指南

    《Lucene开发指南》是一份综合性的学习资料,旨在帮助开发者深入理解和熟练运用Apache Lucene这一强大的全文搜索引擎库。Lucene是Java语言实现的开源项目,广泛应用于信息检索、数据分析和大数据处理等领域。本指南...

    C#+Lucene.Net开发完成的一个自定义WEB搜索引擎

    本文将深入探讨如何使用C#编程语言和Lucene.Net库来开发一个自定义的Web搜索引擎,帮助开发者了解这个过程中的关键技术和概念。 **一、C#基础** C#是微软推出的一种面向对象的编程语言,它具有丰富的类库和强大的...

Global site tag (gtag.js) - Google Analytics