`

Lucene入门级笔记二 -- 索引库的CRUD API 演示 .

    博客分类:
  • Java
 
阅读更多

Lucene 对索引库的增删改查操作的 API 演示

没什么说的,apache 的 API 一向简单、不难理解。所以直接拷代码过去稍微看一下就差不多了。

/**
 * "文章" 实体
 */
public class Article {
	private Integer id;
	private String title;
	private String content;
	public Integer getId() {
		return id;
	}
	public void setId(Integer id) {
		this.id = id;
	}
	public String getTitle() {
		return title;
	}
	public void setTitle(String title) {
		this.title = title;
	}
	public String getContent() {
		return content;
	}
	public void setContent(String content) {
		this.content = content;
	}
}
/**
 * 描述某一页的检索结果集
 */
public class QueryResult {
	/* 匹配的总记录数 */
	private int totalCount;
    /* 检索到的文章对象集合 */
	private List<Article> atrticle;
	public QueryResult(int totalCount, List<Article> atrticle) {
		this.totalCount = totalCount;
		this.atrticle = atrticle;
	}
	public int getTotalCount() {
		return totalCount;
	}
	public void setTotalCount(int totalCount) {
		this.totalCount = totalCount;
	}
	public List<Article> getAtrticle() {
		return atrticle;
	}
	public void setAtrticle(List<Article> atrticle) {
		this.atrticle = atrticle;
	}
}
/**
 * 直接操作索引库的 DAO
 */
public class ArticleIndexDao {
	/**
	 * 保存索引
	 * @param article 
	 */
	public void save(Article article) {
		Document document = Article2DocumentUtil.article2document(article);
		IndexWriter indexWriter = null;
		try {
			Directory indexDir = FSDirectory.open(new File("./indexDir/"));
			// 标准分词器,另外 Lucene 还提供了针对多种语言的分词器
			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
			indexWriter = new IndexWriter(indexDir, analyzer,
					MaxFieldLength.LIMITED);
			indexWriter.addDocument(document);
		} catch (IOException e) {
			throw new RuntimeException(e);
		} finally {
			if (indexWriter != null) {
				try {
					indexWriter.close();
				} catch (IOException e) {
					throw new RuntimeException(e);
				}
			}
		}
	}
	/**
	 * 删除
	 * 
	 * @param article
	 *            删除的 Article 对象
	 */
	public void delete(Article article) {
		IndexWriter indexWriter = null;
		try {
			Directory indexDir = FSDirectory.open(new File("./indexDir/"));
			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
			indexWriter = new IndexWriter(indexDir, analyzer,
					MaxFieldLength.LIMITED);
			
			/* 意思是将索引库中 id 为 article.getId() 的记录删了 */
			Term term = new Term("id", article.getId() + "");
			indexWriter.deleteDocuments(term);
		} catch (IOException e) {
			throw new RuntimeException(e);
		} finally {
			if (indexWriter != null) {
				try {
					indexWriter.close();
				} catch (IOException e) {
					throw new RuntimeException(e);
				}
			}
		}
	}
	/**
	 * 修改
	 */
	public void update(Article article) {
		IndexWriter indexWriter = null;
		try {
			Directory indexDir = FSDirectory.open(new File("./indexDir/"));
			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
			indexWriter = new IndexWriter(indexDir, analyzer,
					MaxFieldLength.LIMITED);
			/* 意思是将索引库中 id 为 article.getId() 的记录改了 */
			Term term = new Term("id", article.getId() + "");
			indexWriter.updateDocument(term, Article2DocumentUtil
					.article2document(article));
			/*
			 * updateDocument 等价于: delete(article); save(article);
			 * 在大数据量的时候,采用 "删除再创建" 的效率更高
			 */
		} catch (IOException e) {
			throw new RuntimeException(e);
		} finally {
			if (indexWriter != null) {
				try {
					indexWriter.close();
				} catch (IOException e) {
					throw new RuntimeException(e);
				}
			}
		}
	}
	/**
	 * 分页搜索
	 * @param queryStr 搜索条件
	 * @param firstResult 首条数据位置
	 * @param maxResults 最多取多少条数据
	 * @return 一页结果集
	 */
	public QueryResult search(String queryStr, int firstResult, int maxResults) {
		IndexSearcher indexSearcher = null;
		List<Article> atrticles = new ArrayList<Article>();
		try {
			/*
			 * 构建 IndexSearcher
			 */
			Directory indexDir = FSDirectory.open(new File("./indexDir/"));
			indexSearcher = new IndexSearcher(indexDir);
			
			
			/*
			 * 构建 Query
			 */
			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
			QueryParser queryParser = new QueryParser(Version.LUCENE_30, "content", analyzer);
			Query query = queryParser.parse(queryStr);
			
			
			/*
			 * 查询
			 */
			TopDocs topDocs = indexSearcher.search(query, firstResult + maxResults);
			int totalCount = topDocs.totalHits;
			ScoreDoc[] scoreDocs = topDocs.scoreDocs;
			
			
			
			/* 保证循环的次数不超过 scoreDocs 的长度*/
			int length = Math.min(firstResult+maxResults, scoreDocs.length);
			
			
			for(int i=firstResult; i<length; i++) {
				
				/*
				 * 根据编号取出Document数据
				 */
				Document document = indexSearcher.doc(i);
				Article article = Article2DocumentUtil.document2article(document);
				
				atrticles.add(article);
			
			}
			
			return new QueryResult(totalCount, atrticles);
			
		} catch (Exception e) {
			throw new RuntimeException(e);
		} finally {
			try {
				if (indexSearcher != null) {
					indexSearcher.close();
				}
			} catch (IOException e) {
				throw new RuntimeException(e);
			}
		}
	}
}
**
 * 工具类:Article 对象与 Document 对象的转换
 */
public class Article2DocumentUtil {
	public static Document article2document(Article article) {
		if(article == null) {
			return null;
		}
		
		Document document = new Document();
		document.add(new Field("id", article.getId()+"", Store.YES, Index.ANALYZED));
		document.add(new Field("title", article.getTitle(), Store.YES, Index.ANALYZED));
		document.add(new Field("content", article.getContent(), Store.YES, Index.ANALYZED));
		
		return document;
	}
	
	public static Article document2article(Document document) {
		if(document == null) {
			return null;
		}
		Article article = new Article();
		article.setId(Integer.parseInt(document.get("id")));
		article.setTitle(document.get("title"));
		article.setContent(document.get("content"));
		
		return article;
	}
}
/**
 * JUnit 测试 
 */
public class TestArticleIndexDao {
	
	/**
	 * 测试保存
	 * @throws Exception
	 */
	@Test
	public void testSave() throws Exception {
		ArticleIndexDao dao = new ArticleIndexDao();
		Article article = new Article();
		article.setId(1);
		article.setTitle("wjh上天山");
		article.setContent("据悉,文建华已于昨日抵达天山。高歌一曲HelloWorld");
		dao.save(article);
	}
	
	@Test
	public void testBatchSave() throws Exception {
		for(int i=0; i<35; i++) {
			ArticleIndexDao dao = new ArticleIndexDao();
			Article article = new Article();
			article.setId(i);
			article.setTitle("wjh上天山第" + i + "集");
			article.setContent("据悉,wjh已于昨日抵达天山。高歌"+ i +"曲 HelloWorld");
			dao.save(article);
		}
	}
	
	@Test
	public void testUpdate() throws Exception {
		ArticleIndexDao dao = new ArticleIndexDao();
		Article article = new Article();
		article.setId(1);
		article.setTitle("wjh上天山");
		article.setContent("wjh已于昨日抵达天山。高歌一曲HelloWorld");
		dao.update(article);
	}
	
	@Test
	public void testDel() throws Exception {
		ArticleIndexDao dao = new ArticleIndexDao();
		Article article = new Article();
		article.setId(1);
		article.setTitle("wjh上天山");
		article.setContent("wjh已于昨日抵达天山。高歌一曲HelloWorld");
		dao.delete(article);
	}
	
	@Test
	public void testSearch() throws Exception {
		ArticleIndexDao dao = new ArticleIndexDao();
		QueryResult queryResult = dao.search("HelloWorld", 30, 10);
		
		int count = queryResult.getTotalCount();
		System.out.println("共匹配了 " + count + " 条记录。");
		
		List<Article> articles = queryResult.getAtrticle();
		for (Article article : articles) {
			System.out.println("id:" + article.getId());
			System.out.println("title:" + article.getTitle());
			System.out.println("content:" + article.getContent());
			System.out.println("----------------");
		}
	}
}

 

分享到:
评论

相关推荐

    Eclipse开发分布式商城系统+完整视频代码及文档

    │ 淘淘商城第二天笔记.docx │ ├─03.第三天 │ 01.课程回顾.avi │ 02.课程计划.avi │ 03.什么是反向代理.avi │ 04.nginx的反向代理及负载均衡.avi │ 05.FastDFS介绍.avi │ 06.FastDFS安装步骤-文件上传.avi...

    elasticsearch基础知识,从小白到入门

    ### Elasticsearch基础知识,从小白到入门 #### 一、概念与背景 **搜索引擎基础:** - **倒排索引**:倒排索引是搜索引擎的核心技术之一,它将文档中的关键词与文档之间的对应关系建立索引,使得根据关键词快速...

    基于MATLAB GUI与CNN的模糊车牌识别系统:从图像预处理到字符识别全流程解析

    内容概要:本文详细介绍了基于MATLAB GUI界面和卷积神经网络(CNN)的模糊车牌识别系统。该系统旨在解决现实中车牌因模糊不清导致识别困难的问题。文中阐述了整个流程的关键步骤,包括图像的模糊还原、灰度化、阈值化、边缘检测、孔洞填充、形态学操作、滤波操作、车牌定位、字符分割以及最终的字符识别。通过使用维纳滤波或最小二乘法约束滤波进行模糊还原,再利用CNN的强大特征提取能力完成字符分类。此外,还特别强调了MATLAB GUI界面的设计,使得用户能直观便捷地操作整个系统。 适合人群:对图像处理和深度学习感兴趣的科研人员、高校学生及从事相关领域的工程师。 使用场景及目标:适用于交通管理、智能停车场等领域,用于提升车牌识别的准确性和效率,特别是在面对模糊车牌时的表现。 其他说明:文中提供了部分关键代码片段作为参考,并对实验结果进行了详细的分析,展示了系统在不同环境下的表现情况及其潜在的应用前景。

    嵌入式八股文面试题库资料知识宝典-计算机专业试题.zip

    嵌入式八股文面试题库资料知识宝典-计算机专业试题.zip

    嵌入式八股文面试题库资料知识宝典-C and C++ normal interview_3.zip

    嵌入式八股文面试题库资料知识宝典-C and C++ normal interview_3.zip

    开关磁阻电机技术参数与建模技术深度解析:4kW电机性能详述

    内容概要:本文深入探讨了一款额定功率为4kW的开关磁阻电机,详细介绍了其性能参数如额定功率、转速、效率、输出转矩和脉动率等。同时,文章还展示了利用RMxprt、Maxwell 2D和3D模型对该电机进行仿真的方法和技术,通过外电路分析进一步研究其电气性能和动态响应特性。最后,文章提供了基于RMxprt模型的MATLAB仿真代码示例,帮助读者理解电机的工作原理及其性能特点。 适合人群:从事电机设计、工业自动化领域的工程师和技术人员,尤其是对开关磁阻电机感兴趣的科研工作者。 使用场景及目标:适用于希望深入了解开关磁阻电机特性和建模技术的研究人员,在新产品开发或现有产品改进时作为参考资料。 其他说明:文中提供的代码示例仅用于演示目的,实际操作时需根据所用软件的具体情况进行适当修改。

    少儿编程scratch项目源代码文件案例素材-剑客冲刺.zip

    少儿编程scratch项目源代码文件案例素材-剑客冲刺.zip

    少儿编程scratch项目源代码文件案例素材-几何冲刺 转瞬即逝.zip

    少儿编程scratch项目源代码文件案例素材-几何冲刺 转瞬即逝.zip

    四象限直流电机速度驱动控制系统PID控制仿真模型设计与实现

    内容概要:本文详细介绍了基于PID控制器的四象限直流电机速度驱动控制系统仿真模型及其永磁直流电机(PMDC)转速控制模型。首先阐述了PID控制器的工作原理,即通过对系统误差的比例、积分和微分运算来调整电机的驱动信号,从而实现转速的精确控制。接着讨论了如何利用PID控制器使有刷PMDC电机在四个象限中精确跟踪参考速度,并展示了仿真模型在应对快速负载扰动时的有效性和稳定性。最后,提供了Simulink仿真模型和详细的Word模型说明文档,帮助读者理解和调整PID控制器参数,以达到最佳控制效果。 适合人群:从事电力电子与电机控制领域的研究人员和技术人员,尤其是对四象限直流电机速度驱动控制系统感兴趣的读者。 使用场景及目标:适用于需要深入了解和掌握四象限直流电机速度驱动控制系统设计与实现的研究人员和技术人员。目标是在实际项目中能够运用PID控制器实现电机转速的精确控制,并提高系统的稳定性和抗干扰能力。 其他说明:文中引用了多篇相关领域的权威文献,确保了理论依据的可靠性和实用性。此外,提供的Simulink模型和Word文档有助于读者更好地理解和实践所介绍的内容。

    嵌入式八股文面试题库资料知识宝典-2013年海康威视校园招聘嵌入式开发笔试题.zip

    嵌入式八股文面试题库资料知识宝典-2013年海康威视校园招聘嵌入式开发笔试题.zip

    少儿编程scratch项目源代码文件案例素材-驾驶通关.zip

    少儿编程scratch项目源代码文件案例素材-驾驶通关.zip

    小区开放对周边道路通行能力影响的研究.pdf

    小区开放对周边道路通行能力影响的研究.pdf

    冷链物流路径优化:基于NSGA-2遗传算法与软硬时间窗策略的研究

    内容概要:本文探讨了冷链物流车辆路径优化问题,特别是如何通过NSGA-2遗传算法和软硬时间窗策略来实现高效、环保和高客户满意度的路径规划。文中介绍了冷链物流的特点及其重要性,提出了软时间窗概念,允许一定的配送时间弹性,同时考虑碳排放成本,以达到绿色物流的目的。此外,还讨论了如何将客户满意度作为路径优化的重要评价标准之一。最后,通过一段简化的Python代码展示了遗传算法的应用。 适合人群:从事物流管理、冷链物流运营的专业人士,以及对遗传算法和路径优化感兴趣的科研人员和技术开发者。 使用场景及目标:适用于冷链物流企业,旨在优化配送路线,降低运营成本,减少碳排放,提升客户满意度。目标是帮助企业实现绿色、高效的物流配送系统。 其他说明:文中提供的代码仅为示意,实际应用需根据具体情况调整参数设置和模型构建。

    少儿编程scratch项目源代码文件案例素材-恐怖矿井.zip

    少儿编程scratch项目源代码文件案例素材-恐怖矿井.zip

    基于STM32F030的无刷电机高压FOC控制方案:滑膜无感FOC技术及保护机制

    内容概要:本文详细介绍了基于STM32F030的无刷电机控制方案,重点在于高压FOC(磁场定向控制)技术和滑膜无感FOC的应用。该方案实现了过载、过欠压、堵转等多种保护机制,并提供了完整的源码、原理图和PCB设计。文中展示了关键代码片段,如滑膜观测器和电流环处理,以及保护机制的具体实现方法。此外,还提到了方案的移植要点和实际测试效果,确保系统的稳定性和高效性。 适合人群:嵌入式系统开发者、电机控制系统工程师、硬件工程师。 使用场景及目标:适用于需要高性能无刷电机控制的应用场景,如工业自动化设备、无人机、电动工具等。目标是提供一种成熟的、经过验证的无刷电机控制方案,帮助开发者快速实现并优化电机控制性能。 其他说明:提供的资料包括详细的原理图、PCB设计文件、源码及测试视频,方便开发者进行学习和应用。

    基于有限体积法Godunov格式的管道泄漏检测模型研究.pdf

    基于有限体积法Godunov格式的管道泄漏检测模型研究.pdf

    嵌入式八股文面试题库资料知识宝典-CC++笔试题-深圳有为(2019.2.28)1.zip

    嵌入式八股文面试题库资料知识宝典-CC++笔试题-深圳有为(2019.2.28)1.zip

    少儿编程scratch项目源代码文件案例素材-几何冲刺 V1.5.zip

    少儿编程scratch项目源代码文件案例素材-几何冲刺 V1.5.zip

    Android系统开发_Linux内核配置_USB-HID设备模拟_通过root权限将Android设备转换为全功能USB键盘的项目实现_该项目需要内核支持configFS文件系统.zip

    Android系统开发_Linux内核配置_USB-HID设备模拟_通过root权限将Android设备转换为全功能USB键盘的项目实现_该项目需要内核支持configFS文件系统

    C# WPF - LiveCharts Project

    C# WPF - LiveCharts Project

Global site tag (gtag.js) - Google Analytics