- 浏览: 1048362 次
- 性别:
- 来自: 上海
文章分类
- 全部博客 (1441)
- 软件思想&演讲 (9)
- 行业常识 (250)
- 时时疑问 (5)
- java/guava/python/php/ruby/R/scala/groovy (213)
- struct/spring/springmvc (37)
- mybatis/hibernate/JPA (10)
- mysql/oracle/sqlserver/db2/mongdb/redis/neo4j/GreenPlum/Teradata/hsqldb/Derby/sakila (268)
- js/jquery/jqueryUi/jqueryEaseyUI/extjs/angulrJs/react/es6/grunt/zepto/raphael (81)
- ZMQ/RabbitMQ/ActiveMQ/JMS/kafka (17)
- lucene/solr/nuth/elasticsearch/MG4J (167)
- html/css/ionic/nodejs/bootstrap (19)
- Linux/shell/centos (56)
- cvs/svn/git/sourceTree/gradle/ant/maven/mantis/docker/Kubernetes (26)
- sonatype nexus (1)
- tomcat/jetty/netty/jboss (9)
- 工具 (17)
- ETL/SPASS/MATLAB/RapidMiner/weka/kettle/DataX/Kylin (11)
- hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie (190)
- ios/swift/android (9)
- 机器学习&算法&大数据 (18)
- Mesos是Apache下的开源分布式资源管理框架 (1)
- echarts/d3/highCharts/tableau (1)
- 行业技能图谱 (1)
- 大数据可视化 (2)
- tornado/ansible/twisted (2)
- Nagios/Cacti/Zabbix (0)
- eclipse/intellijIDEA/webstorm (5)
- cvs/svn/git/sourceTree/gradle/jira/bitbucket (4)
- jsp/jsf/flex/ZKoss (0)
- 测试技术 (2)
- splunk/flunm (2)
- 高并发/大数据量 (1)
- freemarker/vector/thymeleaf (1)
- docker/Kubernetes (2)
- dubbo/ESB/dubboX/wso2 (2)
最新评论
想要学好一门技术,首先就得从思想层次上全面了解这种技术的作用,适用范围,以及优缺点,对于这些理论,大家可以先在Google,或百度上深入了解一下,也可以到其官方网站上看文档或者WIKI,只有在思想层面上,大概了解这个技术的总体架构,那么学起来,就可以很快上手,举个例子,先“会当凌绝顶”一下,然后在爬山,肯定会容易一些,笔者想说的就是这个道理。
下面就开始进入正题,本篇的入门代码,相对简单,主要是先把lucene添加的Demo给搭建起来,后续的修改,删除,查询会在后面的文章中一一补上,笔者觉得学习这东西还是得脚踏实地一步一步来比较好,只要真真正正理解每一行代码的意思,我们就算有收获了,有时候学习步伐太快,反而会根基不牢,效果不好。
需要准备的Jar包
Java代码 复制代码 收藏代码
1.lucene-core-4.3.1.jar
Java代码 复制代码 收藏代码
1.lucene-analyzers-common-4.3.1.jar
Java代码 复制代码 收藏代码
1.package com.qin;
2.
3.import java.io.File;
4.
5.import org.apache.lucene.analysis.Analyzer;
6.import org.apache.lucene.analysis.standard.StandardAnalyzer;
7.import org.apache.lucene.document.Document;
8.import org.apache.lucene.document.StringField;
9.import org.apache.lucene.document.Field.Store;
10.import org.apache.lucene.index.IndexWriter;
11.import org.apache.lucene.index.IndexWriterConfig;
12.import org.apache.lucene.store.Directory;
13.import org.apache.lucene.store.FSDirectory;
14.import org.apache.lucene.util.Version;
15.
16./**
17. * Lucene的演示Demo类
18. *
19. * **/
20.public class CommonLuceneBasic {
21.
22. /**
23. * 抽象的父类文件夹
24. * */
25. public static Directory directory;
26. /**
27. * 返回IndexWriter
28. * */
29. public static IndexWriter getWriter() throws Exception{
30. Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_43);//设置标准分词器 ,默认是一元分词
31. IndexWriterConfig iwc=new IndexWriterConfig(Version.LUCENE_43, analyzer);//设置IndexWriterConfig
32. // iwc.setRAMBufferSizeMB(3);//设置缓冲区大小
33. return new IndexWriter(directory,iwc);
34. }
35. /**
36. * @indexPath 索引存放路径
37. * **/
38. public static void add(String indexWriterPath){
39. IndexWriter writer=null;
40. try{
41. directory=FSDirectory.open(new File(indexWriterPath));//打开存放索引的路径
42. writer=getWriter();
43. Document doc=new Document();
44. doc.add(new StringField("id", "1", Store.YES));//存储
45. doc.add(new StringField("name", "张飞", Store.YES));//存储
46. doc.add(new StringField("content", "也许放弃,才能靠近你!", Store.YES));//存储
47. writer.addDocument(doc);//添加进写入流里
48. writer.forceMerge(1);//优化压缩段,大规模添加数据的时候建议,少使用本方法,会影响性能
49. writer.commit();//提交数据
50. System.out.println("添加成功");
51. }catch(Exception e){
52.
53. e.printStackTrace();
54.
55. }finally{
56.
57. if(writer!=null){
58. try{
59. writer.close();//关闭流
60. }catch(Exception e){
61. e.printStackTrace();
62. }
63. }
64.
65.
66. }
67.
68.
69. }
70.
71. public static void main(String[] args) {
72. String path="E:\\临时索引";
73. add(path);//调用添加方法
74.
75. }
76.
77.
78.
79.
80.
81.}
添加成功之后,我们就可以通过Luke工具,进行索引查看,如果还有不知道Luke工具是什么,或者不知道怎么使用,可以参照我的上一篇日志如何使用luke
http://qindongliang1922.iteye.com/admin/blogs/1913232
下面就开始进入正题,本篇的入门代码,相对简单,主要是先把lucene添加的Demo给搭建起来,后续的修改,删除,查询会在后面的文章中一一补上,笔者觉得学习这东西还是得脚踏实地一步一步来比较好,只要真真正正理解每一行代码的意思,我们就算有收获了,有时候学习步伐太快,反而会根基不牢,效果不好。
需要准备的Jar包
Java代码 复制代码 收藏代码
1.lucene-core-4.3.1.jar
Java代码 复制代码 收藏代码
1.lucene-analyzers-common-4.3.1.jar
Java代码 复制代码 收藏代码
1.package com.qin;
2.
3.import java.io.File;
4.
5.import org.apache.lucene.analysis.Analyzer;
6.import org.apache.lucene.analysis.standard.StandardAnalyzer;
7.import org.apache.lucene.document.Document;
8.import org.apache.lucene.document.StringField;
9.import org.apache.lucene.document.Field.Store;
10.import org.apache.lucene.index.IndexWriter;
11.import org.apache.lucene.index.IndexWriterConfig;
12.import org.apache.lucene.store.Directory;
13.import org.apache.lucene.store.FSDirectory;
14.import org.apache.lucene.util.Version;
15.
16./**
17. * Lucene的演示Demo类
18. *
19. * **/
20.public class CommonLuceneBasic {
21.
22. /**
23. * 抽象的父类文件夹
24. * */
25. public static Directory directory;
26. /**
27. * 返回IndexWriter
28. * */
29. public static IndexWriter getWriter() throws Exception{
30. Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_43);//设置标准分词器 ,默认是一元分词
31. IndexWriterConfig iwc=new IndexWriterConfig(Version.LUCENE_43, analyzer);//设置IndexWriterConfig
32. // iwc.setRAMBufferSizeMB(3);//设置缓冲区大小
33. return new IndexWriter(directory,iwc);
34. }
35. /**
36. * @indexPath 索引存放路径
37. * **/
38. public static void add(String indexWriterPath){
39. IndexWriter writer=null;
40. try{
41. directory=FSDirectory.open(new File(indexWriterPath));//打开存放索引的路径
42. writer=getWriter();
43. Document doc=new Document();
44. doc.add(new StringField("id", "1", Store.YES));//存储
45. doc.add(new StringField("name", "张飞", Store.YES));//存储
46. doc.add(new StringField("content", "也许放弃,才能靠近你!", Store.YES));//存储
47. writer.addDocument(doc);//添加进写入流里
48. writer.forceMerge(1);//优化压缩段,大规模添加数据的时候建议,少使用本方法,会影响性能
49. writer.commit();//提交数据
50. System.out.println("添加成功");
51. }catch(Exception e){
52.
53. e.printStackTrace();
54.
55. }finally{
56.
57. if(writer!=null){
58. try{
59. writer.close();//关闭流
60. }catch(Exception e){
61. e.printStackTrace();
62. }
63. }
64.
65.
66. }
67.
68.
69. }
70.
71. public static void main(String[] args) {
72. String path="E:\\临时索引";
73. add(path);//调用添加方法
74.
75. }
76.
77.
78.
79.
80.
81.}
添加成功之后,我们就可以通过Luke工具,进行索引查看,如果还有不知道Luke工具是什么,或者不知道怎么使用,可以参照我的上一篇日志如何使用luke
http://qindongliang1922.iteye.com/admin/blogs/1913232
发表评论
-
elasticsearch异常信息汇总
2017-11-06 09:34 15421.IndexMissingException 异常信息 ... -
Elasticsearch的架构
2018-03-22 10:30 507为什么要学习架构? Elasticsearch的一些架构 ... -
怎么在Ubuntu上打开端口
2017-10-21 20:45 0Netstat -tln 命令是用来查看linux的端口使用情 ... -
Elasticsearch工作原理
2018-03-22 10:30 448一、关于搜索引擎 各 ... -
Elasticsearch的路由(Routing)特性
2017-10-11 10:41 0Elasticsearch路由机制介 ... -
Elasticsearch中的segment理解
2017-10-11 09:58 1876在Elasticsearch中, 需要搞清楚几个名词,如se ... -
Elasticsearch的路由(Routing)特性
2017-09-28 16:52 614Elasticsearch路由机制介绍 Elastics ... -
Elasticsearch 的 Shard 和 Segment
2017-09-28 16:05 1198Shard(分片) 一个Shard就是一个Lu ... -
开源大数据查询分析引擎现状
2017-09-22 03:04 828大数据查询分析是云计算中核心问题之一,自从Google在20 ... -
大数据处理方面的 7 个开源搜索引擎
2017-09-22 03:01 494大数据是一个包括一切 ... -
开源大数据查询分析引擎现状
2017-09-23 11:26 547大数据查询分析是云计算中核心问题之一,自从Google在2 ... -
elasticsearch 把很多类型都放在一个索引下面 会不会导致查询慢
2017-09-25 09:45 979主要看数据量ES索引优 ... -
腾讯大数据Hermes爱马仕的系统
2017-09-23 11:15 982腾讯大数据最近做了几件事,上线了一个官方网站http:// ... -
配置高性能Elasticsearch集群的9个小贴士
2017-09-25 10:02 589Loggly服务底层的很多 ... -
Elasticsearch与Solr
2017-09-25 16:24 546Elasticsearch简介* Elasti ... -
大数据杂谈微课堂|Elasticsearch 5.0新版本的特性与改进
2017-09-26 09:57 808Elastic将在今年秋季的 ... -
ElasticSearch性能优化策略
2017-09-26 09:51 447ElasticSearch性能优化主 ... -
ES索引优化
2017-09-19 20:39 0ES索引优化篇主要从两个方面解决问题,一是索引数据过程;二是 ... -
分词与索引的关系
2017-09-19 20:33 0分词与索引,是中文搜索里最重要的两个技术,而且两者间是密不可 ... -
Elasticsearch中的segment理解
2017-09-19 20:30 0在Elasticsearch中, 需要搞清楚几个名词,如se ...
相关推荐
lucene,lucene教程,lucene讲解。 为了对文档进行索引,Lucene 提供了五个基础的类 public class IndexWriter org.apache.lucene.index.IndexWriter public abstract class Directory org.apache.lucene.store....
Lucene是一款强大的全文搜索引擎库,广泛应用于各种数据检索场景。在C#环境下,利用Lucene进行时间区间搜索是提高数据检索效率和精确度的重要手段。本篇将深入探讨如何在C#中实现Lucene的时间区间查询匹配,以及涉及...
【Lucene 4.7.0 全套JAR包详解】 Lucene是一个开源全文搜索引擎库,由Apache软件基金会开发并维护。它提供了一个高级、灵活的文本搜索API,允许开发者轻松地在应用程序中实现复杂的搜索功能。这次提供的“lucene-...
本压缩包包含的是Lucene 3.5.0版本的全部源码,对于想要深入理解Lucene工作原理、进行二次开发或者进行搜索引擎相关研究的开发者来说,是一份非常宝贵的学习资源。 Lucene 3.5.0是Lucene的一个重要版本,它在3.x...
《Lucene in Action 第二版》是一本深入探讨Apache Lucene全文检索库的专业书籍,它在Java开发领域具有很高的权威性。这本书详细介绍了如何利用Lucene进行高效的文本搜索和索引构建,是Java开发者和信息检索爱好者的...
在IT领域,搜索引擎技术是至关重要的,而Lucene作为一个开源全文搜索引擎库,广泛应用于各种文本检索系统中。本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、...
《Lucene与关系型数据库对比:深度解析与应用探索》 在信息爆炸的时代,数据管理和检索成为了企业乃至个人日常工作中不可或缺的部分。随着技术的发展,不同的数据处理方式应运而生,其中Lucene与关系型数据库作为两...
"计算机专业外文翻译(lucene相关)" 本文翻译了论文"Scale-up x Scale-out: A Case Study using Nutch/Lucene",介绍了计算机专业领域中关于Lucene相关的知识点。 Scale-up vs Scale-out 论文中讨论了两个相对...
赠送jar包:lucene-core-7.2.1.jar; 赠送原API文档:lucene-core-7.2.1-javadoc.jar; 赠送源代码:lucene-core-7.2.1-sources.jar; 赠送Maven依赖信息文件:lucene-core-7.2.1.pom; 包含翻译后的API文档:lucene...
**Lucene.NET 中文分词技术详解** Lucene.NET 是一个高性能、全文检索库,它是Apache Lucene项目在.NET平台上的实现。作为一个开源的搜索引擎框架,Lucene.NET为开发者提供了强大的文本搜索功能。而在处理中文文档...
赠送jar包:lucene-core-7.7.0.jar; 赠送原API文档:lucene-core-7.7.0-javadoc.jar; 赠送源代码:lucene-core-7.7.0-sources.jar; 赠送Maven依赖信息文件:lucene-core-7.7.0.pom; 包含翻译后的API文档:lucene...
《全面解析Lucene jar包:从基础到应用》 在信息技术高速发展的今天,搜索引擎已经成为我们获取信息不可或缺的工具。在Java领域,Lucene作为一个强大的全文搜索引擎库,深受开发者喜爱。本文将详细介绍“lucene所有...
Apache Lucene是一个开源全文搜索引擎库,它为Java开发者提供了强大的文本搜索功能。在这个"Lucene 5 主要jar包"中,我们找到了一系列与Lucene 5.0.0相关的jar文件,这些文件是构建和运行基于Lucene的搜索应用程序的...
**Lucene原理详解** Lucene是一个高性能、全文检索库,由Apache软件基金会开发并维护,是Java编程语言中广泛使用的搜索引擎库。它提供了一个简单但功能强大的API,用于索引和搜索文本数据,使得开发者可以轻松地在...
在信息检索和存储系统中,Lucene是一个开源的全文搜索引擎库,广泛应用于各种需要全文搜索功能的软件项目中。为了高效地处理和检索存储的词项(term),Lucene使用了FST(有限状态转换器,Finite State Transducer)...
**基于Lucene技术的增量索引** 在信息技术领域,全文搜索引擎是处理大量数据查询的关键工具。Apache Lucene是一个开源的全文检索库,被广泛应用于构建高效、可扩展的搜索功能。本文将深入探讨如何利用Lucene实现...
### Lucene对XML文档建立索引的技术解析与实践 #### 一、引言 随着互联网技术的迅猛发展,非结构化数据(如XML文档)在企业和组织中的应用日益广泛。如何高效地处理这些非结构化的数据,特别是进行快速检索成为了一...
【标题】"lucene的jar包,欢迎下载"所涉及的知识点主要集中在Lucene这个开源全文搜索引擎库上。Lucene是Apache软件基金会的顶级项目,它是一个高性能、全文本搜索库,提供了完整的搜索功能,包括索引、查询、排序等...
**Lucene学习指南** Lucene是一个高性能、全文检索库,由Apache软件基金会开发并维护,是Java编程语言中广泛使用的搜索引擎库。它提供了一个简单的API,使得开发者能够方便地在应用中实现全文检索功能。本篇文章将...