如需转载请标明出处:http://ljj-epsspl.iteye.com/blog/1174314
看到该文章的同志们,如本文有描述不对,不准确,欢迎指出,谢谢.:)
很久没有写技术blog了,最近换了一家新公司,自己的职位,发展高度都有所提高与改变,让我看到了更多的东西,跟同事的沟通,对技术的学习,等等
昨天刚整了lucene,用的是apatch的solr3.3.0,然后呢,就在前些天他更新到3.4.0了,呵呵,他们真快.
先来说说我对lucene的一些简单的了解.我目前了解到的全文搜索是这样的:
全文搜索是指在某个领域的内容搜索变得速度更快(不操作数据库,同时建立了搜索索引应该是更快吧),更方便.
全文搜索它搜索的数据不在数据,而是放在从它自己指定的内容里进行搜索.这样的好处在于文搜索的内容与数据库,与你的系统的前台可以分开.对于网站来说数据更安全.
solr是对lucene做了一层封装,让lucene用起来更方便,更容易懂.
-------------------------------------------------------------------------------
[solr服务器的建立]
1,从官网上下载apache-solr-3.3.0.zip[官网:http://lucene.apache.org/solr/]
2,它的这个目录下有个solr.war文件[apache-solr-3.3.0\example\webapps\solr.war]
3,[为了学习的方便,只要能学习,直接用note++也可以]把这个文件倒入到你的eclipse里中,在这里面可以写测试例子,可以看他的配置之类的,因为他的环境是好的
4,[这里用的是taomcat6.0.32]在tomcat-6.0.32\conf\Catalina\localhost\solr.xml 同时在\webapps\下要加上solr的project
写上以下内容:
<?xml version="1.0" encoding="UTF-8"?>
<Context path="/" docBase="webapps/gss" reloadable="true" privileged="true">
<Environment name="solr/home" type="java.lang.String" value="你的项目的路径\solr-home" override="true"/>
</Context>
5,solr的建立最好还是去参考一下官网的,然后再结合这里,也许对初学者有帮助
这里就配置完成了,http://localhost:port/你的project名 应该就可以访问了.
[索引查看]
前面有说全文搜索的索引是建立在自己的服务器上的,那么当然可以单独查看他的,就像是数据库一样,有他的查看界面:
可以上这里下:http://code.google.com/p/luke/ 然后搜索一下就知道怎么用了,打开这个工具选择索引数据所在的地方就是你的"你的项目的路径\solr-home\data";
这一块我没有仔细的看,目前能写出来的就这些,如果有配置不成功的同志,又急需的,可以留个言之类的,我给你传个好的环境过去,[tomcat,solr project,luke]
共同学习共同成长,没什么好保留的!呵呵;
[以下是我在学习过记的琐碎的笔记,非常值得看]
*********************************
apatch的全文搜索solr lucene
官网blog:
http://blog.chenlb.com/2009/05/apache-solr-quick-start-and-demo.html
官网wiki:
http://wiki.apache.org/solr/
http://wiki.chenlb.com/solr/doku.php
http://wiki.chenlb.com/solr/doku.php?id=solrinstall
http://wiki.chenlb.com/solr/doku.php?id=solrtomcat
http://chenlb.blogjava.net/archive/2008/03/25/188459.html
官网:
http://lucene.apache.org/solr/
IBM详细的介绍:
http://www.ibm.com/developerworks/cn/java/j-solr-update/
other[非常不错的分析]:
Lucene / Solr 开发经验:http://www.wlgsq.com/index.php?action-blogdetail-uid-3-id-45
全文检索的基本概念和原理:http://blog.csdn.net/monkey_d_meng/article/details/6064063
[API]
http://lucene.apache.org/solr/api/index.html
Terms组件搜索自动补全功能
http://www.iteye.com/topic/993088
http://xyliufeng.iteye.com/blog/772404
日期,时间的搜索
http://wiki.apache.org/solr/SolrRelevancyFAQ#How_can_I_boost_the_score_of_newer_documents
http://lucene.apache.org/solr/tutorial.html#Faceted+Searchc
http://wiki.apache.org/solr/SimpleFacetParameters
solr lucene的架构(待了解)
服务器:
可以选择Tomcat, Jetty, or Resin,通过修改配置文件,加入solr的包的方式把solr与这些容器整合成为solr的服务器
查看:http://wiki.chenlb.com/solr/doku.php?id=solrinstall
http://blog.chenlb.com/2009/05/apache-solr-quick-start-and-demo.html
luke:
http://code.google.com/p/luke/
全文搜索的概念:
http://blog.csdn.net/monkey_d_meng/article/details/6064063
*********************************
附
接下来将介绍
1,全文搜索的索引的创建,保存,分词类的使用
2,jQuery的自动补全内容(autoComponent)
3,solr关键字的搜索补全功能(与上一起使用)
4,全文搜索结果的查询(代码),页面展示,分页
分享到:
相关推荐
solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar
Solr-Zookeeper-Tomcat集群搭建教程 在大数据和搜索引擎领域,Apache Solr是一个非常流行的全文检索服务。它能够提供高效、可扩展的搜索和分析功能。为了实现高可用性和负载均衡,通常会将Solr部署在分布式环境中,...
- `server`: 存放Solr服务器端代码,如SolrJetty容器、管理API等。 - `contrib`: 第三方贡献的模块,如数据导入工具等。 - `dist`: 发布的可执行文件和jar包。 - `docs`: 文档和API参考。 - `example`: 示例...
solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-...
1. **配置Solr服务器**:首先,将`apache-solr-dataimportscheduler-1.0.jar`添加到Solr服务器的`lib`目录下,确保服务器启动时能加载这个库。 2. **添加Scheduler配置**:在Solr的配置文件`solrconfig.xml`中,你...
- 将 C:\solr-4.9.0\example\resources\log4j.properties 复制到 C:\apache-tomcat-7.0.53\webapps\solr\WEB-INF\classes 3. **启动与测试** - 启动 Tomcat 服务器 - 在浏览器中访问 http://localhost:8080/solr...
- `server` 目录:包含了Solr服务器端的所有组件,如启动脚本、配置文件、核心模块等。 - `example` 目录:提供了示例配置和运行环境,帮助用户快速启动和测试Solr。 - `dist` 目录:存放Solr的发行版文件,如预编译...
在"solr6--solr-dataimporthandler-scheduler-1.1"这个项目中,我们关注的重点是DIH的调度功能,也就是如何定期自动更新Solr索引。 DataImportHandler(DIH)是Solr的一个插件,用于从关系型数据库或其他结构化数据...
- **部署JAR**: 将`apache-solr-dataimporthandler-extras-1.4.0.jar`添加到Solr服务器的lib目录,这样Solr就能识别并使用其中的扩展。 - **启动DataImport**: 通过Solr的管理界面或API启动数据导入过程。 - **...
solr 增量更新所需要的包 solr-dataimporthandler-6.5.1 + solr-dataimporthandler-extras-6.5.1 + solr-data-import-scheduler-1.1.2
solr-data-import-scheduler-1.1.2,用于solr定时更新索引的jar包,下载后引入到solr本身的dist下面,或者你tomcat项目下面的lib下面
solr自动更新包
在使用时,我们需要将solr-dataimportscheduler-1.1.1.jar添加到Solr服务器的lib目录下,确保在启动时能够加载该插件。同时,还需要在Solr的配置文件中进行相应的设置,比如定义数据源、指定增量字段等,以指示插件...
apache-solr-core-1.4.0.jar,apache-solr-core-1.4.0.jar
这个工具的主要版本是"solr-mongo-importer-1.1",这表明它是1.1版,可能包含了对前一版本的改进和优化。 MongoDB是一个流行的NoSQL数据库系统,它以文档为中心,适合存储非结构化和半结构化的数据。而Solr是Apache...
solr6.1.0版本jar已经不再提供读取自动索引配置文件路径的方法,因此apache-solr-dataimportscheduler-1.0内调用该方法的所有操作都无法实现。于是需要下载apache-solr-dataimportscheduler-1.0-with-source.jar并...
【Linux-solr-tomcat】整合教程 在IT领域,Linux、Solr、Tomcat以及IK分词器是常见的技术组件,它们各自扮演着重要的角色。Linux作为开源操作系统,为开发者提供了稳定、安全的运行环境;Solr是Apache Lucene项目的...
Solr-8.11.1是该软件的一个特定版本,包含了最新的特性和改进。 在"solr-8.11.1.tgz"这个压缩包中,我们可以期待找到以下关键组成部分: 1. **Solr WAR 文件**:这是核心的搜索服务器应用程序,通常命名为`solr....
标题中的 "solr-dataimportscheduler-1.1.jar" 指的是该插件的一个特定版本,即1.1版。这个 jar 包是将 Solr 与外部数据源集成并实现增量数据导入的关键组件。 Apache Solr 是一个流行的开源全文搜索引擎,广泛用于...
Solr-9.0.0是该软件的最新版本,此版本可能包含了一些新的特性和改进,比如性能优化、新的查询语法、更强大的分析器等。 在Solr-9.0.0的压缩包中,通常会包含以下组件: 1. **bin** 文件夹:这个目录下有启动和...