接着上篇http://cxshun.iteye.com/blog/1039445,我们讲了怎么初始化配置solr,并运行。问题来了,当我们配置完成后,索引当中并没有任何东西,就是说我们查询得到的结果永远是0。
现在这篇文章,我们要讲的就是如果添加数据和删除数据,并体验一下solr的基本请求参数的用法。
1)首先,我们必须知道,solr添加数据类型可以有多种格式,最常用的是XML和JSON,这两种的可读性是最好的。在solr的example/exampledocs文件夹内有自带一些XML格式的文件,便于我们进行添加数据。

首先呢,又是一些废话,当然是启动example自带的jetty啦,还是上次的命令,java -jar start.jar。
接着另外开一下cmd,进入到example/exampledocs文件夹内,运行java -jar post.jar *.xml,这里的*.xml代表文件夹内的所有XML文件,当然你也可以选择其他一个进行添加,执行后我们看到执行结果。

看到最后一句,它表明提交这次索引所有的变化。这个提交的设置我们在后面会看到它的用法。
2)这里我们再进入到solr的管理页面,http://localhost:8983/solr/admin,我们直接搜索solr,看到页面大概如下:

我们进行搜索的结果默认是用XML格式显示,当然我们可以让它用JSON格式来显示,只要加上wt=json即可,加上后我们看到的结果为:

可以看到正确的结果。
http://localhost:8983/solr/select/?q=solr&version=2.2&start=0&rows=10&indent=on&wt=json下面我们分析一下这个链接中参数的意义,q当然是搜索的内容啦,version暂时可以不管,用处不在,start和rows与hibernate中的分页参数类似,指开始的记录位置和查询的条数,indent指返回代码的缩进,可以试一下不加这个和加这个的区别,wt则是返回的结果格式。
3)上面是我们用的它自带的XML文件提交的结果,下面我们自己来写一个。为了方便,我们就参照它的救命文件写一个。我们找到schema.xml可以看到:

这个是它允许我们提交的field的名称,我们就参照这些字段写几个试试吧。我把这个文件命名为test.xml
<add>
<doc>
<field name="id">Donnie Yen</field>
<field name="text">Great</field>
</doc>
</add>
接着我们用java -jar post.jar test.xml出现下面的结果:

这表明我们的数据已经提交成功,我们可以搜索一下:
http://localhost:8983/solr/select/?q=text:great&version=2.2&start=0&rows=10&indent=on
这表明我们提交的数据已经成功更新到索引了。
4)说了添加,现在也该来删除一些东西了,我们想删除我们刚才添加的那条记录,我们可以发送命令java -Ddata=args -jar post.jar "<delete><id>Donnie Yen</id></delete>"(这个命令中的-Ddata=args表明数据是中参数中获取),出现

则我们删除成功,不确定?那么我们再去查一下:

没了吧,证明我们删除成功了。
这些东西不难吧。solr用得比较多的东西就是分面浏览,也就是facet navigation。下面我们来学习一下。
5)分面浏览指的是像淘宝的功能一样,我们搜索一种产品,它会在上面再根据类别分出好多小类,直接看图:

我们看到它又分出了好多类,这种效果就叫分面浏览。
solr可以轻松做到分面浏览,比如我们在浏览器输入http://localhost:8983/solr/select/?q=solr&version=2.2&start=0&rows=10&indent=on&facet=true&facet.field=name&facet.query=price:[300%20TO%20400],我们可以看到:

这就是分面浏览的结果,它根据每个值再重新统计,统计出该类别下有多少个值。分面浏览的参数比较多,大家可以上WIKi上面看看http://wiki.apache.org/solr/SimpleFacetParameters。

- 大小: 40.5 KB

- 大小: 9 KB

- 大小: 26.7 KB

- 大小: 14 KB

- 大小: 9 KB

- 大小: 7.5 KB

- 大小: 13.4 KB

- 大小: 3.8 KB

- 大小: 6 KB

- 大小: 3.3 KB

- 大小: 4.8 KB
分享到:
相关推荐
Solr初体验:深入理解开源全文搜索引擎 Solr,全称Apache Solr,是一个高度可扩展的、开源的全文搜索引擎平台。它允许开发者通过HTTP接口对大量文本数据进行高效的搜索和分析。Solr由Java编写,是Apache软件基金会...
Solr初体验 Apache Solr 是一款开源的全文搜索引擎,基于 Lucene 库,提供了高效、可扩展的搜索和分析功能。它不仅用于网站的全文检索,还广泛应用于企业级的文档检索、商品搜索以及数据挖掘等领域。这篇博客将带你...
Solr是中国Apache软件基金会开发的一款高性能、基于Java的全文搜索引擎服务器。...在这个"solr软件包扩展词典可停词配置...在实际项目中,结合具体业务场景,灵活运用Solr的各种功能,将能为企业带来显著的搜索体验提升。
7. **Lucene和Solr**: Lucene是Java的全文检索库,而Solr是在Lucene基础上构建的搜索引擎服务器。它们用于实现高效的文本搜索功能,理解和掌握这些技术对于提升网站和应用的搜索体验至关重要。 8. **综合案例知识点...
- **GitHub**: 2013年初,GitHub选择了ElasticSearch替代原有的Solr系统,用于处理PB级别的数据搜索,包括13亿个文件和1300亿行代码。 - **维基百科**: 维基百科采用了ElasticSearch构建其核心搜索架构,提供高效且...
Nutch 初体验 ##### 3.1 爬行企业内部网 - **配置 Nutch**:首先需要针对企业内部网的特点调整 Nutch 的配置,例如限制爬取范围、增加代理服务器设置等。 - **配置 Tomcat**:确保 Tomcat 能够正常运行 Nutch 的 ...
3. 库支持:Java生态系统中有许多优秀的库,如Apache Lucene和Solr,它们提供了完整的搜索引擎解决方案,包括索引、搜索、排序等功能。 四、实时返回搜索结果 要实现搜索结果的实时返回,系统设计需要考虑到低延迟...
在这些领域,开发者可能需要掌握如Elasticsearch、Solr这样的全文搜索引擎,或者使用Python的Scrapy框架进行网络爬虫开发,以获取并处理大量数据。对于推荐系统,机器学习算法,如协同过滤或深度学习模型,也可能是...