http://lucene.apache.org/solr/tutorial.html
solr一些基础的用法
启动,使用内嵌的jetty,也可使用容器
java -jar start.jar
启动后访问管理页面http://localhost:8983/solr/admin
Indexing Data
使用工具索引文档, 切换到exampledocs目录
java -jar post.jar *.xml
post.jar程序将xml文件提交到solr服务建立索引
看看这些xml文件格式,都是<doc></doc>格式化的描述信息,包括字段名和值,字段名在配置文件schema.xml中有描述
执行完成后,在浏览器中查询
查询关键字video
http://localhost:8983/solr/select/?q=video
在字段name中查询video
http://localhost:8983/solr/select/?q=name:video
http://localhost:8983/solr/select/?q=%2Bvideo+%2Bprice%3A[*+TO+400]
数据导入的方式有几种:
使用Data Import Handler (DIH)从数据库中导入,例子看db
CSV文件导入
JSON文档
使用Solr Cell导入二进制文档(如word, pdf)
使用SolrJ编程实现
Updating Data
根据uniqueKey(配置文件中有定义),如果存在则替换之前的数据
重复执行post.jar程序导入xml文件,通过http://localhost:8983/solr/admin/stats.jsp查看numDocs maxDoc统计值
more
Deleting Data
根据id删除索引数据
java -Ddata=args -Dcommit=no -jar post.jar "<delete><id>SP2514N</id></delete>"
参数-Dcommit=no为非自动提交,为提高效率,多次执行操作,最后一次性提交
执行java -jar post.jar会产生提交
根据查询条件删除索引数据
java -Ddata=args -jar post.jar "<delete><query>name:DDR</query></delete>"
Querying Data
查询结果默认用xml返回,看其格式
- q=video&fl=name,id查询video,返回字段name,id
- q=video&fl=name,id,scorescore是相关性分数(relevancy score)
- q=video&fl=*,score返回所有字段和score
- q=video&sort=price desc&fl=name,id,priceprice降序
- q=video&wt=json返回json格式,默认是xml格式
- q=video&sort=inStock asc, price descinStock升序price降序
- q=video&sort=score desc使用score降序
- q=video&sort=inStock asc, score desc
- q=video&sort=div(popularity,add(price,1)) desc函数结果降序
more
Highlighting
更多
Faceted Search
统计查询结果某些字段出现的次数
统计查询结果中字段cat出现的次数
统计查询结果中字段cat和字段inStock出现的次数
统计查询结果中字段price在[0-100]和[>100]两个范围出现的次数
统计查询结果中字段“生产日期”,一个时间段内每1年中出现的次数
Search UI
一个查询页面,看看源码?
http://localhost:8983/solr/browse
Text Analysis
分析和具体的语言有关(中文和英语就很不一样),
more
Analysis Debugging
more
Conclusion
文档格式?(字段,值)
More
distributed search
function queries
numeric field statistics
search results clustering
see Solr Wiki
分享到:
相关推荐
接着在“Solr Tutorial”中给出了一些入门示例,包括快速概述,引导新手通过实例学习Solr的基础知识。 在“Solr System Requirements”部分,介绍了运行Solr所必须满足的硬件和软件条件,这是搭建Solr环境前的必要...
《Liferay Solr 教程:深入理解与实践》 Liferay Solr 教程是针对企业级内容管理和搜索解决方案的一份详细指南,主要聚焦于如何在 Liferay 平台上集成和优化 Apache Solr 搜索引擎。Apache Solr 是一个开源、高性能...
Solr教程此页面描述了使用 Jetty 安装 Solr(用于服务器上的许多不同项目)。 这不是多核配置:一个项目——一个与 Jetty 一起运行的 Solr 实例。安装 Java yum install java-1.7.0-openjdk-devel安装 Solr cd /usr/...
Solr新手工作坊 该存储库包含Code4Lib 2019上的 newbies研讨会的材料。 文件具有我们在研讨会期间将介绍的大部分材料。 为了获得要执行的命令的文本记录(以及它们的参数和输出),该文件中的所有示例均显示为通过...
Elasticsearch is the most popular enterprise search engine followed by Apache Solr, also based on Lucene. Elasticsearch can be used to search all kinds of documents. It provides scalable search, has ...
solr-tutorial:Apache SolrCloud(搜索技术) 更改为相应的子文件夹后,您可以执行以下命令来构建应用程序: gradle干净的构建 运行一个应用程序 您可以使用以下命令来运行应用程序: Gradle运行 但是,请记住...
7. **全文搜索引擎(Full-text Search Engines)**:虽然 Django 内置了一些搜索功能,但在复杂的应用中,可能需要更强大的全文搜索引擎,如 Elasticsearch 或 Solr。这些引擎可以提供更复杂的查询语法、更好的性能...
我首先按照本教程使用Scrapy收集数据/文档: ://docs.scrapy.org/en/latest/intro/tutorial.html 要从scrapy创建json输出文件,我们只需运行以下命令:scrapy crawl taxsaleinfo -o properties.json 从docker-solr...
1 Introduction 3 1.1 Overview . . . . . . . . ....1.2 History ....1.3 Getting involved ....1.4 License ....2.1 Windows installer ....2.2 Windows binary ....2.3 Mac OS X installer ....2.4 Mac OS X binary ....