1,使用curl查询结果,并转成csv保存
curl http://localhost:8983/solr/company/query -d '
q=*:*&
start=500&
rows=300&
sort=modifyTime asc&
fl=cpyName&
wt=csv' | sed '1d' >> csv
2,使用curl查询一个关键词
curl -s http://localhost:8983/solr/company/query -d '
q=sname:'$1'&
rows=0'
3,添加一个文档doc:
curl http://localhost:8983/solr/demo/update -d '
[
{"id" : "book1",
"title_t" : "The Way of Kings",
"author_s" : "Brandon Sanderson"
}
]'
4,获取一个文档:
curl http://localhost:8983/solr/demo/get?id=book1
{
"doc": {
"id" : "book1",
"author_s": "Brandon Sanderson",
"title_t" : "The Way of Kings",
"_version_": 1410390803582287872
}
}
5,更新一个文档:
curl http://localhost:8983/solr/demo/update -d '
[
{"id" : "book1",
"cat_s" : { "add" : "fantasy" },
"pubyear_i" : { "add" : 2010 },
"ISBN_s" : { "add" : "978-0-7653-2635-5" }
}
]'
6,以CSV形式,添加一批文档:
$ curl http://localhost:8983/solr/demo/update?commitWithin=5000 -H 'Content-type:text/csv' -d '
id,cat_s,pubyear_i,title_t,author_s,series_s,sequence_i,publisher_s
book1,fantasy,2010,The Way of Kings,Brandon Sanderson,The Stormlight Archive,1,Tor
book2,fantasy,1996,A Game of Thrones,George R.R. Martin,A Song of Ice and Fire,1,Bantam
book3,fantasy,1999,A Clash of Kings,George R.R. Martin,A Song of Ice and Fire,2,Bantam
book4,sci-fi,1951,Foundation,Isaac Asimov,Foundation Series,1,Bantam
book5,sci-fi,1952,Foundation and Empire,Isaac Asimov,Foundation Series,2,Bantam
book6,sci-fi,1992,Snow Crash,Neal Stephenson,Snow Crash,,Bantam
book7,sci-fi,1984,Neuromancer,William Gibson,Sprawl trilogy,1,Ace
book8,fantasy,1985,The Black Company,Glen Cook,The Black Company,1,Tor
book9,fantasy,1965,The Black Cauldron,Lloyd Alexander,The Chronicles of Prydain,2,Square Fish
book10,fantasy,2001,American Gods,Neil Gaiman,,,Harper'
7,查询一批数据,返回每行数据的:关键词,查询耗时,命中数量,示例数据如下:
"连云港通裕天然气有限公司"
"连云港市天缘食品有限公司"
"重庆市涪陵国有资产投资经营集团有限公司"
查询脚本如下:
curl -s http://localhost:8983/solr/webpage/query -d '
q=content:'$1'&
rows=0'
批处理脚本如下:
执行这个批处理的查询脚本,测下平均耗时:
#for line in `cat csv | head -n 3`
for line in `cat csv`
do
echo $line `sh kw_query.sh $line | tr -d '\r\n' | gawk -F, '{print $2,$5}' | gawk -F: '{print $2,$4 }' | gawk -F" " '{print $1,$3}'`
done
结果如下:
"连云港通裕天然气有限公司" 283 7
"连云港市天缘食品有限公司" 137 2
"重庆市涪陵国有资产投资经营集团有限公司" 15 8
参考资料:http://yonik.com/
最后欢迎大家扫码关注微信公众号:我是攻城师(woshigcs),我们一起学习,进步和交流!(woshigcs)
本公众号的内容是有关搜索和大数据技术和互联网等方面内容的分享,也是一个温馨的技术互动交流的小家园,有什么问题随时都可以留言,欢迎大家来访!
分享到:
相关推荐
在本文中,我们将深入探讨如何使用Spring Boot与MyBatis框架来实现一个基本的增删改查(CRUD)功能。Spring Boot简化了Spring应用程序的配置,并提供了开箱即用的功能,而MyBatis则是一个轻量级的持久层框架,它将...
本文将深入探讨如何使用客户端工具来便捷地进行ES的增删改查操作,以及这些工具在全文检索和搜索引擎中的应用。 ### 一、Elasticsearch概述 Elasticsearch基于Lucene库构建,提供了分布式、实时、容错的全文检索...
如果每个节点都配一个code 即我代码里的acurl 节点1的当前节点code为 0 1 0为根节点id 1为当前id 为间隔 用字符串拼接可以实现 节点2的当前节点code为 0 1 2 0为根节点id 1为节点1 的id 2为当前节点id 类推 ...
**增删改查实现** 在GORM的帮助下,开发者可以轻松地定义数据模型,实现CRUD操作。例如,你可以创建一个`User`模型,然后使用GORM的`Create`、`Find`、`Update`和`Delete`方法来处理数据。Iris框架则负责接收HTTP...
这意味着系统可能通过网络请求,例如使用cURL或者file_get_contents函数,获取并解析搜狐星座页面上的HTML内容,从中提取出各个星座的运势信息。这涉及到网络编程和网页抓取技术,同时也需要对HTML和CSS选择器有一定...
Elasticsearch-CURL是开发者和管理员在操作Elasticsearch(ES)时常用的一种工具,它结合了HTTP客户端curl和Elasticsearch的API,用于执行各种数据操作和查询。CURL命令的基本格式为: ```markdown curl -H ...
Solr 是由 Apache 软件基金会维护的一个项目,它基于 Java 平台,可部署在各种操作系统上,包括 Linux。此最新版的 Solr 8.8.1 带来了许多性能提升、新功能以及对先前版本的优化。 在 Linux 上安装 Solr 8.8.1 的第...
Solr集群搭建是一个复杂但重要的过程,用于实现大型、高可用性和可扩展性的搜索解决方案。Apache Solr是一款基于Lucene的开源全文搜索引擎,它提供了分布式搜索、近实时处理、多字段排序等功能。以下是对Solr集群...
在查询方面,ES允许通过JSON格式或者URL进行查询,并且可以通过curl或者ElasticSearch-Head(一个类似于Solr Admin页面的工具)来进行操作。ES的查询灵活性在于它支持在查询过程中进行完整的脚本编写,从而实现对...
`curl`是一个强大的命令行工具,用于在操作系统中下载或上传数据,支持众多网络协议,如HTTP、HTTPS、FTP、FTPS等。它在IT领域中广泛应用,特别是在自动化脚本、系统管理、软件开发和测试中。`curl`的名字来源于...
Linux版Solr是一款在Linux操作系统上运行的全文搜索引擎服务器,主要由Apache软件基金会开发并维护。Solr以其高效、可扩展性和灵活性而受到广大开发者和企业的青睐,常用于构建企业级的搜索应用。本资源提供的版本为...
CURL库的核心概念在于提供一个统一的接口,使得开发者无需关心底层网络协议的细节,就能实现复杂的网络操作。在C++中使用CURL,我们需要首先下载并安装CURL库,然后将其头文件和库文件链接到我们的项目中。 1. **...
例如,你可以用`curl`来执行索引创建、文档的增删改查、搜索查询等各种操作。只需要设置好系统环境变量,确保`curl`命令可以被系统识别,然后构造合适的HTTP请求URL,即可完成对Elasticsearch的调用。 使用`curl`的...
在本文中,我们将深入探讨如何在PHP 7环境中利用cURL操作网络资源,包括网页抓取、调用WebService接口以及访问HTTPS资源。 一、开发环境 为了进行PHP与cURL的实践,我们需要搭建一个基础的开发环境。在这个案例中,...
7. **导入数据**:Solr使用`bin/post`工具或者Solr Cloud的`curl`命令来导入JSON、XML或其他格式的数据。例如,`bin/post -c <core_name> exampledocs/*.xml`可以导入“exampledocs”目录下的所有XML文件。 8. **...
`curl-7.53.1`是该工具的一个特定版本,由`spendrhy`发布,适用于AIX 7.1操作系统。在AIX系统上安装`curl`对于系统管理员和开发人员来说非常重要,因为它提供了对网络资源的便捷访问,特别是用于调试和测试URL。 ...
### 使用curl操作OpenStack Swift详解 #### 一、概述 在云计算领域,OpenStack作为一款开源的云操作系统,提供了丰富的功能和服务。其中Swift是OpenStack项目中的一个子项目,主要负责提供对象存储服务,用于存储...
本文将围绕给定内容中的关键命令进行详细的解析,主要包括 Solr 的启动、集群管理、数据导入以及配置更新等方面的操作。 #### Solr 服务启动 Solr 支持分布式部署,通过云模式可以实现高可用和负载均衡。给定文件中...
描述中的内容与标题相同,再次强调了这个操作是通过 `curl` 来克隆 GitHub 上的 `curl/curl` 项目。 标签 "git" 暗示了这个话题与 Git 版本控制系统相关。Git 是一个分布式版本控制系统,用于跟踪对文件和目录的...