solr4.x之原子更新

qindongliang1922

浏览: 2207752 次
性别:
来自: 北京

最近访客更多访客>>

北风norther

godandghost

youhere

tanss

博主相关

博客

微博

相册

留言

关于我

博客专栏

: 证道Lucene4
浏览量：118241

: 证道Hadoop
浏览量：126628

: 证道shell编程
浏览量：60684

: ELK修真
浏览量：71862

文章分类

社区版块

存档分类

博客分类：

Solr

solr lucene solr原子更新

solr4.x发布以后，最值得人关注的一个功能，就是原子更新功能，传说的solr是否能真正的做到像数据库一样，支持单列更新呢？在solr官方的介绍中，原子更新是filed级别的更新，不会涉及整个Documnet级别的更新，但事实真是如此吗，经散仙验证，并非如此，原子更新这种功能，在Lucene层面上，就否定了这种方式，因为是索引存储结构，决定了它的更新方式，在Lucene中我们想更新一条数据怎么办？

很简单，删除原来的数据，在添加一条数据进去，那么假如，我们只更新了某一个字段呢，也要删除整条数据，重新添加？没错，事实就是这样，严格来说，在Lucene索引中，并不存在更新删除一说，即使是删除，也是伪删除，临时打一个删除标签，在下次索引合并时，会清理掉标记的标签，Lucene的索引存储结构与HDFS的的结构从某种程度上来说，是相似的，仅仅支持Append操作。

那么如何验证原子更新，到底是不是真的是原子更新呢，这个很好办，我们只需要关注更新后的doc的docid有没有变化，即可验证，为什么这样讲？
在lucene里每个doc都有一个唯一的docid，默认情况下docid，是自增的，每增加一行数据，docid就会新增一个，删除后的docid，在下次merge的时候，会重置倒排表docid顺序，这个docid与Oracle的rownum伪列是非常类似的。

不过话说回来，虽然原子更新功能只是一个华而不实的功能，但是solr对其进行了封装，这样以来使得我们操作solr更加容易和方便，下面介绍下在solr中原子更新的内容，和使用方式。

原子更新注意事项：
1，想支持原子更新的field，必须存储（store=true），否则，使用将会出现问题
2，需要在solrconf.xml配置<updateLog/>，这一点默认就已经不配置了，也就是说我们只需要记住原子更新的域需要存储即可。

原子更新支持的操作：
1，set操作，是指对单，多值域的一种更新（覆盖操作）
2，add操作，仅多多值域生效，给多值域添加一个内容
3，inc操作，对数值域进行一次自增操作，举个例子，原来的值是，10，这次
你inc=3，那么更新后的值就是13

在本文，散仙只介绍，以solrj的操作方式，如果想详细了解更多其他方式，比如json或xml的方式，请点击此处

具体的核心代码如下：

	/**
	 * 原子更新方式
	 * */
	public static void atomUpdate1Store()throws Exception{
		SolrInputDocument sd = new SolrInputDocument();
		sd.addField("id", "1");//根据id唯一标识
		HashMap<String,String> map=new HashMap<String, String>();
		map.put("add", "国际1");//放入支持的操作,对多值域管用
		//map.put("set", "国际1");//放入支持的操作，对单值和多值域管用
		//map.put("inc", "国际1");//放入支持的操作，对数值域管用
		sd.addField("dname", map);
		server.add(sd);
		server.commit();
		System.out.println("原子更新成功！");
	}

0
顶

0
踩

分享到：

如何在eclipse中部署solr的web工程？ | Lucene4.3进阶开发之纯阳无极（十九）

2014-12-11 15:36
浏览 2538
评论(3)
分类:开源软件
查看更多

3 楼 q474818917 2015-04-29

qindongliang1922 写道

q474818917 写道

原子更新有时会出现一个问题，solrCloud存在重复ID的document
不知道您是否遇到过？

solr里面id重复会覆盖，不知道，你怎么得出的id重复了？难道不是主键么

id是主键，但是在solrcloud中有可能出现了重复的ID
第一次搜索
docs": [
      {
        "id": "23937",
        "orgType": 4
      }
]
第二次搜索
docs": [
      {
        "id": "23937",
        "name": "what"
      }
]

2 楼 qindongliang1922 2015-04-28

q474818917 写道

原子更新有时会出现一个问题，solrCloud存在重复ID的document
不知道您是否遇到过？

solr里面id重复会覆盖，不知道，你怎么得出的id重复了？难道不是主键么

1 楼 q474818917 2015-04-28

原子更新有时会出现一个问题，solrCloud存在重复ID的document
不知道您是否遇到过？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论