论坛首页 → 综合技术论坛 →

MongoDB官方文档翻译系列之--- 分片集群下的查询路由

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 3613 次

锁定老帖子主题：MongoDB官方文档翻译系列之--- 分片集群下的查询路由

精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)

作者

正文

shingo7
等级:
性别:
文章: 59
积分: 170
来自: 北京

发表时间：2015-01-19

相关推荐:

更多相关推荐

数据库 MongoDB Redis NoSQL

更多关于MongoDB的技术分享请关注我的公众号：mongodb_side

github版本 - 7a02f29211e96977765f2461253d3fa99b6a3def

根据2015-01-14官方文档快照翻译（v2.6.7 & v2.8.0-rc4）

翻译 shingo（6623662005@163.com）

在分片集群环境中，MongoDB通过 mongos实例来路由读写操作。从应用的角度来说，mongos 是访问集群的唯一入口，应用程序不能直接连接集群环境中的分片节点。

通过缓存config节点的元数据信息， mongos 可以跟踪到数据在哪个分片上。mongos利用这些元数据信息将应用和客户端的操作路由到具体的mongod实例。mongos 不提供持久化，并且只消耗很少的系统资源。

最常见的做法是将mongos 实例和应用服务器部署在同一环境下，当然你也可以将mongos 实例和分片节点放在一起，或者用专门的资源来运行它。

注意

2.1版更新。

一些使用aggregate 命令的聚合操作(即db.collection.aggregate()) ，会使得mongos 实例较之前的版本需要更多CPU资源。如果你的分片环境中大量使用了aggregation框架，那么你可能要更改部署架构来应对这部分性能上的调整。

路由过程

mongos如何决定由哪些分片来接收一个查询

mongos 路由一个查询到集群中有两步：

确定接收查询的分片列表。
为所有目标分片建立一个游标。

在一些情况下，例如当 shard key 或shard key的某个前辍部分被当做查询条件的一部分时， mongos 会将查询路由到分片集的某个子集下，其它时候，mongos 将查询引向所有包含目标表数据的分片下。

(译者注：这里所说的shard key的某个前辍部分是指如果shard key是复合key，那么从第一个字段开始按序往后的子集，这个子集对查询时尽可能精确的定位分片有很大帮助，子集越大定位越准。)

示例：

有下面的shard key：

{ zipcode: 1, u_id: 1, c_date: 1 }

根据集群中具体的chunk分布情况，mongos 可能会将查询路由到一部分分片上，如果查询包括以下字段：

{ zipcode: 1 }

{ zipcode: 1, u_id: 1 }

{ zipcode: 1, u_id: 1, c_date: 1 }

Mongos如何处理查询修改器

如果查询结果不需要排序，mongos会开启一个结果游标，从各个目标分片的游标“轮循”结果。

2.0.5版更新：在2.0.5之前的版本中， mongos 一个接一个将游标从头滑到尾。

（译者注：2.0.5版之前mongos会循环所有目标分片返回的数据集，每一个数据库通过游标从头至尾；从2.0.5开始，mongos开启一个总的游标，每个数据集拿一条数据，循环往复。）

如果查询操作用sort()方法指定了排序规则， mongos将$orderby选项传递给各个目标分片。在通过mongos将结果集返回客户端之前，数据库的主shard会接收所有结果数据，确定后执行合并排序。

如果查询操作用limit()限制结果集的大小， mongos将这个限制传递给各个目标分片，在返回客户端之前再将整个结果集缩减到指定大小。

（译者注：如果数据够大，假设有n个目标分片，limit的参数为x，mongodb会至少扫描n*x条数据。不过在现实的场景中，limit的需求一般为分页，或是专门被指定的一个有限集，这个数在多数情况下不会太大。）

如果查询操作用 skip()方法指定要忽略的结果个数，mongos 不会将这个忽略数传递给目标分片，而是从各分片检索出符合查询条件的所有结果，在组装最终结果集时再忽略指定数目的数据。但是如果它和limit()方法联合使用， mongos将 limit 的值加上skip() 方法的值传递给目标分片，以此来提升这些操作的效率。

（译者注：limit+skip = 每个分片上最终limit值，这也是为了规避查询条件的不同，以及多种因为数据分布引发的结果数据不准确的可能性。 Mongodb的翻页查询随着skip数量的增加性能会越来越差，其实有很多办法可以规避这种查询，比如在主键，或者例用某个字段来精确定位某一页的值范围。）

检测连向mongos的连接

要检测你客户端连接的mongodb实例是否是mongos，可以使用isMaster 命令。当客户端连上 mongos，isMaster 返回一个带有msg 字段的文档，且字段值为isdbgrid，类似下面这样：

{

"ismaster" : true,

"msg" : "isdbgrid",

"maxBsonObjectSize" : 16777216,

"ok" : 1

}

如果连接的是mongod实例，返回的文档不会包含isdbgrid 字符串。

广播操作和目标操作

一般来说，分片环境里的操作有以下两类：