`

【转】Mongodb Replica Sets 副本集架构实战(架设、扩充、容灾、修复、客户端代码连入)

 
阅读更多

mongodb单机可靠性比较低,我们投入生产环境往往需要多台服务器的容灾和负载均衡,mongodb推荐使用Replica Sets来进行小的容灾和负载解决方案。我相信很多中小型互联网公司3-4台mongodb服务器的配置无论从抗压和稳定角度来说都已经足够了,至少数据量在千万级以下都不需要考虑sharding分片和cluster集群。
我们公司最近将mongodb投入生产,本文将对架设,模拟灾难(包括断电,断网,数据损坏),修复和客户端(node.js)连接mongodb副本集做一个比较详细的分享,如有错误,欢迎指出,板砖轻拍啊。
[参考资料]
参考:mongodb 官方API 
http://www.mongodb.org/display/DOCS/Replica+Sets
参考:Kristina Chodorow's 博客(mongodb开发程序员的博客)http://www.snailinaturtleneck.com/blog/2012/05/07/replica-set-internals-bootcamp-part-iv-syncing/

参考:
Kristina 写的3本mongodb书籍 《MongoDB 权威指南》、《Scaling MongoDB》和《50 Tips and Tricks for MongoDB Developers》
参考:noSqlFan上的相关文章 
http://blog.nosqlfan.com/tags/MongoDB


1、架设

我们首先需要3台mongodb服务器,(除去仲裁服务器,最好是4台,之后会说明,这里我是用了mongodb v2.0版本),作为最基本的mongodb副本集搭建基础,还要保证这3台服务器网络互通。
a\启动
首先我们分别启动3台mongodb,命令如下:
四台mongodb服务器的ip分别为:10.1.10.31,  10.1.10.28,  10.1.10.30, 10.1.49.225(仲裁服务器)
mongod --replSet wzh --rest --dbpath /usr/local/wzhdb/ --journal --port 10001
简单说明一下:
--replSet wzh:表示副本集的名字为“wzh”,这里的名字可以任意取;
--rest:是打开web监控页面,比如我们这里监听10001端口,则打开http://10.1.49.225:11001/就可以看到这个mongodb数据库进程的信息
--journal:打开日志,我们这里模拟生产环境,所以建议将日志打开,以防不测。日志将会记录在/usr/local/wzhdb/journal/下,也就是你的数据库目录下(仲裁服务器不存储数据,不用打开此选项)
另外:这里没有使用后台运行,为了便于查看连接,我尽量模拟生产环境。


b\初始化
我们现在暂时将10.1.10.28作为master,于是我们用mongo命令登录10.1.10.28,来初始化副本集。
有3种方式可以初始化一个副本集:
1、db.runCommand( { replSetInitiate : <config_object> } )
2、rs.initiate(<config_object>)
3、rs.initiate()//先初始化,再通过rs.add等方法修改
这里的config_object会记录在local.system.replset这个集合内,这个集合会自动的在副本集成员之间广播,而且我们不能直接修改他们,需要使用命令来改变它,例如(replSetInitiate 命令)。
我们来看下config_object可以包括那些东西,下面是一个config对象的例子:

{
  _id :<setname>,
  members:[
    {
      _id :<ordinal>,
      host :<hostname[:port]>
      [, arbiterOnly :true]
      [, buildIndexes :<bool>]
      [, hidden :true]
      [, priority:<priority>]
      [, tags:{loc1 : desc1, loc2 : desc2,..., locN : descN}]
      [, slaveDelay :<n>]
      [, votes :<n>]
    }
    ,...
  ],
  [settings:{
    [getLastErrorDefaults:<lasterrdefaults>]
    [, getLastErrorModes :<modes>]
  }]
}

详细说明:(默认值在括号中)
_id:副本集的名字,必须和命令行的名字匹配,也就是您刚才启动mongodb数据库命令行的那个名字,数字字母,不能包含"/";
members:一个数组用来表示副本集中的每个成员,这个数组必须包含_id和host这2个key。

members 数组:
_id:在副本集中的每一个成员都必须有一个_id表示,这个_id是通常是数字,从0开始增长。需要注意的是当其中一个成员退休了(指从副本集config中移除了),新加入的成员不能重新使用这个退休成员的_id;
host:ip地址和端口号;
arbiterOnly(false)如果是true,则表示这个成员为仲裁节点,不接收数据;
buildIndexes(true)如果设置为false,则会阻止在这个节点上创建第二索引,通常这个节点是作为纯粹的数据备份,从不用来被查询。不过也因为此节点没有第二索引,所以他写入的东西很少,也就需要很少的内存和磁盘。_id的索引还是会被创建的。只有当priority属性设置为0时,此项才能设置为false,一般不会用到这个选项;
hidden(false):如果此项为true,不要告诉客户端的此节点的存在,设置隐藏节点的原因是此节点的数据的使用模式和其他节点大为不同,比如:报表,统计,备份等。设置为ture时,允许你针对这个节点发送非主要查询。
priority(1.0):权重,更高的权重会被选举为主节点
tags({}):一个文档代表这台服务器的位置,有利于位置感知的读写。其实就是表示此节点位于哪个数据中心的,mongodb会根据tags找近的数据中心节点同步数据。
slaveDelay(0):同步数据的延迟,设置为0表示立即更新同步数据。
votes(1):此节点可以发出的投票数,一般不用修改他

settings 对象:settings对象可以在集群建立起来以后用再进行设置,通常使用默认值

接下来我们来介绍下rs命令:在命令行我们输入
rs.help()

rs.status()                     { replSetGetStatus : 1 } checks repl set status
rs.initiate()                   { replSetInitiate : null } initiates set with default settings
rs.initiate(cfg)                { replSetInitiate : cfg } initiates set with configuration cfg
rs.conf()                       get the current configuration object from local.system.replset
rs.reconfig(cfg)                updates the configuration of a running replica set with cfg (disconnects)
rs.add(hostportstr)             add a new member to the set with default attributes (disconnects)
rs.add(membercfgobj)            add a new member to the set with extra attributes (disconnects)
rs.addArb(hostportstr)          add a new member which is arbiterOnly:true (disconnects)
rs.stepDown([secs])             step down as primary (momentarily) (disconnects)
rs.freeze(secs)                 make a node ineligible to become primary for the time specified
rs.remove(hostportstr)          remove a host from the replica set (disconnects)
rs.slaveOk()                    shorthand for db.getMongo().setSlaveOk()

db.isMaster()                   check who is primary

命令就不翻译 了,我们现在建立一份配置文件,然后启动它,启动我们的mongodb副本集:

vavar conf ={
_id :"wzh",
members:[
{
_id :0,
host :"10.1.10.28:10001"
},
{
_id :1,
host :"10.1.10.30:10001"
},
{
_id :2,
host :"10.1.10.31:10001"
},
{
_id :3,
host :"10.1.49.225:10001",
arbiterOnly:true
}
]
};rs.initiate(conf);

执行后出现:

{
"info":"Config now saved locally. Should come online in about a minute.",
"ok":1
}

等1分钟整个副本集就正常启动起来了。
我们打开后台的副本集控制台看下:

28是主,30和31是从,而我的虚拟机225则作为仲裁服务器在这个副本集中。

2、测试副本集同步
我们的副本集已经正常启动起来了,我们来测试一下副本集启动的情况吧,我们直接连上28,发现命令控制行的前缀变成 了:
PRIMARY>

var tags =["abc","bcd","efg","fgh","ooo","jjj","kkk","lll","mmm"];

for(var i=0;i<100000;i++){
db.test.insert({"name":"groupa","tags":tags})
}

这里我们往test集合里插入了10W条数据,为什么要带tags的key呢,我是为了另外一个篇文章所用的,利用mongodb做分词检索
PRIMARY> db.test.find();  //0.25GB的数据
PRIMARY> db.test.count() //100000
主服务器的10W条记录已经成功插入了,我们看下另外2台secondary的节点
分别连上30和31服务器
运行
SECONDARY> db.getMongo().setSlaveOk();
SECONDARY> db.test.count()//100000
发现数据已经完全同步过来了

3、删除和增加
如果相对副本集进行扩容,想加入一台mongodb服务器进入副本集,我们首先需要启动这个节点,最好是将数据事先拷贝一份启动,不然一个新的空的数据库进来同步可能会复制过多的数据而导致应用奔溃。
我们登录28服务器,先将30服务器去掉。

PRIMARY> rs.remove("10.1.10.30:10001");


Mongodb Replica Sets 副本集实战(架设、扩充、容灾、修复、客户端代码连入) - snoopyxdy - snoopyxdy的博客

 
观察副本集的状态,发现只剩下3台了,于是我们再往28服务器插入1000条数据

var tags =["nn","nn","vv","yy","ii","kk","gg","ee","aa"];

for(var i=0;i<1000;i++){
db.test.insert({"name":"groupa","tags":tags})
}

1000条数据是瞬间插入完成的。这样28和剩下的31服务器上就有了10W1000条数据了。
接下来我们把30服务器加回去,登录28服务器:

PRIMARY> rs.add({_id:4,host:"10.1.10.30:10001"});
{"ok":1}

将30服务器加回去,启动30上的mongodb;我们看下新加的1000条数据有没有同步过去了。登录30服务器

SECONDARY> SECONDARY> db.getMongo().setSlaveOk();
SECONDARY> db.test.count();
101000

就是这么简单,新加入的节点已经可以同步数据和正常工作了。


2、容灾

1、单个节点意外崩溃
现在副本集中28是主,30和31是从,所以我手动将28的mongodb进程kill掉,看看整个集群是否还可以正常运作。
大约几秒钟,mongodb仲裁服务器选举出了一位新主人:

Mongodb Replica Sets 副本集实战(架设、扩充、容灾、修复、客户端代码连入) - snoopyxdy - snoopyxdy的博客

 然后我们往新的主节点30插入1000条数据。

PRIMARY>
PRIMARY>var tags =["nn","nn","vv","yy","ii","kk","gg","ee","aa"];for(var i=0;i<1000;i++){
... db.test.insert({"name":"groupa","tags":tags})
...}
PRIMARY>
PRIMARY> db.test.count()
102000

现在我们一共10W2000条数据了,很快模拟故障修复了,我们正常启动28节点了,很明显30节点当老大很爽,不愿意将老大的位置再让回给28了:

Mongodb Replica Sets 副本集实战(架设、扩充、容灾、修复、客户端代码连入) - snoopyxdy - snoopyxdy的博客

 经过查询,发现28节点的数据也已经是10W2千条了,在28down的过程中,新增加的1000条数据已经同步过去拉。

2、同时意外崩溃2个节点
我们现在同时将副本集内的2个节点kill掉,模拟一个比较大的灾难。

Mongodb Replica Sets 副本集实战(架设、扩充、容灾、修复、客户端代码连入) - snoopyxdy - snoopyxdy的博客

 
上图可以看到只剩下31一台节点苦苦支撑了,另外2个兄弟已经down了,这时副本集中可用的数据节点只有1个了,仲裁服务器无数据的,所以自动降级为secondary,这时整个集群只可读,不可写。我们尝试往31数据库插入一些数据.

SECONDARY>var tags =["nn","nn","vv","yy","ii","kk","gg","ee","aa"];for(var i=0;i<1000;i++){
... db.test.insert({"name":"groupa","tags":tags})
...}
not master

曝出了不是master的错误,之前在secondary上也是无法进行写操作的。之后修复问题或者网络,重新启动28和31的进程,就又能回复正常了。

3、衰到家了,其中一台硬盘数据损坏
我们现在模拟硬盘数据丢失的情况,比如我们的应用已经跑了一段时间了,突然30节点down机了,发现硬盘数据损坏了,我们的mongodb数据也全部丢失了,幸好我们当时建立了集群有其他兄弟备份着。
我们对30节点换了一块新硬盘,装好了系统以后准备加入这个集群,但是,且慢!
我们可以让集群中的一台服务器比如31,先脱离集群,然后将数据文件拷贝到30上,然后将30和31再加入集群,这样就不至于数据相差太大,同步过久导致整个应用缓慢或者崩溃。
这里就需要我们对副本集设置4台机器了,1台崩溃了,1台去修复了,还有2台正好1主1从抗住应用。所以如果只有3台的话,当副本集只剩下1台节点会进入secondary,就无法写入操作了,无法正常运行应用了。
总结一下具体步骤:
1、将副本集中的某一台机器A脱离副本集
2、将这台A机器的数据库文件夹copy到新安装的B机器上,或者启动mongodb副本集让这2台机器慢慢的同步,这样脱离应用的副本集同步不会拖慢整个副本集
3、同步完成以后分别将A和B机器加入到原来的副本集中即可。



3、客户端代码连入mongodb副本集
mongodb副本集主要是为了容灾备份和负载均衡用的。我们一般的互联网应用大多是读多写少,所以mongodb副本集只有一个主,而有多个从。那我们的客户端代码如何正确的连入mongodb副本集呢?下面我就以node.js利用rrestjs框架 和 node-mongodb-native 模块进行mongodb副本集的操作。
rrestjs框架官网:http://www.rrestjs.com/
官方帮助文档地址:https://github.com/christkv/node-mongodb-native/blob/master/docs/replicaset.md

只需要将rrestjs的配置文件按如下配置即可:
MongodbRC:'wzh',//如果是false表示不使用mongodb的副本集,否则为字符串,表示副本集的名称
MongodbRChost:['10.1.10.28:10001','10.1.10.30:10001','10.1.10.31:10001'],//表示mongodb副本集的ip:port数组。

然后正常使用您的应用,插入查询等操作,rrestjs自动会帮你连入mongodb副本集了

Mongodb Replica Sets 副本集架构实战(架设、扩充、容灾、修复、客户端代码连入) - snoopyxdy - snoopyxdy的博客
成功的插入了mongodb副本集数据并返回了刚才插入的内容。
 
 
分享到:
评论

相关推荐

    Mongodb的ReplicaSets+Sharding架构(window篇)

    MongoDB的Replica Sets+Sharding架构是大数据时代下应对高可用性和可扩展性需求的重要解决方案。本篇文章将深入探讨这两个关键特性在Windows环境下的应用。 **副本集(Replica Sets)** MongoDB的副本集是一种高可用...

    mongodb Replica Sets +Sharding高可用集群搭建

    在大型分布式系统中,为了实现高可用性和水平扩展,MongoDB提供了两种关键特性:副本集(Replica Sets)和分片(Sharding)。这篇博客将探讨如何搭建MongoDB的副本集和分片集群。 首先,我们来理解一下MongoDB的...

    k8s 安装 mongodb 分片(Sharding)+ 副本集(Replica Set)

    k8s 安装 MongoDB 分片(Sharding)+ 副本集(Replica Set) k8s 安装 MongoDB 分片(Sharding)+ 副本集(Replica Set)是结合 Kubernetes(k8s)和 MongoDB 实现高可用性和高性能的解决方案。本解决方案通过使用 ...

    K8s 部署 MongoDB(副本集)

    MongoDB中的副本集(Replica Set)是一组维护相同数据集的mongod服务。 副本集可提供冗余和高可用性,是所有生产部署的基础。也可以说,副本集类似于有自动故障恢复功能的主从集群。通俗的讲就是用多台机器进行同一...

    mongodb设置副本集

    在生产环境中,为了确保数据的高可用性和容错性,通常会使用副本集(Replica Set)来部署MongoDB。副本集是MongoDB提供的一种数据复制机制,它能够保持多个数据副本的一致性,并在主节点故障时自动切换到备份节点,...

    mongodb replica set(副本集)设置步骤

    MongoDB的副本集(Replica Set)是一种高可用性解决方案,它通过在多个节点之间复制数据来确保数据的冗余和容错性。在MongoDB中,副本集由一组 MongoDB实例组成,包括一个主节点(Primary)和多个从节点...

    MongoDB4.2分片及副本集群搭建

    MongoDB4.2分片及副本集群搭建 MongoDB集群 MongoDB分片 MongoDB副本 MongoDB副本集群

    Mongodb分片副本集集群搭建

    MongoDB分片副本集集群搭建的知识点包含了以下几个方面: 1. MongoDB分片架构的基本组成:MongoDB分片架构由mongos(路由服务器)、config-server(配置服务器)和shard(分片服务器)三部分组成。mongos负责作为...

    mongodb副本集搭建

    MongoDB 副本集搭建 MongoDB 副本集搭建是 MongoDB 的高可用性解决方案之一,它可以提供数据的冗余存储和自动故障转移,确保数据的高可用性和可靠性。下面将详细介绍 MongoDB 副本集搭建的步骤和过程。 一、安装...

    MongoDB副本集配置和数据迁移实战

    MongoDB 的副本集(Replica Set)就是有自动故障恢复功能的 MongoDB 主从集群。由于 MongoDB 的主从复制功能不支持高可用,所以从 3.2 版本开始已经被废弃了,转而用副本集来代替实现数据复制的功能。一个副本集总会...

    mongodb帮助文档副本集部分中文翻译PDF

    本文档是对MongoDB官方帮助文档中关于副本集部分的中文翻译和整理,提供了关于副本集成员、操作、数据同步、部署架构、高可用性、主从复制、读写操作以及常用操作等知识点的详细说明。 1. 副本集成员主要包含主节点...

    MongoDB搭建副本集教程

    MongoDB 副本集搭建教程 MongoDB 副本集是 MongoDB 中的一种高可用性解决方案,它可以提供高性能、可扩展性和高可用性。通过搭建副本集,用户可以确保数据的安全和高可用性。 一、 MongoDB 副本集环境搭建攻略 1....

    MongoDB 主从复制,副本集分布式存储

    ### MongoDB 主从复制,副本集分布式存储 #### 一、MongoDB 主从复制与副本集的概念 MongoDB 是一种非常流行的非关系型数据库系统,它采用面向文档的数据模型,能够高效地处理大量的非结构化数据。为了提高系统的...

    mongodb 副本集php文件样例,php连接mongodb

    mongodb 副本集php文件样例,php连接mongodb

    mongodb分片与副本集详细配置方案

    MongoDB 是一个高性能、分布式、开源的文档型数据库,它支持分片(sharding)和副本集(replica sets)来实现水平扩展和高可用性。分片是将数据分散到多个物理节点上,以处理大数据量和高并发场景;副本集则是为了...

    mongodb+replica+sets+intro

    ### MongoDB副本集(Replica Sets)入门:配置与管理 #### MongoDB副本集概念与优势 MongoDB副本集是一种数据冗余和高可用性方案,它通过在多个服务器上复制数据库来提供故障转移、负载均衡以及数据恢复能力。副本...

    MongoDB分片副本级

    MongoDB分片副本级 详细的讲述了MongoDB分片副本级配置

Global site tag (gtag.js) - Google Analytics