[MongoDB学习笔记三]MongoDB分片

bit1129

浏览: 1077332 次
性别:
来自: 北京

最近访客更多访客>>

xiaoyaohen24

yuxin8000

abc951654

zhongqi2513

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

MongoDB

MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。

本篇介绍MongoDB的切片(Sharding)

1.何时需要分片

1)数据量非常大，单个磁盘无法完成存储，例如SNS数据等

2)单台服务器不能满足高并发写操作的性能要求(副本集仅仅允许有一台服务器)

3)MongoDB是内存数据库和文件数据库，如果要尽可能的提升读写操作，最好是把尽可能多的数据存放到内存，这就要求内存足够大，为了获取尽可能多的内存，就使用尽可能多的物理服务器

2.创建分片的步骤

1)创建配置服务器

2)创建路由服务器,创建时需要指定链接的配置服务器，也就是路由器需要链接到配置服务器上

3)创建2个或者多个分片服务器(运行Mongo实例),这里使用两台服务器27010和27011

4)针对路由服务器，执行命令将多个集群添加分片(27010,27011)

db.runCommand({"addshard":"127.0.0.1:27010","allowLocal":true});
db.runCommand({"addshard":"127.0.0.1:27011","allowLocal":true});

3.创建分片

3.1创建配置服务器

dbpath=/home/tom/development/mongoshard/configServer
port=28000
bind_ip=127.0.0.1

启动配置服务器：mongod --config configServer.conf

3.2 创建路由服务器

port=28001
configdb=127.0.0.1:28000

启动路由服务器：mongos --config router.conf

3.3 配置两台分片服务器

dbpath=/home/tom/development/mongoshard/shard1
bind_ip=127.0.0.1
port=27010

dbpath=/home/tom/development/mongoshard/shard2
bind_ip=127.0.0.1
port=27011

3.4 关联分片服务器和路由服务器

1) 启动配置服务器，路由服务器和两台切片服务器

2) 打开链接到路由服务器的Javascript Shell命令行终端 mongo 127.0.0.1:28001/admin

3) 在命令行终端执行命令，将两台服务器加入到集群中

db.runCommand({"addshard":"127.0.0.1:27010","allowLocal":true});
db.runCommand({"addshard":"127.0.0.1:27011","allowLocal":true});

成功则显示结果：{ "shardAdded" : "shard0000", "ok" : 1 }和{ "shardAdded" : "shard0001", "ok" : 1 }

在执行db.runCommand之前，不能做任何的数据库操作语句，例如use admin等。

4) 打开数据库foolbar的分片功能(此时分片服务器上还没有创建foolbar数据库，待会儿创建)

db.runCommand({"enablesharding":"foolbar"});

5) 打开数据库集合的分片功能（使用mongoDB默认的分别算法，按照key进行分片）

db.runCommand({"shardcollection":"foolbar.persons","key":{"_id":1}});

6) 完成上面的步骤，则分片集群建立完成

4. 分片测试

4.1 在针对路由服务器的Javascript Shell客户端，切换到foolbar数据库 use foolbar

4.2 定义如下的Javascript方法，循环加入10000条文档-(首先在命令行中执行下面的语句以创建add()函数，然后执行add()函数以完成数据的插入)

function add() {
    for (var i = 0; i< 10000; i++) {
        db.persons.insert({"name:":"tom"+i, "age": i});
    }
}

4.3 完成数据插入后，调用db.persons.find().count()察看插入的数据条数，结果显示10000条

4.4 察看每个分片服务器上每个persons文档的个数

4.4.1 10000条文档的测试结果

链接到shard1: mongo 127.0.0.1:27010/admin

use foolbar

db.persons.find().count()

>>>10000

链接到shard2: mongo 127.0.0.1:27011/admin

use foolbar

db.persons.find().count()

>>>0

结果显示，所有的数据都存在于第一个分片上，这是不能接受的，只有加大数据量了！

4.4.2 1000000条文档的测试结果

链接到路由服务器:mongo 127.0.0.1:28001/admin

执行如下命令：

function add() {
    for (var i = 0; i< 1000000; i++) {
        db.persons.insert({"name:":"tom"+i, "age": i});
    }
}

第一台和第二台的数据分布情况

tom$ mongo 127.0.0.1:27010/admin
MongoDB shell version: 2.4.10
connecting to: 127.0.0.1:27010/admin
> use foolbar
switched to db foolbar
> db.persons.find().count();
640957
> exit

tom$ mongo 127.0.0.1:27011/admin
MongoDB shell version: 2.4.10
connecting to: 127.0.0.1:27011/admin
> use foolbar
switched to db foolbar
> db.persons.find().count();
369043
> exit

5.察看分片情况

tom$ mongo 127.0.0.1:28001/admin
MongoDB shell version: 2.4.10
connecting to: 127.0.0.1:28001/admin
mongos> db.printShardingStatus();
--- Sharding Status --- 
  sharding version: {
	"_id" : 1,
	"version" : 3,
	"minCompatibleVersion" : 3,
	"currentVersion" : 4,
	"clusterId" : ObjectId("53e23314e0892adc5cc089bc")
}
  shards:
	{  "_id" : "shard0000",  "host" : "127.0.0.1:27010" }
	{  "_id" : "shard0001",  "host" : "127.0.0.1:27011" }
  databases:
	{  "_id" : "admin",  "partitioned" : false,  "primary" : "config" }
	{  "_id" : "foolbar",  "partitioned" : true,  "primary" : "shard0000" }
		foolbar.persons
			shard key: { "_id" : 1 }
			chunks:
				shard0000	3
				shard0001	3
			{ "_id" : { "$minKey" : 1 } } -->> { "_id" : ObjectId("53e24069e92ed4a015b75957") } on : shard0000 Timestamp(5, 0) 
			{ "_id" : ObjectId("53e24069e92ed4a015b75957") } -->> { "_id" : ObjectId("53e2446d1db30c2efea0b7d0") } on : shard0001 Timestamp(5, 1) 
			{ "_id" : ObjectId("53e2446d1db30c2efea0b7d0") } -->> { "_id" : ObjectId("53e244861db30c2efea5af7c") } on : shard0000 Timestamp(4, 1) 
			{ "_id" : ObjectId("53e244861db30c2efea5af7c") } -->> { "_id" : ObjectId("53e2449d1db30c2efeaa7f8d") } on : shard0000 Timestamp(3, 2) 
			{ "_id" : ObjectId("53e2449d1db30c2efeaa7f8d") } -->> { "_id" : ObjectId("53e244b51db30c2efeaf683b") } on : shard0001 Timestamp(4, 2) 
			{ "_id" : ObjectId("53e244b51db30c2efeaf683b") } -->> { "_id" : { "$maxKey" : 1 } } on : shard0001 Timestamp(4, 3)

分享到：

[Gson一]非泛型POJO对象的反序列化 | [MongoDB学习笔记二]MongoDB副本集

2014-08-06 23:51
浏览 799
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论