轻量级持久存储系统 MemcacheDB 详细介绍【转】

zhaohaolin

浏览: 1019845 次
性别:
来自: 杭州

最近访客更多访客>>

bfs198

ymitxiavj

xuming_1980

bianrongxin

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

memcached

MySQL 应用服务器 Socket 设计模式 Unix

注:memcached可能简称mc，memcachedb可能简称mcdb
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统，由新浪开源。mcdb基于mc协议，所以可以使用mc客户端直接使用，存储引擎方面使用Berkeley DB，支持主从复制模式。

二、memcachedb的应用场景
首先，我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点，当然它们肯定不只这点区别。

mc因为是非持久存储的，所以它的定位就是缓存。
而mcdb不是用来做缓存的，它是和mysql同个层次的东西。不一样的是，mcdb性能要比mysql高，而mysql检索功能比mcdb强。如果非要从缓存的角度看的话，那mc就是缓解mysql读压力，而mcdb则是缓解mysql写压力。
mcdb适合应用的场景：
1.浏览/点击/等统计，也可以局部代替mysql的count函数
2.标志，例如，JE的“我在干什么”功能
3.频繁写的地方，访客列表、评论之类的
之前，我写过的feed设计最大特点是使用mcdb来分散写压力，对sns来说动态产生太频繁了，全部写进mysql压力太大了，毕竟读/写1K和100K性能不是一样的，一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单，但是应用场合还是很丰富的，使用新产品要发散思维，充分发挥想象力～
不过重要的数据还是不建议使用，感觉还不是很放心。

三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址： http://www.monkey.org/~provos/libevent/

tar zxvf libevent- 1.4 . 9 -stable.tar.gz
cd libevent-1.4 . 9 -stable
./configure
make
make install
tar zxvf libevent-1.4.9-stable.tar.gz
cd libevent-1.4.9-stable
./configure
make
make install
2.安装Berkeley Db
下载地址：http://www.oracle.com/technology/software/products/berkeley-db/index.html

tar xvzf db-4.7.25 .tar.gz
cd db-4.7 . 25 /
cd build_unix/
../dist/configure
make
make install
tar xvzf db-4.7.25.tar.gz
cd db-4.7.25/
cd build_unix/
../dist/configure
make
make install
安装完后，编辑/etc/ld.so.conf把

usr/local/lib
/usr/local/BerkeleyDB.4.7 /lib
usr/local/lib
/usr/local/BerkeleyDB.4.7/lib
3.安装memcachedb
下载地址：http://code.google.com/p/memcachedb/downloads/list

tar xvzf memcachedb-1.2 . 0 .tar.gz
cd memcachedb-X.Y.Z
./configure --enable-threads
make
make install
tar xvzf memcachedb-1.2.0.tar.gz
cd memcachedb-X.Y.Z
./configure --enable-threads
make
make install
4.创建数据保存点

mkdir /data/ 21201 -p
chown -R willko:wheel
mkdir /data/21201 -p
chown -R willko:wheel

四、使用
1.单机模式

memcachedb -u willko -p 21201 -d -r -H /data/ 21201 / -v >/data/ 21201 .log 2 >& 1
memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1
2.主从模式

memcachedb -p 21210 -d -r -u willko -H /data/21210_m -N -R 127.0 . 0.1 : 31210 -M
主服务器，用31210 来同步数据

memcachedb -p 21211 -d -r -u willko -H /data/21211_from_local_21210 -N -R 127.0 . 0.1 : 31211 -O 127.0 . 0.1 : 31210 -S
从服务器，主从模式-R是必须设置的。
memcachedb -p 21210 -d -r -u willko -H /data/21210_m -N -R 127.0.0.1:31210 -M
主服务器，用31210来同步数据

memcachedb -p 21211 -d -r -u willko -H /data/21211_from_local_21210 -N -R 127.0.0.1:31211 -O 127.0.0.1:31210 -S
从服务器，主从模式-R是必须设置的。

测试是否同步

[root @srv willko]# telnet 127.0 . 0.1   21210
Trying 127.0 . 0.1 ...
Connected to 127.0 . 0.1 .
Escape character is '^]' .
set yy 0   0   4
yyyy
STORED
get yy
VALUE yy 0   4
yyyy
END
[root@srv willko]# telnet 127.0.0.1 21210
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
set yy 0 0 4
yyyy
STORED
get yy
VALUE yy 0 4
yyyy
END
Java代码
[root @srv willko]# telnet 127.0 . 0.1   21211
Trying 127.0 . 0.1 ...
Connected to 127.0 . 0.1 .
Escape character is '^]' .
get yy
VALUE yy 0   4
yyyy
END
[root@srv willko]# telnet 127.0.0.1 21211
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
get yy
VALUE yy 0 4
yyyy
END

3.FYI:参数说明

Java代码
memcachedb 1.2 . 0
-p <num>      TCP监听端口，默认是 21201
-U <num>      UDP监听端口，默认是 0 ，也就是关闭。
-s <file>     使用socket通讯，参数是设置unix socket的路径，此通讯方式只能本地使用
-a <mask>     unix socket文件的权限，默认是 0700
-l <ip_addr> 监听地址，默认是 INDRR_ANY
-d            以守护进程方式运行
-r            maximize core file limit
-u <username> 以<username>启动，只有root才能使用，因为memcachedb不允许以root启动
-c <num>      max simultaneous connections, default is 1024
-b <num>      item size smaller than <num> will use fast memory alloc, default is 512B
-v            打印错误和警告信息
-vv           打印整个交互过程
-h            print this help and exit
-i            print license info
-P <file>     进程PID保存路径，只能在守护进程方式下使用
-t <num>      线程数，默认是4
--------------------BerkeleyDB Options-------------------------------
-m <num>      in-memmory cache size of BerkeleyDB in megabytes, default is 64MB
-A <num>      underlying page size in bytes, default is 4096 , (512B ~ 64KB, power-of-two)
-f <file>     数据文件名, 默认是 'data.db'
-H <dir>      数据保存目录，默认是 '/data1/memcachedb'
-B <db_type> 数据结构类型,有 'btree' 和 'hash' 两种. 默认是 'btree'
-L <num>      log buffer size in kbytes, default is 32KB
-C <num>      每隔多少秒checkpoint, 设置为0 将实时写入硬盘, 默认是 5 分钟
-T <num>      do memp_trickle every <num> seconds, 0   for disable, default is 30 seconds
-e <num>      percent of the pages in the cache that should be clean, default is 60 %
-D <num>      do deadlock detecting every <num> millisecond, 0   for disable, default is 100ms
-N            设置 DB_TXN_NOSYNC 标志来改善性能，但是牺牲事务的持久性。默认为关闭
--------------------Replication Options-------------------------------
-R            主服务器提供同步数据的地址和端口，主从模式必须设置
-O            从服务器同步源地址和端口
-M/-S         以主或从服务器启动
-n            允许从服务器数量, 默认是2 台
-----------------------------------------------------------------------
memcachedb 1.2.0
-p <num>      TCP监听端口，默认是 21201
-U <num>      UDP监听端口，默认是 0，也就是关闭。
-s <file>     使用socket通讯，参数是设置unix socket的路径，此通讯方式只能本地使用
-a <mask>     unix socket文件的权限，默认是 0700
-l <ip_addr> 监听地址，默认是 INDRR_ANY
-d            以守护进程方式运行
-r            maximize core file limit
-u <username> 以<username>启动，只有root才能使用，因为memcachedb不允许以root启动
-c <num>      max simultaneous connections, default is 1024
-b <num>      item size smaller than <num> will use fast memory alloc, default is 512B
-v            打印错误和警告信息
-vv           打印整个交互过程
-h            print this help and exit
-i            print license info
-P <file>     进程PID保存路径，只能在守护进程方式下使用
-t <num>      线程数，默认是4
--------------------BerkeleyDB Options-------------------------------
-m <num>      in-memmory cache size of BerkeleyDB in megabytes, default is 64MB
-A <num>      underlying page size in bytes, default is 4096, (512B ~ 64KB, power-of-two)
-f <file>     数据文件名, 默认是 'data.db'
-H <dir>      数据保存目录，默认是 '/data1/memcachedb'
-B <db_type> 数据结构类型,有 'btree' 和 'hash'两种. 默认是 'btree'
-L <num>      log buffer size in kbytes, default is 32KB
-C <num>      每隔多少秒checkpoint, 设置为0将实时写入硬盘, 默认是5分钟
-T <num>      do memp_trickle every <num> seconds, 0 for disable, default is 30 seconds
-e <num>      percent of the pages in the cache that should be clean, default is 60%
-D <num>      do deadlock detecting every <num> millisecond, 0 for disable, default is 100ms
-N            设置 DB_TXN_NOSYNC 标志来改善性能，但是牺牲事务的持久性。默认为关闭
--------------------Replication Options-------------------------------
-R            主服务器提供同步数据的地址和端口，主从模式必须设置
-O            从服务器同步源地址和端口
-M/-S         以主或从服务器启动
-n            允许从服务器数量, 默认是2台
-----------------------------------------------------------------------
关于-C和-N选项涉及到数据完整性，会在下面会说明一下

五、备份和恢复
1.热备份
因为memcachedb是基于bdb的，所以可以用bdb自带的热备份工具备份

Java代码
[root @srv willko]# /usr/local/BerkeleyDB. 4.7 /bin/db_hotbackup -h /data/ 21201 / -b ./bak/
-h是数据的目录
-b是备份的目录
[root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_hotbackup -h /data/21201/ -b ./bak/
-h是数据的目录
-b是备份的目录
恢复的话，启动memcacedb的数据目录设置成备份目录就可以了

2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似，都是先写日志，数据先保存在内存。所以crash以后，可以通过日志来恢复。启动memcachedb的时候，可以使用-C选项来设置checkpoint的间隔时间，如果设置得太长，恢复时间越长。

/usr/local/BerkeleyDB. 4.7 /bin/db_recover -cf -h /data/ 21201 /
-h是你的数据目录
/usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/
-h是你的数据目录
模拟crash

[root @srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/ 21201 / -v >/data/ 21201 .log 2 >& 1   -P /data/ 21201 / 21201 .pid
[root@srv willko]# telnet localhost 21201
Trying 127.0 . 0.1 ...
Connected to localhost.
Escape character is '^]' .
set t 0   0   4
hhhh       #设置键为t，值为hhhh的
STORED
get t
VALUE t 0   4
hhhh
END
quit
Connection closed by foreign host.
[root@srv willko]# kill - 9 `cat /data/ 21201 / 21201 .pid ` #用- 9 来模拟crash
[root@srv willko]# /usr/local/BerkeleyDB. 4.7 /bin/db_recover -cf -h /data/ 21201 /
recovery 100 % complete
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/ 21201 / -v >/data/ 21201 .log 2 >& 1   -P /data/ 21201 / 21201 .pid
[root@srv willko]# telnet localhost 21201
Trying 127.0 . 0.1 ...
Connected to localhost.
Escape character is '^]' .
get t
VALUE t 0   4
hhhh #还可以获得crash前设置的值
END
quit
Connection closed by foreign host.
[root@srv willko]#
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1 -P /data/21201/21201.pid
[root@srv willko]# telnet localhost 21201
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
set t 0 0 4
hhhh       #设置键为t，值为hhhh的
STORED
get t
VALUE t 0 4
hhhh
END
quit
Connection closed by foreign host.
[root@srv willko]# kill -9 `cat /data/21201/21201.pid ` #用-9来模拟crash
[root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/
recovery 100% complete
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1 -P /data/21201/21201.pid
[root@srv willko]# telnet localhost 21201
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
get t
VALUE t 0 4
hhhh #还可以获得crash前设置的值
END
quit
Connection closed by foreign host.
[root@srv willko]#

3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能，如果不是用-N，日志是实时写到硬盘，这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的，也就是日志不实时写硬盘，那crash以后无法保证完全恢复，没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式，那就无需担心，因为当事务提交以后，会马上同步到slave。
也就是说使用-N选项后，crash后通过slave来恢复。

六、一点抱怨
目前，持久存储系统产品非常的多，我觉得未来的持久存储肯定不只提供hash table存储，还应该把加入list、tree等的支持。这些都可以扩大持久存储系统的应用场景，未来持久存储系统成熟的时候，将会大规模代替RMDB。
最近，有个亮点产品出现，叫redis，目前还只是beta。

参考资料：
http://memcachedb.org/
http://memcachedb.org/memcachedb-guide-1.0.pdf

分享到：

linux安装memcachedb服务【转】 | 持久存储系统MemcacheDB的安装，配置 - [DB ...

2011-04-25 11:49
浏览 940
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论