`
zhaohaolin
  • 浏览: 1016681 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

轻量级持久存储系统 MemcacheDB (转载)

阅读更多

注:memcached可能简称mc,memcachedb可能简称mcdb
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统,由新浪开源。mcdb基于mc协议,所以可以使用mc客户端直接使用,存储引擎方面使用Berkeley DB,支持主从复制模式。

二、memcachedb的应用场景
首先,我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。

mc因为是非持久存储的,所以它的定位就是缓存。
而mcdb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,mcdb性能要比mysql高,而mysql检索功能比mcdb强。如果非要从缓存的角度看的话,那mc就是缓解mysql读压力,而mcdb则是缓解mysql写压力。
mcdb适合应用的场景:
1.浏览/点击/等统计,也可以局部代替mysql的count函数
2.标志,例如,JE的“我在干什么”功能
3.频繁写的地方,访客列表、评论之类的
之前,我写过的feed设计最大特点是使用mcdb来分散写压力,对sns来说动态产生太频繁了,全部写进mysql压力太大了,毕竟读/写1K和100K性能不是一样的,一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单,但是应用场合还是很丰富的,使用新产品要发散思维,充分发挥想象力~
不过重要的数据还是不建议使用,感觉还不是很放心。

三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址: http://www.monkey.org/~provos/libevent/

Java代码 复制代码
  1. tar zxvf libevent- 1.4 . 9 -stable.tar.gz    
  2. cd libevent- 1.4 . 9 -stable    
  3. ./configure    
  4. make    
  5. make install  

2.安装Berkeley Db
下载地址:http://www.oracle.com/technology/software/products/berkeley-db/index.html
Java代码 复制代码
  1. tar xvzf db- 4.7 . 25 .tar.gz   
  2. cd db- 4.7 . 25 /   
  3. cd build_unix/   
  4. ../dist/configure   
  5. make   
  6. make install  

安装完后,编辑/etc/ld.so.conf把
Java代码 复制代码
  1. usr/local/lib   
  2. /usr/local/BerkeleyDB. 4.7 /lib  

3.安装memcachedb
下载地址:http://code.google.com/p/memcachedb/downloads/list
Java代码 复制代码
  1. tar xvzf memcachedb- 1.2 . 0 .tar.gz   
  2. cd memcachedb-X.Y.Z   
  3. ./configure --enable-threads   
  4. make   
  5. make install  

4.创建数据保存点
Java代码 复制代码
  1. mkdir /data/ 21201  -p   
  2. chown -R willko:wheel  


四、使用
1.单机模式
Java代码 复制代码
  1. memcachedb -u willko -p  21201  -d -r -H /data/ 21201 / -v >/data/ 21201 .log  2 >& 1   

2.主从模式
Java代码 复制代码
  1. memcachedb -p  21210  -d -r -u willko -H /data/21210_m -N -R  127.0 . 0.1 : 31210  -M    
  2. 主服务器,用 31210 来同步数据   
  3.   
  4. memcachedb -p  21211  -d -r -u willko -H /data/21211_from_local_21210 -N -R  127.0 . 0.1 : 31211  -O  127.0 . 0.1 : 31210  -S   
  5. 从服务器,主从模式-R是必须设置的。  

测试是否同步
Java代码 复制代码
  1. [root @srv  willko]# telnet  127.0 . 0.1   21210   
  2. Trying  127.0 . 0.1 ...   
  3. Connected to  127.0 . 0.1 .   
  4. Escape character is  '^]' .   
  5. set yy  0   0   4   
  6. yyyy   
  7. STORED   
  8. get yy   
  9. VALUE yy  0   4   
  10. yyyy   
  11. END  

Java代码 复制代码
  1. [root @srv  willko]# telnet  127.0 . 0.1   21211   
  2. Trying  127.0 . 0.1 ...   
  3. Connected to  127.0 . 0.1 .   
  4. Escape character is  '^]' .   
  5. get yy   
  6. VALUE yy  0   4   
  7. yyyy   
  8. END  

3.FYI:参数说明
Java代码 复制代码
  1. memcachedb  1.2 . 0   
  2. -p <num>      TCP监听端口,默认是  21201   
  3. -U <num>      UDP监听端口,默认是  0 ,也就是关闭。   
  4. -s <file>     使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用   
  5. -a <mask>     unix socket文件的权限,默认是  0700   
  6. -l <ip_addr>  监听地址,默认是 INDRR_ANY   
  7. -d            以守护进程方式运行   
  8. -r            maximize core file limit   
  9. -u <username> 以<username>启动,只有root才能使用,因为memcachedb不允许以root启动   
  10. -c <num>      max simultaneous connections,  default  is  1024   
  11. -b <num>      item size smaller than <num> will use fast memory alloc,  default  is 512B   
  12. -v            打印错误和警告信息   
  13. -vv           打印整个交互过程   
  14. -h            print  this  help and exit   
  15. -i            print license info   
  16. -P <file>     进程PID保存路径,只能在守护进程方式下使用   
  17. -t <num>      线程数,默认是 4   
  18. --------------------BerkeleyDB Options-------------------------------   
  19. -m <num>      in-memmory cache size of BerkeleyDB in megabytes,  default  is 64MB   
  20. -A <num>      underlying page size in bytes,  default  is  4096 , (512B ~ 64KB, power-of-two)   
  21. -f <file>     数据文件名, 默认是  'data.db'   
  22. -H <dir>      数据保存目录,默认是  '/data1/memcachedb'   
  23. -B <db_type>  数据结构类型,有  'btree'  和  'hash' 两种. 默认是  'btree'   
  24. -L <num>      log buffer size in kbytes,  default  is 32KB   
  25. -C <num>      每隔多少秒checkpoint, 设置为 0 将实时写入硬盘, 默认是 5 分钟   
  26. -T <num>       do  memp_trickle every <num> seconds,  0   for  disable,  default  is  30  seconds   
  27. -e <num>      percent of the pages in the cache that should be clean,  default  is  60 %   
  28. -D <num>       do  deadlock detecting every <num> millisecond,  0   for  disable,  default  is 100ms   
  29. -N            设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭   
  30. --------------------Replication Options-------------------------------   
  31. -R            主服务器提供同步数据的地址和端口,主从模式必须设置   
  32. -O            从服务器同步源地址和端口   
  33. -M/-S         以主或从服务器启动   
  34. -n            允许从服务器数量, 默认是 2 台   
  35. -----------------------------------------------------------------------  

关于-C和-N选项涉及到数据完整性,会在下面会说明一下

五、备份和恢复
1.热备份
因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份
Java代码 复制代码
  1. [root @srv  willko]# /usr/local/BerkeleyDB. 4.7 /bin/db_hotbackup -h /data/ 21201 / -b ./bak/   
  2. -h是数据的目录   
  3. -b是备份的目录  

恢复的话,启动memcacedb的数据目录设置成备份目录就可以了

2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。
Java代码 复制代码
  1. /usr/local/BerkeleyDB. 4.7 /bin/db_recover -cf -h /data/ 21201 /   
  2. -h是你的数据目录  

模拟crash
Java代码 复制代码
  1. [root @srv  willko]# memcachedb -u willko -p  21201  -d -r -H /data/ 21201 / -v >/data/ 21201 .log  2 >& 1   -P /data/ 21201 / 21201 .pid   
  2. [root @srv  willko]# telnet localhost  21201   
  3. Trying  127.0 . 0.1 ...   
  4. Connected to localhost.   
  5. Escape character is  '^]' .   
  6. set t  0   0   4     
  7. hhhh       #设置键为t,值为hhhh的   
  8. STORED   
  9. get t   
  10. VALUE t  0   4   
  11. hhhh   
  12. END   
  13. quit   
  14. Connection closed by foreign host.   
  15. [root @srv  willko]# kill - 9  `cat /data/ 21201 / 21201 .pid ` #用- 9 来模拟crash   
  16. [root @srv  willko]# /usr/local/BerkeleyDB. 4.7 /bin/db_recover -cf -h /data/ 21201 /     
  17. recovery  100 % complete   
  18. [root @srv  willko]# memcachedb -u willko -p  21201  -d -r -H /data/ 21201 / -v >/data/ 21201 .log  2 >& 1   -P /data/ 21201 / 21201 .pid   
  19. [root @srv  willko]# telnet localhost  21201   
  20. Trying  127.0 . 0.1 ...   
  21. Connected to localhost.   
  22. Escape character is  '^]' .   
  23. get t   
  24. VALUE t  0   4   
  25. hhhh #还可以获得crash前设置的值   
  26. END   
  27. quit   
  28. Connection closed by foreign host.   
  29. [root @srv  willko]#   


3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。
也就是说使用-N选项后,crash后通过slave来恢复。

六、一点抱怨
目前,持久存储系统产品非常的多,我觉得未来的持久存储肯定不只提供hash table存储,还应该把加入list、tree等的支持。这些都可以扩大持久存储系统的应用场景,未来持久存储系统成熟的时候,将会大规模代替RMDB。
最近,有个亮点产品出现,叫redis,目前还只是beta。

分享到:
评论

相关推荐

    memcachedb

    **Memcachedb** 是一种分布式键值存储系统,专为持久化设计。它不是传统的缓存解决方案,而是一个完整的、用于持久化的 memcached 变体。与 memcached 不同的是,Memcachedb 不提供过期功能(尽管为了兼容 memcached...

    memcachedb-1.2.0.tar.gz

    Memcachedb是一个轻量级、高性能的键值存储数据库系统,它基于著名的缓存服务软件Memcached,并加入了持久化存储的功能。这个名为"memcachedb-1.2.0.tar.gz"的压缩包包含了该版本的源代码及相关文件,是开发者研究和...

    memcachedb 手册

    `memcachedb` 是一个基于 `memcached` 的、持久化的键值存储系统,它结合了 `memcached` 的高性能缓存特性与数据库的持久化能力,常用于分布式环境中的数据缓存。这份手册详细介绍了 `memcachedb` 的安装、配置、...

    cpp-分布式缓存服务器memcachedb

    在NoSQL数据库领域,Memcachedb因其高效、轻量级的特性而被广泛应用。 ### Memcached介绍 Memcached是一款高性能、分布式内存对象缓存系统,用于减少数据库负载,提高网站性能。它的工作原理是将数据存储在内存中...

    Ubuntu 9.04中安装Memcachedb

    首先,Memcachedb是在原有Memcached基础上扩展出来的,它不仅提供Memcached的高性能分布式缓存系统功能,还增加了一个持久化的存储层,使得缓存数据可以被持久化存储,适合需要缓存数据持久性的应用场景。...

    一切为了分布式——2009年Web后端技术回顾.pdf

    函数式编程强调无副作用和纯函数,这有助于编写出更易于并行处理的代码,而轻量级进程则降低了并发处理的资源消耗,为分布式系统提供了更好的效率和灵活性。 综上所述,2009年Web后端技术的回顾主要集中在分布式...

    memcached缓存

    总结来说,memcached作为一款高效、轻量级的缓存系统,通过在内存中存储数据,极大地提升了Web应用的响应速度。理解其工作原理和应用场景,并结合实际需求进行优化,可以帮助我们构建出更加流畅、高效的系统。

    关于BIG DATA最前沿发展的情况的介绍

    memcached是一个轻量级的、分布式的内存对象缓存系统,通过简单的协议和事件驱动机制实现高效的数据交换。它利用哈希算法分散数据,确保数据在多个节点间的快速访问。类似的系统如MemcacheDB,提供了持久化的存储...

    Redis实战.pdf

    1.1.3 memcachedb:基于memcached的持久化版本,提供简单的键值存储功能。 1.1.4 Cassandra:由Facebook开发,是一个分布式NoSQL数据库,支持大量数据的分布式存储。 1.1.5 memcached:是一款广泛使用的内存对象缓存...

    NoSQL数据库详细介绍入门经典

    - **Tokyo Cabinet/Tyrant**:一种轻量级的键值存储系统。 - **CT.M**:一种分布式键值存储系统。 - **Scalien**:一种分布式的键值存储系统。 - **BerkeleyDB**:一款嵌入式的数据库引擎。 - **MemcacheDB**:...

    ehcache和memcache性能比较

    相比之下,Memcache是一款轻量级的、高性能的分布式内存对象缓存系统,它的特点是: 1. 集群支持:Memcache天生支持分布式,数据存储在多个服务器上,通过一致性哈希算法实现数据的分布和负载均衡。 2. 第三方持久...

    云计算大会-NoSQL系统设计思考

    NoSQL(Not Only SQL / Non-relational)是指一类非关系型数据库管理系统,它与传统的SQL数据库不同,不保证关系数据库的ACID特性(原子性、一致性、隔离性、持久性)以及JOIN操作,但支持动态表结构定义,具有更好...

    8种Nosql数据库系统对比

    相比于传统的SQL(Structured Query Language)关系型数据库,NoSQL数据库提供了非关系型、分布式、易扩展的数据存储方案,特别适合大数据量、高并发、实时查询的应用场景。 在本文中,我们将对比分析八种常见的...

    NoSQL数据库学习教程.pdf

    MemcacheDB是指使用MemcacheDB来实现键值存储。 Mnesia是指使用Mnesia来实现键值存储。 LightCloud是指使用LightCloud来实现键值存储。 HamsterDB是指使用HamsterDB来实现键值存储。 Flare最终一致性 Key Value ...

    基于Spring-DM实现分布式服务框架(DSF).pdf

    选择Spring-DM而非直接使用Spring的原因在于DSF需要一个轻量级的核心,同时具备良好的可扩展性。OSGi作为模块化框架,能够提供插件化和动态部署的能力,但直接基于OSGi开发需要处理较多底层细节。Spring-DM则提供了...

    NoSQL数据库笔谈

    - **Drizzle**: 轻量级的关系型数据库管理系统。 #### 五、应用篇 **1. eBay架构经验** - 介绍了eBay在分布式系统架构方面的实践经验。 **2. 淘宝架构经验** - 探讨了淘宝在高并发场景下系统的架构设计和优化。...

    Redis 实战

    Redis不仅支持简单的键值对存储,还提供了一系列高级功能,如事务、持久化、主从复制等,使其成为分布式系统中的关键组件之一。 #### 二、键值存储系统对比 ##### 2.1 键值存储系统的概念 键值存储是一种简单的...

    Redis实战文档

    Key-Value存储系统,尤其是Redis,凭借其轻量级、易于部署和管理的特点,成为了云环境中不可或缺的一部分。它不仅能够在分布式环境中高效运行,还能够轻松地在多台服务器之间进行数据复制和分区,满足了云环境下的...

    redis实战redis实战redis实战redis实战

    在这个章节中,会提及一些其他的Key-Value存储系统,例如Voldemort、Dynamo、memcachedb、Cassandra、memcached和Hypertable等,以供比较和对比。这些系统各有特点,比如Dynamo是高度可用的键值存储,支持分布式计算...

Global site tag (gtag.js) - Google Analytics