`
zhaohaolin
  • 浏览: 1003449 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

[转]memcachedb 压力测试及调优【转】

阅读更多

一.需求:

我们希望找到一个key-value型数据库,具有以下特点
1.稳定高效
2.基于memcache或其它方便调用的包,以便在PHP中分布调用
3.如果有热备能力更佳,但至少有主从结构。

可选择的有:memcachedb和Tokyo Tyrant。它们的官方报告数据都不错。
我们曾经对Tokyo Tyrant-Tokyo Cabinet寄予厚望,因为它可以做双主。但结果是,在插入200万100字节的数据之后,Tokyo Tyrant就像蜗牛一样,而且不断报错。

 

二.测试数据:

软硬件环境:
CPU: 64位4核Intel(R) Xeon(R) CPU E5310 @ 1.60GHz
内存:8G
操作系统:centos
硬盘:120G
客户端:PHP PECL扩展
启动方式:memcachedb -p11211 -d -r -u root -H /opt/mdb/ -m 6144 -N -t 4

或memcachedb -p11222 -d -r -u root -H /opt/mdb/ -m 7000 -N -t 8 -E -X -v
网络环境:未明确标注的均为localhost


(1)400字节数据单主机新增数据测试(10万数据)
内网:ping值:time=0.151 ms 千兆带宽
400字节:2.8秒/万
100字节:2.0秒/万

本机:  ping值:time=0.010 ms
400字节:0.7秒/万

结论:
在小数据量的情况下,localhost和内网差别为4:1左右。
数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为3:2左右,读数据效率差别较小。

(2)100字节数据单主机测试结果:(2千万数据)
新增:7280条/秒 (客户端8进程,其余未标明的测试均为单进程)
更改:200万以前1860条/s,200万稳定在以后>10000条/秒(这个现象原因还未找到,更改数据测试有待重测)
读取:>10000万条/秒

结论:
客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。


(2)将数组转成字符串存取能提高效率么?压缩选项是否能较大地提高效率?
某数组(如下),序列化后长度为700字节,用分隔符将数组的值转成字符串为350字节左右。下面测试中,已经包含把数组序列化和转字符串的时间。
array ( 0 => 10735, 1 => 10720, 2 => 10705, 3 => 10690, 4 => 10675, 5 => 10660, 6 => 10645, 7 => 10630, 8 => 10615, 9 => 10600, 10 => 10585, 11 => 10570, 12 => 10555, 13 => 10540, 14 => 10525, 15 => 10510, 16 => 10495, 17 => 10480, 18 => 10465, 19 => 10450, 20 => 10435, 21 => 10420, 22 => 10405, 23 => 10390, 24 => 10375, 25 => 10360, 26 => 10345, 27 => 10330, 28 => 10315, 29 => 10300, 30 => 10285, 31 => 10270, 32 => 10255, 33 => 10240, 34 => 10225, 35 => 10210, 36 => 10195, 37 => 10180, 38 => 10165, 39 => 10150, 40 => 10135, 41 => 10120, 42 => 10105, 43 => 10090, 44 => 10075, 45 => 10060, 46 => 10045, 47 => 10030, 48 => 10015, 49 => 10000);

在内网环境:
数组直接存取:
无压缩 写3.5秒/万,读3.2秒/万
带压缩 写3.3秒/万,读2.6秒/万
字符串存取:
无压缩 写3.0秒/万,读2.3秒/万。
带压缩 写3.1秒/万,读2.4秒/万
把数组的值都改成一样时(可压缩性高,压缩后只占了10字节以内),带压缩地写2.6秒/万,读1.9秒/万。

在本机:
数组直接存取:带压缩地写1.9秒/万,读1.1秒/万
字符串存取:  带压缩地写1.1秒/万,读0.9秒/万


结论:
数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。
在数据可压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。


(4)主从测试结果:(100万数据以下)
100字节数据
新增:1000条/秒

400字节
更改:100条/秒(客户端单进程)
读取:3570条/秒 (客户端单进程)

结论:
在使用主从结构时,写效率很大影响,效率差别在100:1左右,所以不建议使用主从。

 
(5)使用SVN最新版本的测试情况(新增350字节数据)
方案1:32位4核CPU,内存8G,-m2048启动:
表现优秀:0-443万      4000条/秒,非常稳定
表现较差:在443-800万  2100条/秒,忽快忽慢  data.db在2.5G左右。
表现很差:在800-1千万  1400条/秒,忽快忽慢  data.db在4G左右  负载load average在5左右,服务器基本不响应。
出错情况:17次/1千万

在本服务器上启动两个mdb时,负载比一个高,性能较快地达到瓶颈。三个mdb时,负载很高,启动5个mdb进程时,写数据在1000多条/秒了,基本就 没有性能可言。

 

方案2:64位4核CPU,内存8G,-m6144启动:
0-1200万   5000条/秒,非常稳定
1300万后   2000条/秒,忽快忽慢 data.db在6G左右
1800万后   1400条/秒,忽快忽慢 data.db在8G左右  此时读数据性能也不太稳定,但大部分保持在3000-4000条 /秒以上。负载load average在3左右,服务器仍然响应。
出错情况: 20次/1千万

 

在本服务器上,起2个mdb进程的效率比一个稍好一些,写数据在5599条/秒左右,读数据在10000条/秒左右。在32位CPU的服务器上则相反,性 能更快地达到瓶颈。

在重新启动mcdb后,读和写的速度都又恢复到了最好的状态,测试到单个文件大小达到14G时,仍然能和刚开始的速度一样。另外,当负载 下降后,再插入数据也能有很高的性能。

mdb停止时不能删除日志,否则不能在原数据基础上再重启。

 

结论:
mcdb根据硬件的情况,对应着相应的性能瓶颈。强烈建议使用CPU4核64位,8G内存的服务器,测试大数量时,表现很稳定和高效。而32位的服务器因 为不能管理大内存,差别很大,很容易达到瓶颈,进入不稳定状态,如果负载重需要人工重启干预。

重新启动mcdb,可以达到释放内存,提高性能的效果。隔一断时间插入数据,也可以降低负载。
应该使用SVN的版本。SVN的最新版本整体数据也比发布版在开始时更为稳定。

一台服务器上最好不要超过两个以上mdb服务。
mcdb出错的概率比较低,在20次/1千万左右,如果出错率更高,可能是服务器负载很大造成。有些写错误实际上已经写入,报错的原因仅仅是返回的数据未 读到。

 

(6)并发测试(内网环境)

10并发读和写  每线程50000次 每线程错误量15次左右 错误率0.03%
500并发读和写 每线程100次   每线程错误量5次左右  错误率5%,允许失败重连,最高连接数达到2300个。

300并发写 每线程100次   每线程错误量2次左右  错误率2%,

100并发读 每线程50次   错误率5%以上,允许失败重连,最高连接数达到2650以上。

50并发读 每线程5000次 错误率1%,速度很快,正常。

 

结论:

mdb不是一个可靠db,不能独立 作为db使用,可作为大缓存。我理解,mdb虽说是持久层,但它继承自缓存的性质, 决定了它不可能是可靠的。

mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。

 

 

 

三.总结:在并发较高的环境下,将memcachedb定义为大缓存更合适,而不适用为单独的db.

1.memcachedb 必须使用多线程启动,需要在编译时加上--enable-threads,否则在100万左右数以后据时,写入数据将不断报错,并效率极低,且读写并行能 力极差。另外,如果要使用-m参数,需要从SVN拿,发布版不行。

2.使用8G内存与2G内存对比,速度差别在2:1左右。(2G的数据就不提供了)

3.使用localhost和千兆内网速度比为4:1。

4.在使用主从结构时,写效率很大影响,效率差别在100:1左右,所以不建议使用主从。

5.数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为3:2左右,读数据效率差别较小。

6.客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。

7.数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。

8.在数据可压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。

9.mcdb根据硬件的情况,对应着相应的性能瓶颈。在方案1中,存放3G以下数据量能得到最佳性能,方案2则在6G以下。可以启动多个进程来解决单个文 件太大的问题。
10.单线程连接时,mcdb出错的概率比较低,在20次/1千万左右

11.如果将log全都删除,重启数据库会失败。可以在启动时用-E选项,由mdb自动管理日志。

12.并发时,mdb不是一个可靠db,有一定的出错率,不能独立 作为db使用,可作为大缓存。

13.mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。


四.参考:
1.memcachedb官方测试结果: http://memcachedb.org/benchmark.html
2.Tokyo Cabinet的测试结果和介绍:http://blog.s135.com/read.php?362&guid=9
3.某网友的Tokyo Cabinet测试:http://blog.zol.com.cn/861/article_860439.html 结果比我在基于Tokyo Tyrant的测试好看多了,但也明确表示在200万数据以后变慢很多。

官网:http://memcachedb.org/
作者的讨论组:http://groups.google.com/group/memcachedb
安装和启动指南:http://blog.csdn.net/simonlsy/archive/2008/01/07/2027940.aspx

 

[转自: http://blog.sina.com.cn/s/blog_403b3b8f0100coe7.html ]

分享到:
评论

相关推荐

    memcachedb

    ### Memcachedb:全面解析与应用实践 #### 一、Memcachedb简介 **Memcachedb** 是一种分布式键值存储系统,专为持久化设计。它不是传统的缓存解决方案,而是一个完整的、用于持久化的 memcached 变体。与 ...

    memcachedb 手册

    - 通过这些命令,开发者可以快速测试和调试 `memcachedb` 实例。 4. **API 使用** - `memcachedb` 提供多种语言的客户端库,如 C、Python、Java 和 PHP,使得开发者能够轻松地在应用中集成缓存功能。 - API 包含...

    memcachedb-1.2.0.tar.gz

    这个名为"memcachedb-1.2.0.tar.gz"的压缩包包含了该版本的源代码及相关文件,是开发者研究和使用Memcachedb的重要资源。 1. **键值存储系统**:Memcachedb是键值存储系统的一个代表,这种系统以键(key)为索引,...

    cpp-分布式缓存服务器memcachedb

    在提供的`memcachedb-master`压缩包中,包含了源代码和其他相关资源,可以用于编译、安装和测试Memcachedb。通过深入研究源代码,开发者可以更好地理解其内部工作原理,并可能进行定制化的修改和扩展。 总结来说,...

    Ubuntu 9.04中安装Memcachedb

    在Ubuntu 9.04中安装Memcachedb是一个相对直接的过程,但如果希望在系统上顺利运行Memcachedb,用户需要了解一些前置知识,包括对...理解Memcachedb的工作原理及性能特点,有助于评估其是否适合特定的项目需求。

    唱吧数据库系统架构的变迁之路

    - **纵切数据库**:将部分表如user_relation、notice等剥离出来,放置于独立的数据库中,并通过MemcacheDB消息队列来实现异步写入。 - **异地机房尝试**:为了解决跨机房数据访问的问题,尝试在不同地理位置设置机房...

    memcldj:将JSON Blob快速加载到memcache或memcachedb中

    自述文件 快速将JSON Blob加载到或。 给定一个文件,请使用JSON文档中的值作为键,并将其值设置为JSON Blob。 注意:不支持嵌套键。 安装 ...或通过安装。 ... -addr="127.0.0.1:11211": hostport of memcache ...

    spring-DM 分布式

    这样做减少了服务中心的压力,使得服务应用端可以直接与目标服务通信,而不需要通过服务中心进行路由。这种设计考虑了集群环境,以应对服务元信息的动态变化。 服务中心在DSF中的职责主要集中在服务的管理和监控上...

    基于Spring-DM实现分布式服务框架(DSF).docx

    这种设计减少了服务中心的压力,使其主要负责服务管理和监控。 服务查找模块负责与MemcacheDB的通信,根据服务模型进行过滤查找。为了支持未来可能的查找方式切换,如基于分布式文件系统或本地缓存,设计时需要考虑...

    memcache数据库缓存.pdf

    Memcache是一个高性能、高并发的分布式内存缓存系统,主要用于缓解数据库读压力。它是由C语言编写的开源软件,设计简洁,代码量小,具有约2000行代码。Memcache主要作用是提高数据访问速度,尤其适用于处理大量热点...

    Redis操作基础文档

    - **NoSQL**:代表“Not Only SQL”,是一类非关系型数据库的总称,它们放弃了部分RDBMS的传统特性,比如固定的表模式、SQL查询语言等,转而采用更灵活的数据模型和可扩展性更强的设计。 2. **NoSQL的优势**: - ...

    Redis实战 中文完成版

    这种架构不仅提高了系统的可用性,还能够分担读取压力。 ##### 1.3.4 性能 Redis是一个内存数据库,所有数据都存储在RAM中,因此具有非常高的读写速度。此外,Redis还利用了单线程模型和非阻塞I/O机制,进一步提升...

    redis实战中文版

    3. **memcachedb**:一种高性能的嵌入式键值存储系统,结合了memcached的速度优势与ACID事务特性,适用于需要高速缓存的应用场景。 4. **Cassandra**:一个分布式NoSQL数据库系统,支持横向扩展和高可用性,特别适合...

    NoSQL数据库笔谈

    Memc ac hed客户端(mc ) 缓存式的Web应用程序架构 性能测试 dbc ac hed Memcached 和 dbcached 在功能上一样吗? 列存系列 Hadoop之Hbase 耶鲁大学之HadoopDB GreenPlum FaceBook之Cassandra Cassandra特点 Keyspace ...

    Redis实战 中文

    - **缓存**:Redis常被用作Web应用的缓存层,以减少对后端数据库的访问压力。 - **会话存储**:在分布式环境中,使用Redis存储用户会话信息可以实现跨服务器的会话共享。 - **消息队列**:Redis提供了列表数据结构,...

Global site tag (gtag.js) - Google Analytics