一.需求:
我们希望找到一个key-value型数据库,具有以下特点
1.稳定高效
2.基于memcache或其它方便调用的包,以便在PHP中分布调用
3.如果有热备能力更佳,但至少有主从结构。
可选择的
有:memcachedb和Tokyo Tyrant。它们的官方报告数据都不错。
我们曾经对Tokyo Tyrant-Tokyo
Cabinet寄予厚望,因为它可以做双主。但结果是,在插入200万100字节的数据之后,Tokyo Tyrant就像蜗牛一样,而且不断报错。
二.测试数据:
软硬件环境:
CPU: 64位4核Intel(R) Xeon(R)
CPU E5310 @ 1.60GHz
内存:8G
操作系统:centos
硬盘:120G
客户端:PHP
PECL扩展
启动方式:memcachedb -p11211 -d -r -u root -H /opt/mdb/ -m 6144 -N
-t 4
或memcachedb -p11222 -d -r -u root -H /opt/mdb/ -m 7000 -N
-t 8 -E -X -v
网络环境:未明确标注的均为localhost
(1)400字节数据单主机新增数据测试(10万数据)
内网:ping值:time=0.151 ms 千兆带宽
400字节:2.8秒/万
100字节:2.0秒/万
本机: ping值:time=0.010 ms
400字节:0.7秒/万
结论:
在小数据量的情况下,localhost和内网差别为4:1左右。
数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为3:2左右,读数据效率差别较小。
(2)100
字节数据单主机测试结果:(2千万数据)
新增:7280条/秒 (客户端8进程,其余未标明的测试均为单进程)
更改:200万以前1860条/s,200万稳定在以后>10000条/秒(这个现象原因还未找到,更改数据测试有待重测)
读取:>10000万条/秒
结论:
客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。
(2)将数组转成字符串存取能提高效率么?压缩选项是否能较大地提高效率?
某数组(如下),序列化后长度为700字节,用分隔符将数组的值转成字符串为350字节左右。下面测试中,已经包含把数组序列化和转字符串的时间。
array ( 0 => 10735, 1 => 10720, 2 => 10705, 3 => 10690, 4
=> 10675, 5 => 10660, 6 => 10645, 7 => 10630, 8 => 10615,
9 => 10600, 10 => 10585, 11 => 10570, 12 => 10555, 13 =>
10540, 14 => 10525, 15 => 10510, 16 => 10495, 17 => 10480,
18 => 10465, 19 => 10450, 20 => 10435, 21 => 10420, 22 =>
10405, 23 => 10390, 24 => 10375, 25 => 10360, 26 => 10345,
27 => 10330, 28 => 10315, 29 => 10300, 30 => 10285, 31 =>
10270, 32 => 10255, 33 => 10240, 34 => 10225, 35 => 10210,
36 => 10195, 37 => 10180, 38 => 10165, 39 => 10150, 40 =>
10135, 41 => 10120, 42 => 10105, 43 => 10090, 44 => 10075,
45 => 10060, 46 => 10045, 47 => 10030, 48 => 10015, 49 =>
10000);
在内网环境:
数组直接存取:
无压缩 写3.5秒/万,读3.2秒/万
带压缩
写3.3秒/万,读2.6秒/万
字符串存取:
无压缩 写3.0秒/万,读2.3秒/万。
带压缩
写3.1秒/万,读2.4秒/万
把数组的值都改成一样时(可压缩性高,压缩后只占了10字节以内),带压缩地写2.6秒/万,读1.9秒/万。
在本机:
数组直接存取:带压缩地写1.9秒/万,读1.1秒/万
字符串存取:
带压缩地写1.1秒/万,读0.9秒/万
结论:
数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。
在数据可压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。
(4)主从测试结果:(100万数据以下)
100字节数据
新增:1000条/秒
400字节
更改:100条/秒(客户端单进程)
读取:3570条/秒 (客户端单进程)
结论:
在使用主从结构时,写效率很大影响,效率差别在100:1左右,所以不建议使用主从。
(5)使用SVN最新版本的测试情况(新增350字节数据)
方案1:32位4核CPU,内存8G,-m2048启动:
表现优秀:0-443万 4000条/秒,非常稳定
表现较差:在443-800万 2100条/秒,忽快忽慢 data.db在2.5G左右。
表现很差:在800-1千万 1400条/秒,忽快忽慢 data.db在4G左右 负载
load average在5左右,服务器基本不响应。
出错情况:17次/1千万
在本服务器上启动两个mdb时,负载比一个高,性能较快地达到瓶颈。三个mdb时,负载很高,启动5个mdb进程时,写数据在1000多条/秒了,基本就 没有性能可言。
方案2:64位4核CPU,内存8G,-m6144启动:
0-1200万
5000条/秒,非常稳定
1300万后 2000条/秒,忽快忽慢 data.db在6G左右
1800万后 1400条/秒,忽快忽慢 data.db在8G左右 此时读数据性能也不太稳
定,但大部分保持在3000-4000条 /秒以上。负载load average在3左右,服务器仍然响应。
出错情况: 20次/1千万
在本服务器上,起2个mdb进程的效率比一个稍好一些,写数据在5599条/秒左右,读数据在10000条/秒左右。在32位CPU的服务器上则相反,性 能更快地达到瓶颈。
在重新启动mcdb后,读和写的速度都又恢复到了最好的状态,测试到单个文件大小达到14G时, 仍然能和刚开始的速度一样。另外,当负载 下降后,再插入数据也能有很高的性能。
mdb停止时不能删除日志,否则不能 在原数据基础上再重启。
结论:
mcdb根据硬件的情况,对应着相应的性能瓶颈。强烈建议使用CPU4核64位,8G内存的服务器,测试大数量时,表现很稳定和高效。而32位的服务器因
为不能管理大内存,差别很大,很容易达到瓶颈,进入不稳定状态,如果负载重需要人工重启干预。
重新启动mcdb,可以达到释放内存,提
高性能的效果。隔一断时间插入数据,也可以降低负载。
应该使用SVN的版本。SVN的最新版本整体数据也比发布版在开始时更为稳定。
一
台服务器上最好不要超过两个以上mdb服务。
mcdb出错的概率比较低,在20次/1千万左右,如果出错率更高,可能是服务器负载很大造成。有些写错误实际上已经写入,报错的原因仅仅是返回的数据未
读到。
(6)并发测试(内网环境)
10并发读和写 每线程50000次
每线程错误量15次左右 错误率0.03%
500并发读和写 每线程100次 每线程错误量5次左右
错误率5%,允许失败重连,最高连接数达到2300个。
300并发写 每线程100次 每线程错误量2次左右 错误率2%,
100并发读 每线程50次 错误率5%以上,允许失败重连,最高连接数达到2650以上。
50并发读 每线程5000次 错误率1%,速度很快,正常。
结论:
mdb不是一个可靠db,不能独立 作为db使用,可作为大缓存。我理解,mdb虽说是持久层,但它继承自缓存的性质, 决定了它不可能是可靠的。
mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。
三.总结:在并发较高的环境下,将memcachedb定义为大缓存更合适,而不适用 为单独的db.
1.memcachedb 必须使用多线程启动,需要在编译时加上--enable-threads,否则在100万左右数以后据时,写入数据将不断报错,并效率极低,且读写并行能 力极差。另外,如果要使用-m参数,需要从SVN拿,发布版不行。
2.使用8G内存与2G内存对比,速度差别在2:1左右。(2G的数 据就不提供了)
3.使用localhost和千兆内网速度比为4:1。
4.在使用主从结构时,写效率很大影响,效率差别 在100:1左右,所以不建议使用主从。
5.数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为 3:2左右,读数据效率差别较小。
6.客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。
7.数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。
8.在数据可 压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。
9.mcdb根据硬件的情况,对应着相应的性能瓶颈。在方案1中,存放3G以下数据量能得到最佳性能,方案2则在6G以下。可以启动多个进程来解决单个文
件太大的问题。
10.单线程连接时,mcdb出错的概率比较低,在20次/1千万左右
11.如果将log全都删除,重启数 据库会失败。可以在启动时用-E选项,由mdb自动管理日志。
12.并发时,mdb不是一个可靠db,有一定的出错率,不能独 立 作为db使用,可作为大缓存。
13.mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。
四.参考:
1.memcachedb官方测试结果: http://memcachedb.org/benchmark.html
2.Tokyo Cabinet的测试结果和介绍:http://blog.s135.com/read.php?362&guid=9
3.某网友的Tokyo Cabinet测试:http://blog.zol.com.cn/861/article_860439.html
结果比我在基于Tokyo Tyrant的测试好看多了,但也明确表示在200万数据以后变慢很多。
官网:http://memcachedb.org/
作者的讨论组:http://groups.google.com/group/memcachedb
安装和启动指南:http://blog.csdn.net/simonlsy/archive/2008/01/07/2027940.aspx
发表评论
-
ubuntu rar 文件
2010-09-25 09:34 696sudo apt-get install rar r ... -
MEMCACHEDB 删除日志文件
2010-09-01 15:32 706ls -t log.* |awk '{if(NR>10) ... -
ubuntu 查看CHM文件
2010-08-26 15:35 728安装方法:sudo apt-get install kchmv ... -
Ubuntu filefox 4.0 安装
2010-08-02 14:17 827To create an app tab, simply ri ... -
Ubuntu10.04窗口风格改为windows风格的方法(最小化、最大化、关闭按钮右对齐)
2010-07-29 18:10 14662.在窗口任务栏(标题栏)增加系统菜单,并将最小化、最大化、关 ... -
修改linux swap空间的swappiness,降低对硬盘的缓存
2010-07-29 17:58 1431linux 会使用硬盘的一部分做为SWAP分区,用来进行进程 ... -
ubuntu 10.04升级10.10只需一条命令
2010-07-26 13:42 2229看命令吧~~哈哈! 在终端输入:update-mana ... -
ubuntu安装IE6浏览器
2010-07-25 10:55 1013没办法,国人喜欢这个 由于本质性的问题,用fire ... -
buntu 10.04 安装Nvidia显卡后开机花屏(分辨率低)完美解决(图解)
2010-07-24 08:33 21281.可以解决的问题: (1)安装驱动后开机和关机画面花屏,分 ... -
ubuntu 苹果风格主题
2010-07-23 17:04 1165苹果风格主题 声明:这个是个人爱好,如果不喜 ... -
ubuntu install cairo-dock
2010-07-23 16:49 1292这东西确实很率,感觉和系统不太兼容,看命令吧~ sud ... -
如何区分服务器是几个CPU,几核
2010-07-21 17:30 2967现在 服务器的CPU多了,好多同志都分不清楚是几个CPU,几核 ... -
服务器重装后 SSH 不可以登录
2010-07-19 11:57 955一台服务器重新安装后,结果SSH报错 这是因为./ss ... -
Ubuntu中安装GBK locale
2010-07-14 11:51 944Ubuntu默认安装的中文环境为zh_CN.utf8,然后很多 ... -
error while loading shared libraries的解決方法
2010-07-06 17:19 878这种问题,一般都是装在/usr/local/lib下面能找到, ... -
gearmand: error while loading shared libraries: libgearman.so.4: cannot open sha
2010-06-28 13:35 1721一般都是这个文件 没有在/usr/lib下面导致 -
configure: error: No working C++ Compiler has been found. gearmand requires a C+
2010-06-28 11:56 1735sudo apt-get install gcc build- ... -
Ubuntu bz2 文件
2010-06-23 16:55 613tar –xvf file.tar //解压 tar包 ta ... -
Ubuntu 查看机器IP
2010-06-23 16:32 905打开终端,在命令行中输入ifconfig ,回车 ... -
ubuntu下修改path三种方法
2010-06-23 14:46 2109在 Ubuntu 系统中有两种设置环境变量 PATH 的方法。 ...
相关推荐
### Memcachedb:全面解析与应用实践 #### 一、Memcachedb简介 **Memcachedb** 是一种分布式键值存储系统,专为持久化设计。它不是传统的缓存解决方案,而是一个完整的、用于持久化的 memcached 变体。与 ...
- 通过这些命令,开发者可以快速测试和调试 `memcachedb` 实例。 4. **API 使用** - `memcachedb` 提供多种语言的客户端库,如 C、Python、Java 和 PHP,使得开发者能够轻松地在应用中集成缓存功能。 - API 包含...
这个名为"memcachedb-1.2.0.tar.gz"的压缩包包含了该版本的源代码及相关文件,是开发者研究和使用Memcachedb的重要资源。 1. **键值存储系统**:Memcachedb是键值存储系统的一个代表,这种系统以键(key)为索引,...
在Ubuntu 9.04中安装Memcachedb是一个相对直接的过程,但如果希望在系统上顺利运行Memcachedb,用户需要了解一些前置知识,包括对...理解Memcachedb的工作原理及性能特点,有助于评估其是否适合特定的项目需求。
在提供的`memcachedb-master`压缩包中,包含了源代码和其他相关资源,可以用于编译、安装和测试Memcachedb。通过深入研究源代码,开发者可以更好地理解其内部工作原理,并可能进行定制化的修改和扩展。 总结来说,...
Memcached VS Redis:2者究竟有哪些区别,什么场景下应用那种类型的缓存服务器。
- **纵切数据库**:将部分表如user_relation、notice等剥离出来,放置于独立的数据库中,并通过MemcacheDB消息队列来实现异步写入。 - **异地机房尝试**:为了解决跨机房数据访问的问题,尝试在不同地理位置设置机房...
自述文件 快速将JSON Blob加载到或。 给定一个文件,请使用JSON文档中的值作为键,并将其值设置为JSON Blob。 注意:不支持嵌套键。 安装 ...或通过安装。 ... -addr="127.0.0.1:11211": hostport of memcache ...
这样做减少了服务中心的压力,使得服务应用端可以直接与目标服务通信,而不需要通过服务中心进行路由。这种设计考虑了集群环境,以应对服务元信息的动态变化。 服务中心在DSF中的职责主要集中在服务的管理和监控上...
Tokyo Tyrant与MemcacheDB、Redis等其他流行数据库进行了性能对比测试。在不同的数据量和负载条件下,Tokyo Tyrant展示了其在读写性能、数据处理能力等方面的竞争优势。 ### 8. 问题与Bug Tokyo Tyrant虽然强大,...
这种设计减少了服务中心的压力,使其主要负责服务管理和监控。 服务查找模块负责与MemcacheDB的通信,根据服务模型进行过滤查找。为了支持未来可能的查找方式切换,如基于分布式文件系统或本地缓存,设计时需要考虑...
Memcache是一个高性能、高并发的分布式内存缓存系统,主要用于缓解数据库读压力。它是由C语言编写的开源软件,设计简洁,代码量小,具有约2000行代码。Memcache主要作用是提高数据访问速度,尤其适用于处理大量热点...
#### 一、NoSQL概述及应用情况 NoSQL(Not Only SQL / Non-relational)是指一类非关系型数据库管理系统,它与传统的SQL数据库不同,不保证关系数据库的ACID特性(原子性、一致性、隔离性、持久性)以及JOIN操作,...
这种架构不仅提高了系统的可用性,还能够分担读取压力。 ##### 1.3.4 性能 Redis是一个内存数据库,所有数据都存储在RAM中,因此具有非常高的读写速度。此外,Redis还利用了单线程模型和非阻塞I/O机制,进一步提升...
Memc ac hed客户端(mc ) 缓存式的Web应用程序架构 性能测试 dbc ac hed Memcached 和 dbcached 在功能上一样吗? 列存系列 Hadoop之Hbase 耶鲁大学之HadoopDB GreenPlum FaceBook之Cassandra Cassandra特点 Keyspace ...
3. **memcachedb**:一种高性能的嵌入式键值存储系统,结合了memcached的速度优势与ACID事务特性,适用于需要高速缓存的应用场景。 4. **Cassandra**:一个分布式NoSQL数据库系统,支持横向扩展和高可用性,特别适合...
- **缓存**:Redis常被用作Web应用的缓存层,以减少对后端数据库的访问压力。 - **会话存储**:在分布式环境中,使用Redis存储用户会话信息可以实现跨服务器的会话共享。 - **消息队列**:Redis提供了列表数据结构,...
2. **高效的通信策略**:服务调用时,客户端直接从MemcacheDB获取目标服务的访问机制,与服务应用端进行直接通信,避免了通过服务中心的路由,降低了通信延迟。 3. **满足需求的服务模型**:DSF的服务模型允许根据...