- 浏览: 1016730 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (826)
- 硬件 (8)
- 软件 (24)
- 软件工程 (34)
- JAVA (229)
- C/C++/C# (77)
- JavaScript (8)
- PHP (1)
- Ruby (3)
- MySQL (14)
- 数据库 (19)
- 心情记事 (12)
- 团队管理 (19)
- Hadoop (1)
- spring (22)
- mybatis(ibatis) (7)
- tomcat (16)
- velocity (0)
- 系统架构 (6)
- JMX (8)
- proxool (1)
- 开发工具 (16)
- python (10)
- JVM (27)
- servlet (5)
- JMS (26)
- ant (2)
- 设计模式 (5)
- 智力题 (2)
- 面试题收集 (1)
- 孙子兵法 (16)
- 测试 (1)
- 数据结构 (7)
- 算法 (22)
- Android (11)
- 汽车驾驶 (1)
- lucene (1)
- memcache (12)
- 技术架构 (7)
- OTP-Erlang (7)
- memcached (17)
- redis (20)
- 浏览器插件 (3)
- sqlite (3)
- Heritrix (9)
- Java线程 (1)
- scala (0)
- Mina (6)
- 汇编 (2)
- Netty (15)
- libevent (0)
- CentOS (12)
- mongod (5)
- mac os (0)
最新评论
-
kingasdfg:
你这里面存在一个错误添加多个任务 应该是这样的 /** * ...
Quartz的任务的临时启动和暂停和恢复【转】 -
kyzeng:
纠正一个错误,long型对应的符号是J,不是L。
Jni中C++和Java的参数传递 -
zhaohaolin:
抱歉,兄弟,只是留下作记录,方便学习,如果觉得资料不好,可以到 ...
netty的个人使用心得【转】 -
cccoooccooco:
谢谢!自己一直以为虚机得使用网线才可以与主机连接呢。。
主机网卡无网线连接与虚拟机通信 -
yuqilin001:
要转别人的东西,请转清楚点嘛,少了这么多类,误人子弟
netty的个人使用心得【转】
一.需求:
我们希望找到一个key-value型数据库,具有以下特点
1.稳定高效
2.基于memcache或其它方便调用的包,以便在PHP中分布调用
3.如果有热备能力更佳,但至少有主从结构。
可选择的有:memcachedb和Tokyo Tyrant。它们的官方报告数据都不错。
我们曾经对Tokyo Tyrant-Tokyo Cabinet寄予厚望,因为它可以做双主。但结果是,在插入200万100字节的数据之后,Tokyo Tyrant就像蜗牛一样,而且不断报错。
二.测试数据:
软硬件环境:
CPU: 64位4核Intel(R) Xeon(R) CPU E5310 @ 1.60GHz
内存:8G
操作系统:centos
硬盘:120G
客户端:PHP PECL扩展
启动方式:memcachedb -p11211 -d -r -u root -H /opt/mdb/ -m 6144 -N -t 4
或memcachedb -p11222 -d -r -u root -H /opt/mdb/ -m 7000 -N -t 8 -E -X -v
网络环境:未明确标注的均为localhost
(1)400字节数据单主机新增数据测试(10万数据)
内网:ping值:time=0.151 ms 千兆带宽
400字节:2.8秒/万
100字节:2.0秒/万
本机: ping值:time=0.010 ms
400字节:0.7秒/万
结论:
在小数据量的情况下,localhost和内网差别为4:1左右。
数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为3:2左右,读数据效率差别较小。
(2)100字节数据单主机测试结果:(2千万数据)
新增:7280条/秒 (客户端8进程,其余未标明的测试均为单进程)
更改:200万以前1860条/s,200万稳定在以后>10000条/秒(这个现象原因还未找到,更改数据测试有待重测)
读取:>10000万条/秒
结论:
客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。
(2)将数组转成字符串存取能提高效率么?压缩选项是否能较大地提高效率?
某数组(如下),序列化后长度为700字节,用分隔符将数组的值转成字符串为350字节左右。下面测试中,已经包含把数组序列化和转字符串的时间。
array ( 0 => 10735, 1 => 10720, 2 => 10705, 3 => 10690, 4
=> 10675, 5 => 10660, 6 => 10645, 7 => 10630, 8 => 10615,
9 => 10600, 10 => 10585, 11 => 10570, 12 => 10555, 13 =>
10540, 14 => 10525, 15 => 10510, 16 => 10495, 17 => 10480,
18 => 10465, 19 => 10450, 20 => 10435, 21 => 10420, 22 =>
10405, 23 => 10390, 24 => 10375, 25 => 10360, 26 => 10345,
27 => 10330, 28 => 10315, 29 => 10300, 30 => 10285, 31 =>
10270, 32 => 10255, 33 => 10240, 34 => 10225, 35 => 10210,
36 => 10195, 37 => 10180, 38 => 10165, 39 => 10150, 40 =>
10135, 41 => 10120, 42 => 10105, 43 => 10090, 44 => 10075,
45 => 10060, 46 => 10045, 47 => 10030, 48 => 10015, 49 =>
10000);
在内网环境:
数组直接存取:
无压缩 写3.5秒/万,读3.2秒/万
带压缩 写3.3秒/万,读2.6秒/万
字符串存取:
无压缩 写3.0秒/万,读2.3秒/万。
带压缩 写3.1秒/万,读2.4秒/万
把数组的值都改成一样时(可压缩性高,压缩后只占了10字节以内),带压缩地写2.6秒/万,读1.9秒/万。
在本机:
数组直接存取:带压缩地写1.9秒/万,读1.1秒/万
字符串存取: 带压缩地写1.1秒/万,读0.9秒/万
结论:
数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。
在数据可压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。
(4)主从测试结果:(100万数据以下)
100字节数据
新增:1000条/秒
400字节
更改:100条/秒(客户端单进程)
读取:3570条/秒 (客户端单进程)
结论:
在使用主从结构时,写效率很大影响,效率差别在100:1左右,所以不建议使用主从。
(5)使用SVN最新版本的测试情况(新增350字节数据)
方案1:32位4核CPU,内存8G,-m2048启动:
表现优秀:0-443万 4000条/秒,非常稳定
表现较差:在443-800万 2100条/秒,忽快忽慢 data.db在2.5G左右。
表现很差:在800-1千万 1400条/秒,忽快忽慢 data.db在4G左右 负载load average在5左右,服务器基本不响应。
出错情况:17次/1千万
在本服务器上启动两个mdb时,负载比一个高,性能较快地达到瓶颈。三个mdb时,负载很高,启动5个mdb进程时,写数据在1000多条/秒了,基本就 没有性能可言。
方案2:64位4核CPU,内存8G,-m6144启动:
0-1200万 5000条/秒,非常稳定
1300万后 2000条/秒,忽快忽慢 data.db在6G左右
1800万后 1400条/秒,忽快忽慢 data.db在8G左右 此时读数据性能也不太稳定,但大部分保持在3000-4000条 /秒以上。负载load average在3左右,服务器仍然响应。
出错情况: 20次/1千万
在本服务器上,起2个mdb进程的效率比一个稍好一些,写数据在5599条/秒左右,读数据在10000条/秒左右。在32位CPU的服务器上则相反,性 能更快地达到瓶颈。
在重新启动mcdb后,读和写的速度都又恢复到了最好的状态,测试到单个文件大小达到14G时,仍然能和刚开始的速度一样。另外,当负载 下降后,再插入数据也能有很高的性能。
mdb停止时不能删除日志,否则不能在原数据基础上再重启。
结论:
mcdb根据硬件的情况,对应着相应的性能瓶颈。强烈建议使用CPU4核64位,8G内存的服务器,测试大数量时,表现很稳定和高效。而32位的服务器因 为不能管理大内存,差别很大,很容易达到瓶颈,进入不稳定状态,如果负载重需要人工重启干预。
重新启动mcdb,可以达到释放内存,提高性能的效果。隔一断时间插入数据,也可以降低负载。
应该使用SVN的版本。SVN的最新版本整体数据也比发布版在开始时更为稳定。
一台服务器上最好不要超过两个以上mdb服务。
mcdb出错的概率比较低,在20次/1千万左右,如果出错率更高,可能是服务器负载很大造成。有些写错误实际上已经写入,报错的原因仅仅是返回的数据未 读到。
(6)并发测试(内网环境)
10并发读和写 每线程50000次 每线程错误量15次左右 错误率0.03%
500并发读和写 每线程100次 每线程错误量5次左右 错误率5%,允许失败重连,最高连接数达到2300个。
300并发写 每线程100次 每线程错误量2次左右 错误率2%,
100并发读 每线程50次 错误率5%以上,允许失败重连,最高连接数达到2650以上。
50并发读 每线程5000次 错误率1%,速度很快,正常。
结论:
mdb不是一个可靠db,不能独立 作为db使用,可作为大缓存。我理解,mdb虽说是持久层,但它继承自缓存的性质, 决定了它不可能是可靠的。
mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。
三.总结:在并发较高的环境下,将memcachedb定义为大缓存更合适,而不适用为单独的db.
1.memcachedb 必须使用多线程启动,需要在编译时加上--enable-threads,否则在100万左右数以后据时,写入数据将不断报错,并效率极低,且读写并行能 力极差。另外,如果要使用-m参数,需要从SVN拿,发布版不行。
2.使用8G内存与2G内存对比,速度差别在2:1左右。(2G的数据就不提供了)
3.使用localhost和千兆内网速度比为4:1。
4.在使用主从结构时,写效率很大影响,效率差别在100:1左右,所以不建议使用主从。
5.数据的大小对写效率有一定的影响,400字节和100字节的数据在写入数据时,速度差别为3:2左右,读数据效率差别较小。
6.客户端程序多进程与单进程对效率影响差别很小。甚至过多客户端进程写入时,反而影响效率。
7.数组对象转成字符串存入能可以节约一半左右的空间,但在效率方面的提高非常有限,仅在本机上写数据上有所提高。
8.在数据可压缩性较好时,可以大量节省空间和时间。但可压缩性不太好时,几乎没有差别。
9.mcdb根据硬件的情况,对应着相应的性能瓶颈。在方案1中,存放3G以下数据量能得到最佳性能,方案2则在6G以下。可以启动多个进程来解决单个文 件太大的问题。
10.单线程连接时,mcdb出错的概率比较低,在20次/1千万左右
11.如果将log全都删除,重启数据库会失败。可以在启动时用-E选项,由mdb自动管理日志。
12.并发时,mdb不是一个可靠db,有一定的出错率,不能独立 作为db使用,可作为大缓存。
13.mdb对高并发的支持并不好,读写分离解决不了问题,客户端如使用并发的长连接不断地读写,长连接数保持在50左右时效率是可靠的。
四.参考:
1.memcachedb官方测试结果: http://memcachedb.org/benchmark.html
2.Tokyo Cabinet的测试结果和介绍:http://blog.s135.com/read.php?362&guid=9
3.某网友的Tokyo Cabinet测试:http://blog.zol.com.cn/861/article_860439.html 结果比我在基于Tokyo Tyrant的测试好看多了,但也明确表示在200万数据以后变慢很多。
官网:http://memcachedb.org/
作者的讨论组:http://groups.google.com/group/memcachedb
安装和启动指南:http://blog.csdn.net/simonlsy/archive/2008/01/07/2027940.aspx
[转自: http://blog.sina.com.cn/s/blog_403b3b8f0100coe7.html ]
发表评论
-
XMemcached使用 [转]
2012-02-05 23:11 1348Xmemcached 一、 XMemcached ... -
在CentOS 5.6上编译安装Memcached
2012-02-05 23:10 902首先上一个memcached原理图,让不了解memcached ... -
memcachedb应用:编译以及安装【转】
2011-04-26 21:25 898memcachedb跟memcache一样,网络socket数 ... -
轻量级持久存储系统 MemcacheDB (转载)
2011-04-26 19:53 838注:memcached可能简称mc,memcachedb可能简 ... -
MemcacheDB, Tokyo Tyrant, Redis performance test 性能测试【转】
2011-04-25 20:10 1148ming1016@gmail.com ... -
memcachedb内网测试报告之一:全写全读报告
2011-04-25 16:31 890当然此测试环境中的各组件并没有经过任务优化配置,全是采用官网默 ... -
memcachedb 安装笔记【转】
2011-04-25 16:11 9582010年06月18日 数据库 , 缓存系统 me ... -
Sina的开源项目:Memcachedb与NCache【转】
2011-04-25 15:21 1260http://hi.baidu.com/zeorliu/b ... -
初步测试memcachedb时碰到的问题
2011-04-25 15:18 1494今天在内网搭建memcachedb ... -
memcachedb应用指南一【转】
2011-04-25 13:31 729memcachedb应用指南一:为 ... -
linux安装memcachedb服务【转】
2011-04-25 12:53 1276memcached是一个不错的分布式内存缓存系统,并且提供丰富 ... -
轻量级持久存储系统 MemcacheDB 详细介绍【转】
2011-04-25 11:49 937注:memcached可能简称mc,memcachedb可能简 ... -
持久存储系统MemcacheDB的安装,配置 - [DB]【转】
2011-04-25 11:40 844memcachedb是什么 mcdb是一款分布式键值 ... -
memcachedb的缓存解决方案【转】
2011-04-25 11:37 653问题示例: 网站有千万个网页文件需要存储,占用空间大约有 ... -
memcachedb介绍、编译以及安装【转】
2011-04-25 10:51 493memcachedb 故名思义就是 ... -
试装memcachedb,整理了下安装过程【转】
2011-04-25 10:49 640文章作者:Enjoy 转载请注明原文链接。 ...
相关推荐
### Memcachedb:全面解析与应用实践 #### 一、Memcachedb简介 **Memcachedb** 是一种分布式键值存储系统,专为持久化设计。它不是传统的缓存解决方案,而是一个完整的、用于持久化的 memcached 变体。与 ...
- 通过这些命令,开发者可以快速测试和调试 `memcachedb` 实例。 4. **API 使用** - `memcachedb` 提供多种语言的客户端库,如 C、Python、Java 和 PHP,使得开发者能够轻松地在应用中集成缓存功能。 - API 包含...
这个名为"memcachedb-1.2.0.tar.gz"的压缩包包含了该版本的源代码及相关文件,是开发者研究和使用Memcachedb的重要资源。 1. **键值存储系统**:Memcachedb是键值存储系统的一个代表,这种系统以键(key)为索引,...
在提供的`memcachedb-master`压缩包中,包含了源代码和其他相关资源,可以用于编译、安装和测试Memcachedb。通过深入研究源代码,开发者可以更好地理解其内部工作原理,并可能进行定制化的修改和扩展。 总结来说,...
在Ubuntu 9.04中安装Memcachedb是一个相对直接的过程,但如果希望在系统上顺利运行Memcachedb,用户需要了解一些前置知识,包括对...理解Memcachedb的工作原理及性能特点,有助于评估其是否适合特定的项目需求。
Memcached VS Redis:2者究竟有哪些区别,什么场景下应用那种类型的缓存服务器。
- **纵切数据库**:将部分表如user_relation、notice等剥离出来,放置于独立的数据库中,并通过MemcacheDB消息队列来实现异步写入。 - **异地机房尝试**:为了解决跨机房数据访问的问题,尝试在不同地理位置设置机房...
自述文件 快速将JSON Blob加载到或。 给定一个文件,请使用JSON文档中的值作为键,并将其值设置为JSON Blob。 注意:不支持嵌套键。 安装 ...或通过安装。 ... -addr="127.0.0.1:11211": hostport of memcache ...
这样做减少了服务中心的压力,使得服务应用端可以直接与目标服务通信,而不需要通过服务中心进行路由。这种设计考虑了集群环境,以应对服务元信息的动态变化。 服务中心在DSF中的职责主要集中在服务的管理和监控上...
这种设计减少了服务中心的压力,使其主要负责服务管理和监控。 服务查找模块负责与MemcacheDB的通信,根据服务模型进行过滤查找。为了支持未来可能的查找方式切换,如基于分布式文件系统或本地缓存,设计时需要考虑...
Memcache是一个高性能、高并发的分布式内存缓存系统,主要用于缓解数据库读压力。它是由C语言编写的开源软件,设计简洁,代码量小,具有约2000行代码。Memcache主要作用是提高数据访问速度,尤其适用于处理大量热点...
#### 一、NoSQL概述及应用情况 NoSQL(Not Only SQL / Non-relational)是指一类非关系型数据库管理系统,它与传统的SQL数据库不同,不保证关系数据库的ACID特性(原子性、一致性、隔离性、持久性)以及JOIN操作,...
- **NoSQL**:代表“Not Only SQL”,是一类非关系型数据库的总称,它们放弃了部分RDBMS的传统特性,比如固定的表模式、SQL查询语言等,转而采用更灵活的数据模型和可扩展性更强的设计。 2. **NoSQL的优势**: - ...
这种架构不仅提高了系统的可用性,还能够分担读取压力。 ##### 1.3.4 性能 Redis是一个内存数据库,所有数据都存储在RAM中,因此具有非常高的读写速度。此外,Redis还利用了单线程模型和非阻塞I/O机制,进一步提升...
3. **memcachedb**:一种高性能的嵌入式键值存储系统,结合了memcached的速度优势与ACID事务特性,适用于需要高速缓存的应用场景。 4. **Cassandra**:一个分布式NoSQL数据库系统,支持横向扩展和高可用性,特别适合...
Memc ac hed客户端(mc ) 缓存式的Web应用程序架构 性能测试 dbc ac hed Memcached 和 dbcached 在功能上一样吗? 列存系列 Hadoop之Hbase 耶鲁大学之HadoopDB GreenPlum FaceBook之Cassandra Cassandra特点 Keyspace ...
- **缓存**:Redis常被用作Web应用的缓存层,以减少对后端数据库的访问压力。 - **会话存储**:在分布式环境中,使用Redis存储用户会话信息可以实现跨服务器的会话共享。 - **消息队列**:Redis提供了列表数据结构,...
对于粘贴和 URL 的存储,我们使用带有 cmemcached python 插件的 memcachedb 和 memcached,但是我们正在努力使其更加模块化。 所有粘贴和 URL 都使用 MsgPack 进行序列化。 安装和配置 目前,您需要 Python 2.7 ...