`
CharlesCui
  • 浏览: 430850 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Couchdb Vs MySQL 性能测试 之 插入数据速度测试

阅读更多
Couchdb:
引用
Apache CouchDB is a distributed, fault-tolerant and schema-free document-oriented database accessible via a RESTful HTTP/JSON API. Among other features, it provides robust, incremental replication with bi-directional conflict detection and resolution, and is queryable and indexable using a table-oriented view engine with JavaScript acting as the default view definition language.


Couchdb是以Rest方式来完成操作的分布式文档数据库,要多Couchdb完成操作的话,必须通过执行Http请求。传统数据库是通过DBAdapter完成消息传递的,那么可以认为:Http请求的效率和传统的DBAdapter请求的效率,在一定程度上影响着Couchdb和传统数据库的性能。

在Couchdb中,拿插入数据来说,每次插一条数据,客户端必须发起一次put请求,Couchdb再接受这个请求并作处理。下面我就要做这样的一次测试,来比较Couchdb和Mysql两种数据库的插入数据的速度。插mysql和couchdb的操作都从客户端发起,mysql和couchdb同时装在一台server上。通过benchmark记录操作耗时。

测试环境:一台server,一台client,

server:DELL1950划分的一台虚拟机,cpu:2,mem:2GB
mysql:Server version: 5.0.67-0ubuntu6 (Ubuntu)
couchdb:Apache CouchDB 0.8.0-incubating (LogLevel=info)
文件系统:

Filesystem    Type    Size  Used Avail Use% Mounted on
/dev/sda1     ext3     85G  1.5G   80G   2% /
tmpfs        tmpfs   1013M     0 1013M   0% /lib/init/rw
varrun       tmpfs   1013M  356K 1012M   1% /var/run
varlock      tmpfs   1013M     0 1013M   0% /var/lock
udev         tmpfs   1013M  2.6M 1010M   1% /dev
tmpfs        tmpfs   1013M     0 1013M   0% /dev/shm

client:普通台式机

测试场景:
1、mysql和couchdb各插入1000条数据对比耗时。
2、mysql和couchdb各插入10000条数据对比耗时。

测试代码如下:

require 'rubygems'
require 'couchdb'
require 'active_record'
require 'active_record/vendor/mysql'
require 'pp'

ActiveRecord::Base.establish_connection(
  :adapter=>"mysql",
  :encoding=>"utf8",
  :database=>"couchdbvsmysql",
  :username=>"root",
  :password=>"******",
  :host=>"1.2.3.4")

#A database must be named with all lowercase characters (a-z), digits (0-9), or any of the _$()+-/ characters
#and must end with a slash in the URL. The name has to start with characters.

server = Couch::Server.new("10.2.226.133", "5984")
server.put("/couchdbvsmysql/", "")

seq1=1
seq2=1

print "-----------------------------------------------------------------\n"
print "                  Insert Records                                   \n"
print "-----------------------------------------------------------------\n"

sql=proc {<<SQL
insert into udb_user(user_id,user_name,creator)
values("#{(seq1+=1).round}","user#{(rand*10**10).round}","CuiZheng#{seq1}")
SQL
}


json=proc{<<JSON
{"user_id":"#{seq2+=1}","user_name":"user#{(rand*10**10).round}","creator":"CuiZheng#{seq2}"}
JSON
}

InsertIntoMysql=proc do |x|
  proc do
    x.times{ActiveRecord::Base.connection.execute(sql.call.gsub("\n"," "))}
  end
end

InsertIntoCouchdb=proc do |x|
  proc do
    x.times{server.put("/couchdbvsmysql/#{seq2}",json.call.gsub("\n"," "))}
  end
end

Benchmark.bm(25) do |x|
  x.report("InsertIntoMysql",&(InsertIntoMysql.call(10**4)))
  x.report("InsertIntoCouchdb",&(InsertIntoCouchdb.call(10**4)))
end


场景一(插入1000条数据测试结果):
-----------------------------------------------------------------

                  Insert Records                                   

-----------------------------------------------------------------

                               user     system      total        real

InsertIntoMysql            0.171000   0.062000   0.233000 (  7.297000)

InsertIntoCouchdb          1.922000   1.219000   3.141000 ( 27.969000)


这里可以看到,Couchdb的确比Mysql的插入速度慢,而且慢很多,四倍的差距。

场景二(插入10000条数据测试结果):
-----------------------------------------------------------------

                  Insert Records                                   

-----------------------------------------------------------------

                               user     system      total        real

InsertIntoMysql            2.187000   0.547000   2.734000 ( 12.953000)

InsertIntoCouchdb        D:/ruby/lib/ruby/1.8/net/http.rb:560:in `initialize': 通常每个套接字地址(协议/网络地址/端口)只允许使用一次。 - connect(2) (Errno::EADDRINUSE)

        from D:/ruby/lib/ruby/1.8/net/http.rb:560:in `open'

        from D:/ruby/lib/ruby/1.8/net/http.rb:560:in `connect'

        from D:/ruby/lib/ruby/1.8/timeout.rb:53:in `timeout'

        from D:/ruby/lib/ruby/1.8/timeout.rb:93:in `timeout'

        from D:/ruby/lib/ruby/1.8/net/http.rb:560:in `connect'

        from D:/ruby/lib/ruby/1.8/net/http.rb:553:in `do_start'

        from D:/ruby/lib/ruby/1.8/net/http.rb:542:in `start'

        from D:/ruby/lib/ruby/1.8/net/http.rb:440:in `start'

         ... 7 levels...

        from F:/MySummary/MyRails/RubyApplication1/lib/CouchdbVsMysqlPerf.rb:54

        from D:/ruby/lib/ruby/1.8/benchmark.rb:177:in `benchmark'

        from D:/ruby/lib/ruby/1.8/benchmark.rb:207:in `bm'

        from F:/MySummary/MyRails/RubyApplication1/lib/CouchdbVsMysqlPerf.rb:52


跑了很多次,都会报“通常每个套接字地址(协议/网络地址/端口)只允许使用一次。”这个异常。这个原因估计是某个请求花了很长的时间没有释放客户端的套接字导致,可能是couchdb那边一时处理不过来了,我猜的。

解释一下benchmark:
lgn21st 写道
benchmark的report显示的信息是:
This report shows the user CPU time, system CPU time, the sum of the user and system CPU times, and the elapsed real time. The unit of time is seconds.
即用户cpu时间,系统时间,用户系统时间合,实际耗时,单位是秒。


跑完之后可以通过浏览器来看一下couchdb的状态:

列出couchdb所有数据库:
http://10.2.226.133:5984/_all_dbs

浏览器显示:
["couchdbvsmysql"]
列出数据库couchdbvsmysql的状态:
http://10.2.226.133:5984/couchdbvsmysql

浏览器显示:
{"db_name":"couchdbvsmysql","doc_count":1000,"doc_del_count":0,"update_seq":1000,"compact_running":false,"disk_size":2376834}

这个是跑插1000条数据后的结果。

通过上面的结果,我随便说说,Couchdb的插入速度的确比Mysql慢。作为一个分布式数据库,Couchdb首先应该解决的问题是:调整Erlang Http服务器的速度,不要出现插入10000条数据时出现的处理不过来的情况(我猜可能是服务器那边响应过长导致),然后找出适合Couchdb的一个文件系统(我想一个文档式数据库的磁盘读写速度应该和文件系统的类型关系很大)。本次测试结果是单台Couchdb,不能和已经部署成分布式的数据库作对比,等Couchdb的高版本支持分布式之后再来测试。




  • 大小: 35.2 KB
分享到:
评论
7 楼 orlaa 2009-02-03  
这里另有一份测试文档,参照里面的测试数据显得Couchdb 比 MySQL 慢50倍,这个比例倒是令人失望
http://docs.google.com/Present?docid=dgpgwtph_31x735rzg7
6 楼 CharlesCui 2009-02-01  
我把它放到博客首页了,所以论坛里找不到。

以后这些技术文章还是放到论坛里面好,博客首页没谁看。
5 楼 CharlesCui 2009-02-01  
lzy.je 写道
嗯,辛苦,预祝顺利。

2个小建议:
1. 能否添加一些并发的验证场景?
2. 如果有资源利用率方面的指标,对验证结果参考意义可能更大。


你看这个是不是你想要的,只不过不是新建,而是查询。

Couchdb 性能测试 之 查询数据
4 楼 lzy.je 2009-02-01  
嗯,辛苦,预祝顺利。

2个小建议:
1. 能否添加一些并发的验证场景?
2. 如果有资源利用率方面的指标,对验证结果参考意义可能更大。
3 楼 CharlesCui 2009-01-31  
系统资源,诸如:CPU,LOAD,Memory以及其他top或者vmstat反映的数据当时并没有监控,因为服务器是一台DELL1950上划分出来的虚拟机,硬件没什么可比性。

年后上班后再搞一下查询和删除的看看。
2 楼 lzy.je 2009-01-31  
netstat -na看看服务端都阻在什么状态了?

good job!
1 楼 lzy.je 2009-01-31  
资源利用率如何?
disk、network IO / CPU / memory ?

相关推荐

    couchdb-to-mysql:CouchDB 和 MySQL 之间的同步

    转换器在 CouchDB 和 MySQL 之间同步数据的小工具为什么? 好吧,我向一个人展示了 CouchDB,第一个问题是……“你能与 MySQL 同步吗?” “PouchDB 可以与 MongoDB/MySQL/我当前的非 CouchDB 数据库同步吗?不能。...

    p2000-couch-to-mysql:P2000 消息从 CouchDB 到 MySQL 数据库的同步脚本

    p2000-沙发到-mysql P2000 消息从 CouchDB 到 MySQL 数据库的同步脚本。 脚本: 应用程序.js CouchDB 和 MySQL 之间的实时同步; 当前未使用; 不如 SYNC-BACK.JS 干净-couchdb.js 只是另一个文件的副本,尚未使用;...

    couchdb-benchmarks:一些用于测试CouchDB性能的基准脚本

    我目前正在这些基准测试上,以获取有关CouchDB扩展属性的第一手数据。 我特别关心磁盘使用情况(弄清楚何时需要分片)和复制速度。 但是,在此过程中,我还将收集其他可能有用的信息,但请记住,我的测试方法将明确...

    CouchDB资料整理

    多版本并发控制(MVCC)是CouchDB的显著特点之一,它允许多个节点进行写操作,而系统会自动检测并解决多个操作之间的冲突。这一特性使得CouchDB非常适合需要并发读写操作的应用场景。 CouchDB支持水平扩展性,这...

    CouchDB权威指南(中文 完整版)

    - **内存缓存**:CouchDB利用内存缓存来加速对经常访问的数据的读取速度。 - **磁盘索引**:通过在磁盘上创建索引来加速数据查询。 - **数据压缩**:对于不常访问的数据,可以启用压缩选项以节省存储空间。 ### 高...

    couchimport:CouchDB导入工具,允许批量插入数据

    插入自定义函数以在写入数据之前添加您自己的更改。 批量写入数据以提高速度。 还可以使用流式JSON解析器读取巨大的JSON文件。 允许使用--parallelism选项一次执行多个HTTP写操作。 安装 要求 node.js = npm ...

    Beginning CouchDB.pdf

    5. **简单易用**:CouchDB的设计理念之一就是简单直观,即使是初学者也能快速上手。 6. **高可用性**:CouchDB支持多副本机制,确保了数据的安全性和系统的可靠性。 #### 三、CouchDB的基础架构 CouchDB的架构主要...

    CouchDB

    MapReduce是CouchDB中最核心的数据处理方式之一,它提供了一种灵活且高效的方式来对大量文档进行聚合分析和查询操作。 ##### 2.1 临时视图(Temporary Views) 临时视图允许开发者在不创建设计文档的情况下执行...

    CouchDB,Python

    CouchDB是一款开源的、基于文档的分布式数据库系统,它以JSON格式存储数据,并使用JavaScript作为查询语言。Python中的CouchDB模块是Python与CouchDB服务器交互的接口,允许开发者使用Python编写代码来操作CouchDB...

    CouchDB权威指南

    - **与关系型数据库(如MySQL)**:CouchDB是非关系型数据库,强调灵活性和可伸缩性,而传统RDBMS侧重于事务一致性。 - **与MongoDB**:两者都是NoSQL数据库,但MongoDB更注重集合操作,而CouchDB更强调文档和视图...

    CouchDB权威指南(带详细目录)PDF

    出版时间:2012年9月1日。 内容简介: 三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的...* 优化CouchDB来适应不断提高的性能和可靠性要求。

    couchdb源码

    CouchDB是一款开源的文档数据库管理系统,以其独特的JSON数据模型、RESTful API和分布式系统设计而闻名。在深入探讨CouchDB源码之前,我们首先理解CouchDB的基本概念和工作原理。 CouchDB的核心是基于JSON...

    apache-couchdb-2.3.1.zip

    Apache CouchDB是一个开源的、基于文档的分布式数据库系统,它采用了JSON作为数据格式,并使用JavaScript进行查询和数据处理。在2.3.1版本中,CouchDB继续提供了一流的可扩展性和灵活性,适用于各种应用程序,特别是...

    辛星 MySQL、Linux、Node、Nginx、Redis、CouchDB、Git 教程 2015

    在2015年的教程中,辛星会讲解MySQL的基础操作,包括创建数据库、数据表,以及插入、查询、更新和删除数据等基本操作。进一步,他将引导学员深入学习数据库设计,如数据库架构设计和性能优化,以及如何进行数据库的...

    BulkInsertBenchmark:用于 MongoDB、CouchDB、ArangoDB 的批量插入基准测试工具。 用 PHP 编写

    一个非常简单的基于 PHP 的基准测试程序,用于比较批量文档插入的速度 沙发数据库 MongoDB 数据库 它将批量文档发送到数据库的批量文档 API: CouchDB 的 bulk_docs HTTP API MongoDB 的 collection-&gt;batchInsert...

Global site tag (gtag.js) - Google Analytics