`
biansutao
  • 浏览: 53642 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Beansdb key,value数据存储

阅读更多

http://code.google.com/p/beansdb/

 

简介

BeansDB 是一个主要针对大数据量、高可用性的分布式KeyValue存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性(弱),一个简化版的Dynamo。

它采用类似memcached的去中心化结构,在客户端实现数据路由。目前只提供了Python版本的客户端,其它语言的客户端可以由memcached的客户端稍加改造得到。

Google Group: http://groups.google.com/group/beandb/

更新

2009.12.29 第一个公开版本 0.3

特性

高可用:通过多个可读写的用于备份实现高可用

最终一致性:通过哈希树实现快速完整数据同步(短时间内数据可能不一致)

容易扩展:可以在不中断服务的情况下进行容量扩展。

高性能:异步IO和高性能的KeyValue数据TokyoCabinet

可配置的可用性和一致性:通过N,W,R进行配置

简单协议:Memcache兼容协议,大量可用客户端

客户端

目前只提供了Python版本的客户端,在python目录中,该目录中各文件的左右如下:

dbclient.py BeansDB的客户端,由memcached的客户端简单封装而成

status.py 查看BeansDB的状态,各个节点的数据分布,以及同步状态

sync.py 同步各节点

httpd.py HTTP方式访问BeansDB的内容(目前只有GET方式)

store.pyx, dbserver.py test.py setup.py

Python 版本的BeansDB,核心部分是C实现

 

代码示例:

from dbclient import Beansdb

# three beansdb nodes on localhost
BEANSDBCFG = {
    "localhost:7901": range(16),
    "localhost:7902": range(16),
    "localhost:7903": range(16),
}

db = Beansdb(BEANSDBCFG, 16)

db.set('hello', 'world')
db.get('hello')
db.delete('hello')

性能

在小数据集上,它跟memcached一样快:

# memstorm -s localhost:7900 -n 1000
Num of Records      : 10000
Non-Blocking IO     : 0
TCP No-Delay        : 0

Successful   [SET]  : 10000
Failed       [SET]  : 0
Total Time   [SET]  : 0.45493s
Average Time [SET]  : 0.00005s

Successful   [GET]  : 10000
Failed       [GET]  : 0
Total Time   [GET]  : 0.28609s
Average Time [GET]  : 0.00003s

分享到:
评论

相关推荐

    beansdb设计与实现

    BeansDB是一款由豆瓣开发的分布式存储系统,它主要被设计为一种高效的键值(Key-Value)数据库,具有良好的可扩展性和高可用性特点。该系统的目标是提供一个既能够应对大规模数据存储需求,又能够保证在部分组件出现...

    Inside BeansDB

    在数据存储方面,BeansDB采用了Tokyo Cabinet作为底层存储引擎,这是一种轻量级的Key-Value数据库,具有简洁的API和高效的Hash索引机制,能够显著减少I/O操作。同时,BeansDB还支持数据压缩和多文件存储,以提高数据...

    beansdb-0.5.3-中文源注释[Original].rar

    源码中对一些部门说得很详细,包括几个核心的数据结构,以及一些核心的宏,还有,在一些函数中,有一些关键的代码及数字做了详细的分析。注释中有提到过in_time的地方,实际上融入了我所添加的功能,可能有部分没有...

    cpp-BeansDB豆瓣公司另一个分布式键值存储系统

    BeansDB 是一个主要针对大数据量、高可用性的分布式KeyValue存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性(弱),一个简化版的 Dynamo。 它采用类似memcached的去中心化结构,在客户端实现数据...

    Inside-BeansDB.rar_inside

    BeansDB 是一个强大的分布式键值存储系统,设计用于处理海量数据并确保高可用性。它在大数据领域扮演着重要角色,因为它的核心特性是能够高效地存储和检索大量的键值对。这个系统的设计灵感来源于Amazon的Dynamo,但...

    BeansDB代理和监控器Beanseye.zip

    BeansDB 是一个分布式键值存储系统,主要用于支持大规模的数据存储和检索。在豆瓣(Douban)的业务场景中,它被用来处理大量的用户数据和元数据。Beanseye 是针对 BeansDB 的一个重要补充,它是一个由 Go 语言编写的...

    豆瓣网海量数据存储架构

    相比之下,BeansDB采用了去中心化的设计,每个区间都对应多个节点,通过客户端写入和读取操作实现了数据的冗余存储。BeansDB通过HashTree机制实现了快速的数据同步,大大提升了系统的可靠性和性能。 #### 大文件的...

    NoSQL数据库笔谈

    Key Value / Tuple 存储 Amazon之SimpleDB Chordless Redis Scalaris Tokyo cabinet / Tyrant CT.M Scalien Berkley DB MemcacheDB Mnesia LightCloud HamsterDB Flare 最终一致性Key Value存储 Amazon之Dynamo 功能...

    (word完整版)NoSQL数据库笔谈.doc

    3. Dynamo、BeansDB、Voldemort等是Key-Value存储,提供高可用性和容错性。 4. CouchDB、MongoDB等是文档存储,支持JSON格式数据,适用于半结构化数据存储。 应用篇: 1. eBay、淘宝、Flickr、Twitter等大型网站...

    NoSQL数据库学习教程.pdf

    Flare最终一致性 Key Value 存储: Amazon 之 Dynamo是指使用Amazon之Dynamo来实现最终一致性键值存储。 功能特色是指使用Dynamo的功能特色。 架构特色是指使用Dynamo的架构特色。 BeansDB是指使用BeansDB来实现...

    大数据知识竞赛试题借鉴.doc

    - BeansDB是中国豆瓣社区开发的分布式存储系统。 - NewSQL数据库如MemSQL、TokuDB提供类似关系型数据库的ACID特性,但支持更大规模的数据。 - NoSQL数据库如Bigtable、Dynamo不使用传统的关系模型,适应大数据...

    一切为了分布式——2009年Web后端技术回顾.pdf

    这一时期的关键话题是NoSQL运动,它倡导使用非关系型数据库存储数据,尤其是以键值对(key-value)的方式。NoSQL的兴起源于对高并发、灵活表结构变更需求的满足,以及在小数据访问性能上的显著提升,相较于传统的SQL...

    ImageServer:使用Beansdb作为后端的图像服务

    beansdb -p 7901 -d -P/tmp/beansdb1.pid -L/tmp/beansdb1.log -H /home/gfreezy/beans/db/db1 -vv beansdb -p 7902 -d -P/tmp/beansdb2.pid -L/tmp/beansdb2.log -H /home/gfreezy/beans/db/db2 -vv 自定义设置。...

    大数据知识竞赛试题.doc

    - BeansDB是中国豆瓣社区自主开发的分布式键值存储系统。 5. 数据挖掘与可视化: - 数据挖掘是从大量数据中提取有价值信息的过程,涉及数据清洗、预处理、模式识别等步骤。 - 数据源的质量、量级、噪声和相关性...

Global site tag (gtag.js) - Google Analytics