OceanBase是一个支持海量数据的高性能分布式数据库系统,实现了数千亿条记录、数百TB数据上的跨行跨表事 务,由淘宝核心系统研发部、运维、DBA、广告、应用研发等部门共同完成。在设计和实现OceanBase的时候暂时摒弃了不紧急的DBMS的功能,例如 临时表,视图(view),研发团队把有限的资源集中到关键点上,当前 OceanBase主要解决数据更新一致性、高性能的跨表读事务、范围查询、join、数据全量及增量dump、批量数据导入。[1]
目前OceanBase已经应用于淘宝收藏夹,用于存储淘宝用户收藏条目和具体的商品、店铺信息,每天支持4~5千万的更新操作。等待上线的应用还包括CTU、SNS等,每天更新超过20亿,更新数据量超过2.5TB,并会逐步在淘宝内部推
OceanBase功能
OceanBase设计和实现的时候暂时摒弃了不紧急的DBMS的功能,例如临时表,视图(view),研发团队把有限的资源集中到关键点上,当前OceanBase主要解决数据更新一致性、高性能的跨表读事务、范围查询、join、数据全量及增量dump、批量数据导入。
OceanBase数据访问特点
虽然数据总量比较大,但跟许多行业一样,淘宝业务一段时间(例如小时或天)内数据的增删改是有限的(通常一天不超过几千万次到几亿次),根据这个特点,OceanBase把一段时间内的增删改等修改操作以增量形式记录下来(称之为动态数据,通常保存在内存中),这样也使得了主体数据在一段时间内保持了相对稳定(称之为基准数据)。
由于动态数据相对较小,通常情况下,OceanBase把它保存在独立的服务器UpdateServer的内存中。以内存保存增删改记录极大地提高了系统写事务的性能。此外,假如每条修改平均消耗100 Bytes,那么10GB内存可以记录100M(即1亿)条修改,且扩充UpdateServer内存即增加了内存中容纳的修改量。不仅如此,由于冻结后的内存表不再修改,它也可以转换成sstable格式并保存到SSD固态盘或磁盘上。转储到SSD固态盘后所占内存即可释放,并仍然可以提供较高性能的读服务,这也缓解了极端情况下UpdateServer的内存需求。为了应对机器故障,动态数据服务器UpdateServer写commit log并采取双机(乃至多机)热备。由于UpdateServer的主备机是同步的,因此备机也可同时提供读服务。
因为基准数据相 对稳定,OceanBase把它按照主键(primary key,也称为row key)分段(即tablet)后保存多个副本(一般是3个)到多台机器(ChunkServer)上,避免了单台机器故障导致的服务中断,多个副本也提 升了系统服务能力。单个tablet的尺寸可以根据应用数据特点进行配置,相对配置过小的tablet会合并,过大的tablet则会分裂。
由于tablet按主键分块连续存放,因此OceanBase按主键的范围查询对应着连续的磁盘读,十分高效。
对于已经冻结/转储的动态数据,OceanBase的ChunkServer会在自己不是太繁忙的时候启动基准数据与冻结/转储内存表的合并,并生成新的基准数据。这种合并过程其实是一种范围查询,是一串连续的磁盘读和连续的磁盘写,也是很高效的。
传统DBMS提供了强大的事务性、良好的一致性和很短的查询修改响应时间,但数据规模受到严重制约,缺乏扩展性;现代云计算提供了极大的数据规模、良好的扩展性,但缺乏跨行跨表事务、数据一致性也较弱、查询修改响应时间通常也较长,OceanBase的设计和实现融合了二者的优势:
UpdateServer:类似于DBMS中的DB角色,提供跨行跨表事务和很短的查询修改的响应时间以及良好的一致性。
ChunkServer:类似于云计算中的工作机(如GFS的chunk server),具有数据多副本(通常是3)、中等规模数据粒度(tablet大小约256MB)、自动负载平衡、宕机恢复、机器plug and play等特点,系统容量及性能可随时扩展。
MergeServer:结合ChunkServer和UpdateServer,获得最新数据,实现数据一致性。
上述的DBMS和云计算技术的优势互补使得OceanBase既具有传统DBMS的跨行跨表事务、数据的强一致性以及很短的查询修改响应时间,还有云计算的海量数据管理能力、自动故障恢复、自动负载平衡以及良好的扩展性。
OceanBase当前在淘宝的应用
OceanBase现在已经应用于淘宝收藏夹,用于存储淘宝用户收藏条目和具体的商品、店铺信息,每天支持4~5千万的更新操作。等待上线的应用还包括CTU、SNS等,每天更新超过20亿,更新数据量超过2.5TB,并会逐步在淘宝内部推广,也期待外部合作者。
相关推荐
Python链接Oceanbase数据库通常涉及到使用特定的驱动程序,这些驱动程序是Java编写的,因为Oceanbase的客户端库主要以Java接口提供。在Python环境中,我们可以借助Jython或使用桥梁技术如`jdbc4py`来调用Java的jar包...
OceanBase 是一款分布式数据库系统,由阿里巴巴集团研发,主要用于处理大规模数据事务处理和分析查询。其设计目标是提供高可用性、高性能、可扩展性和低成本的数据库服务。在这个"Oceanbase-all-in-one-4.2.0.0一键...
《OceanBase-V4.2.1数据库文档》是一份全面介绍OceanBase数据库系统V4.2.1版本的综合资料,包含了多个方面的内容,旨在帮助用户深入理解和使用这个分布式数据库系统。以下是根据提供的文件名提炼出的相关知识点: 1...
OceanBase导入导出工具用法 OceanBase是一款开源的关系型数据库管理系统,具备高性能、高可用性和高扩展性的特点。OceanBase提供了多种数据导入和导出工具,包括obdumper、obloader、obimport等。本文将详细介绍...
本教程将详细介绍如何在银河麒麟操作系统上安装OceanBase 3.1,这是一款分布式数据库系统,特别适合处理大规模数据并发和高可用性需求。 首先,确保你的银河麒麟操作系统是最新的。通过运行系统的更新工具,检查并...
《OceanBase Developer Center 4.1.0-bp Win64JRE 安装指南》 OceanBase Developer Center是一款专为开发人员设计的集成开发环境(IDE),它提供了丰富的功能,便于开发、测试和管理OceanBase数据库系统。4.1.0-bp...
OceanBase OBCP认证是针对OceanBase数据库管理与操作的专业认证,由蚂蚁金服开发的分布式数据库系统。这个认证旨在验证个人对OceanBase数据库的深入理解和实战能力,涵盖了数据库的基础知识、架构、安装配置、运维、...
OceanBase 0.4.2是一款由支付宝(中国)网络技术有限公司的OceanBase团队研发的可扩展分布式关系数据库管理系统。在正式开始安装OceanBase 0.4.2之前,文档要求阅读者对OceanBase的基本概念有所了解,并且具备一定的...
OceanBase的产品体系较为丰富,提供了包括OceanBase分布式数据库、OceanBase工具体系、OceanBase云服务和OceanBase数据库一体机等。通过这些产品,用户可以根据自身的业务需求和部署环境选择最适合的方案。特别地,...
《OceanBase 0.4.2 全套文档》是一份详尽的参考资料,涵盖了OceanBase数据库系统在0.4.2版本中的各个方面。这个压缩包包含了一系列的PDF文档,旨在帮助用户理解、安装、配置、操作以及优化OceanBase数据库。下面将...
OceanBase 官方共享培训文件 OceanBase 官方共享培训文件是 OceanBase 数据库认证专员(OBCA)认证培训课程的第一章,主要介绍了分布式数据库与集中式数据库的差异。 分布式数据库与集中式数据库的差异 Ocean...
《OceanBase设计规范与数据架构指南》是一份详细介绍OceanBase分布式关系型数据库系统的设计理念、架构及优势的文档。OceanBase是由阿里巴巴/蚂蚁金服研发的一款创新性数据库系统,旨在结合传统关系型数据库的功能性...
标题 "oceanbase-OAT安装" 指的是在计算机系统上进行OceanBase的OAT(OceanBase Administration Tool)的安装过程。OceanBase是一个分布式数据库系统,主要用于处理大规模数据存储和事务处理。OAT则是其配套的管理...
### OceanBase企业版v3部署相关知识点 #### 一、硬件配置要求 针对**OceanBase企业版v3**的部署,官方提供了明确的最低硬件配置要求。这些要求旨在确保系统的稳定运行,避免因资源不足而引发的问题。 1. **OCP...
OceanBase OBCA认证题库知识点详解: 1. OceanBase是一个分布式关系型数据库,支持高并发和高可用性的场景。题库是针对OBCA(OceanBase Certified Associate)的认证考试,涉及的知识点覆盖了OceanBase的基本概念、...
### OceanBase基本原理与架构详解 #### 一、OceanBase简介与发展历程 ##### OceanBase概述 OceanBase是一款由中国阿里巴巴集团及旗下蚂蚁金服自主研发的关系型数据库管理系统。它基于分布式架构设计,利用普通的PC...
1、OceanBase OBCA考试认证题库 2、资源内容包括多选题、单选题、判断题,约260道常见题目; 3、适合需要考OceanBase OBCA初级考试认证的人员;
oceanbase 单机部署配置文件
OceanBase实践练习一 OceanBase是一个分布式关系数据库管理系统,它提供了高性能、可扩展性强和高可用性的数据库解决方案。下面是一个OceanBase实践练习的一些重要知识点总结: 1.OceanBase集群部署 OceanBase...
"OceanBase 1.0 分布式技术架构" OceanBase 1.0 作为金融级分布式数据库一直备受瞩目,该数据库架构的设计和实现对整个金融行业的影响非常大。在本文中,我们将详细介绍 OceanBase 1.0 的分布式技术架构,从技术...