在实现levelDB挂载成MySQL引擎时,发现在实际存储是key-value格式时候,MySQL的异构数据同步,可以更简单和更通用。
以tair为例,简要描述一下以MySQL为基础的一种方案。
所谓异构数据同步,是指应用只更新MySQL,而由后端的某些机制将这些更新应用到其他数据存储服务上。
1、MySQL-Tair 引擎
a) 使用
b) 说明
这不是一个“存储引擎”,实际上数据存储在tair服务器上。执行insert/update/delete时,只是将对应的动作put /remove到tair服务器。当然这个过程对用户是透明的。
2、MySQL-Tair 引擎怎么用于更新tair数据
首先,数据更新有两种方式,同步更新和异步更新。
a) 异步更新
先说异步更新。这个类似“读binlog来更新数据”的方案。如果使用MySQL-Tair引擎,结构可以如下:
说明:tair表只存在Slave上,与主库上要更新的表同名。
完备性:以现在主库都是row格式的binglog结构为背景,这里Slave上收到的都会是这个更新的完整行信息,从中取出需要的key和value即可。
b) 同步更新
同步更新的意思,是应用端更新MySQL, 在MySQL和tair同时更新完成后,MySQL才返回用户更新成功。
这种模式更像将tair作为MySQL的网络级别缓存服务。当然应用在读取的时候可以绕过MySQL直接访问tair,则只是作为一种更新方案。
这种模式能够让更新后的下一次访问直接命中tair中的缓存数据。异步则无法保证。
结构如下:
说明:这里实体数据表与tair表在同一个数据库,表结构相同,引擎不同。应用还是更新数据表,用触发器触发相同的语句更新tair表。
完备性:同样的,触发器会得到这个更新的新行全值。
3、MySQL同步的优点
这种有以下优势,即使只考虑异步更新模式:
a) 不需要自己模拟一个MySQL的从库、不需要维护连接(MySQL自带)
b) 不需要解析binlog(什么时候binlog切换都要关心,要做的事情太多)
c) 更方便的监控。MySQL现有的监控接口,直接得到tps、延迟时间,同步点。
d) 更方便的管理。如果主库挂了,一个Change master命令即可;想暂时停更新,stop slave、start slave。
e) 更方便的扩展。 直接利用MySQL的级联主从。
当然还有读binlog方案无法实现的同步选择。
4、其他
不限于tair,只是举例。
如果后端是一个可靠存储,如TFS,则可以当作一个存储表来使用,读写都是SQL接口。与直接更新TFS有什么区别?简单说一个,可以直接跟MySQL里的实体表做join。
- 大小: 67.8 KB
- 大小: 12.9 KB
- 大小: 15.8 KB
分享到:
相关推荐
在Tair出现之前的很长一段时间里,像redis、memcache这些知名NoSql数据库是不支持分布式的,在这样的背景下,由淘宝网自主开发并在2010.6开源的一个高性能、高扩展、高可靠分布式缓存,类似map的key/value结构,在...
常用缓存的对比。 主要分析ehcache radis tair间的对比。
- 数据传输和同步:包括databus、Redis-transfer、mysql、redis等组件,确保数据在集群间的高效流转。 - 测试工具:如Gtest、gcover、valgrind等,用于测试和代码覆盖率分析。 - 性能基准测试:Bench mark和...
“tair-client”是专门为Java开发者设计的,用于与Tair服务端进行交互的客户端库。它实现了对Tair数据存储系统的接口调用,使得Java开发者能够方便地在应用程序中集成Tair的功能,如键值存储、序列化、缓存管理等。...
同时,为防止数据丢失,tair提供了持久化机制,如RocksDB等持久化引擎,保证了数据的安全性。 3. 数据一致性:tair支持多种一致性模型,如弱一致、序列一致等,以满足不同业务场景的需求。在分布式事务处理上,tair...
Tair的存储引擎抽象层使得可以方便地更换底层存储引擎,如bdb、tc、redis、leveldb或MySQL。 目前Tair主要有以下三种存储引擎: - **mdb**:定位为缓存,支持k/v和prefix操作,类似于memcache。 - **rdb**:同样...
4. **数据同步:** 对于 ConfigServer 的主从配置, 应确保主服务器的数据能够及时同步到从服务器, 以提高集群的可用性和容错能力。 5. **性能优化:** 根据业务需求, 可能还需要对TAIR集群进行更深层次的性能调优, ...
tair 是淘宝自己开发的一个... 为了解决磁盘损坏导致数据丢失, tair 可以配置数据的备份数目, tair 自动将一份数据的不同备份放到不同的主机上, 当有主机发生异常, 无法正常提供服务的时候, 其于的备份会继续提供服务.
maven 淘宝下的jar包啊
总结,Tair服务端源码不仅为我们揭示了分布式Key/Value存储系统的设计原理,还提供了学习高并发、高可用、数据一致性等核心问题的实践案例。深入研究Tair源码,不仅可以提升我们的技术能力,还能为设计和实现自己的...
- **迁移期间服务**:迁移过程中,客户端仍按旧路由表访问,A会将未迁移的数据处理,迁移中的数据会做记录,迁移完成后同步到目标服务器,确保数据一致性。 - **临时分配表**:若Data Server宕机,Config Server会...
以淘宝双十二活动期间的核心数据库为例,面对巨大的用户访问量和高并发的业务需求,传统的服务器架构难以满足性能要求。因此,通过引入SSD等新技术,对数据库进行了优化升级。具体措施包括: - **增大Buffer Pool...
1. 对照表:对照表是一个固定值,需要和每个使用 Tair 的客户端同步的,对照表简介包含两列,第一列为 hash 值,第二列为负责该 hash 值对应数据的 dataserver 节点信息。 2. 客户端交互:客户端在初始化时,从 ...
阿里中间件性能挑战赛初赛-RocketMQ+JStorm+Tair实时统计双11交易金额源码+学习说明.zip阿里中间件性能挑战赛初赛-RocketMQ+JStorm+Tair实时统计双11交易金额源码+学习说明.zip阿里中间件性能挑战赛初赛-RocketMQ+...
ConfigServer负责维护集群中的数据分布信息,DataServer负责数据的存储和复制,Client提供了访问Tair集群的接口,InvalidServer负责对等集群的删除和隐藏操作。 ConfigServer ConfigServer是Tair集群的中心节点,...
分布式缓存系统Tair是一个专为高性能、高可用性设计的键值存储系统。它支持多种存储引擎,但每个系统实例仅能使用一种。Tair的架构由几个关键组件构成,包括config_server、data_server、storage模块以及一些通用...
通过模块化设计,Tair可以方便地添加新功能或进行定制,例如支持Tair的插件系统可以扩展出如Tair-Graph(图数据库)、Tair-Search(搜索引擎)等子系统。 ### 9. 监控与运维 Tair提供了丰富的监控指标和运维工具,...