摘要: 来自阿里云RDS团队的论文“**TcpRT: Instrument and Diagnostic Analysis System for Service Quality of Cloud Databases at Massive Scale in Real-time” (TcpRT:面向大规模海量云数据库的服务质量实时采集与诊断系统)**被数据库顶会SIGMOD 2018收录。
ACM SIGMOD数据管理国际会议是由美国计算机协会(ACM) 数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。
SIGMOD和另外两大数据库会议VLDB、ICDE构成了数据库领域的三个顶级会议。相对而言,SIGMOD比另外两个会议的含金量更高,被录取的难度更大。ACM SIGMOD的论文录取率是很低的,平均录取率大约仅为15%-17%。
来自阿里云RDS团队的论文“TcpRT: Instrument and Diagnostic Analysis System for Service Quality of Cloud Databases at Massive Scale in Real-time” (TcpRT:面向大规模海量云数据库的服务质量实时采集与诊断系统)被数据库顶会SIGMOD 2018收录。
TcpRT论文介绍了RDS天象系统在云数据库SLA数据采集、服务质量指标计算、异常检测、故障根因分析领域的创新工作,以及在各类云平台上大规模部署自动化服务的客户实践经验。
评委评价
I have plenty of experience with manual anomaly detection. That has wasted much time for me at work, so I liked what you described.
下载中文版:http://click.aliyun.com/m/1000000351/
下载英文版:http://click.aliyun.com/m/1000000352/
简介
随着企业上云趋势的日益热化,作为产业核心组件的数据库,已成为各大云计算公司增长最快的在线服务业务。作为中国第一大云数据库厂商,我们RDS团队致力于为用户提供稳定的云数据库服务。从本质上看,RDS是一个多租户DBaaS平台,利用轻量级KVM、Docker镜像等资源隔离技术将用户所购买的数据库实例部署在物理机上,按需分配资源并进行自动升降级,实现一套完全自动化的智能运维管理。
云数据库对客户业务的稳定性至关重要,因此快速发现云数据库性能出现异常,及时定位异常原因是云数据库厂商的一个挑战。TcpRT是阿里云数据库用来监控和诊断数据库服务质量的一个基础设施。TcpRT从主机TCP/IP协议栈的壅塞控制采集trace数据,计算数据库延迟和网络异常,在后台流式计算平台进行大规模实时数据分析和聚合,通过统计指标历史数据的柯西分布发现异常点,并通过同一台主机、交换机、proxy下所有实例一致性趋势的比例来计算不同组件发生异常的概率。
到目前为止,TcpRT以每秒采集2千万条原始trace数据、每天后台处理百亿吞吐数据、秒级检测异常的卓越性能在阿里云持续稳定运行三年。
本文贡献
- 提出了一种新的对数据库服务质量进行采集的方法,基于内核壅塞模块实现,可以非侵入性、低代价的采集基于停等协议的关系数据库的per connection的延迟、带宽,分析用户使用数据库的模型(短连接和长连接),并且可以端到端的记录和量化基础网络服务质量对数据库服务质量的影响,包括丢包率、重传率。
- 我们开发了一套对采集的原始数据进行数据清洗、过滤、聚合、分析的流式计算系统,系统可以做到水平扩展、容错性、实时性、Exactly Once,具有和其他大数据平台例如EMR、MaxCompute进行数据交换的能力
- 我们提出了一个新的算法对TcpRT数据进行分析,来发现数据库的服务质量有无异常,并且对异常事件的根因进行定位
会议将于6月10日在美国休斯敦召开,论文也会公开发表,以下是相关信息。
Title:SIGMOD/PODS '18 International Conference on Management of Data
Houston, TX, USA — June 10 - 15, 2018
Pages:1846
Sponsor: SIGMOD ACM Special Interest Group on Management of Data
Publisher:ACM New York, NY, USA
ISBN:978-1-4503-4703-7
Conference:MODInternational Conference on Management of Data
相关推荐
阿里云RDS数据库恢复到本地自建数据库需要按照步骤执行,需要准备阿里云数据库备份实例、本地服务器上下载数据库和xtrabakcup工具。通过本文档,开发者和数据库管理员可以轻松地恢复阿里云RDS数据库到本地自建数据库...
* RDS实例:云数据库RDS实例是阿里云提供的一种关系型数据库服务,支持MySQL、PostgreSQL、SQL Server、Oracle等多种数据库引擎。 * 数据恢复:数据恢复是指从备份中恢复数据,以恢复因误操作等原因导致的数据丢失的...
阿里云RDS数据库备份集批量下载脚本,配合CRONTAB可以实现按指定时间自动下载RDS MySQL的备份文件到本地
阿里云rds备份的url链接自动下载,可配合定时脚本,定时拉取rds备份数据。
阿里云RDS数据库恢复到本地自建数据库,网上很多都是无法恢复的,此文档是本人经常一个上午的恢复总结写出来的。只要按步骤执行,保证可用。
基于java与阿里云RDS数据库对于天天基金网上的基金公告进行爬取与查询源码.zip 基于java与阿里云RDS数据库对于天天基金网上的基金公告进行爬取与查询源码.zip 基于java与阿里云RDS数据库对于天天基金网上的基金公告...
阿里云云栖大会分享PPT中提到了如何优化阿里云*** Server的CPU使用率。具体来说,主要分享内容包括:数据类型转换、非SARG查询、统计信息维护、参数嗅探问题、以及TOP SQL分析。 数据类型转换在数据库优化中是一个...
阿里云专有云Enterprise版云数据库RDS V3.1.0 产品简介 阿里云专有云Enterprise版云数据库RDS V3.1.0是阿里云公司推出的云数据库服务,旨在为企业提供高性能、安全、可靠的数据库解决方案。下面是对该产品的详细...
云数据库RDS运维指南是阿里云专有云Enterprise版云数据库RDS V3.1.0 的操作手册,该手册提供了云数据库RDS的架构、安装、配置、管理、维护、故障排除等方面的指导。 云数据库RDS架构:云数据库RDS是一种基于云计算...
藏经阁-袋鼠云基于阿里云RDS的数据库架构实践 本资源摘要信息主要介绍袋鼠云基于阿里云RDS的数据库架构实践,涵盖了袋鼠云数据库服务总监俊达的个人简介、支付宝MySQL运维体系建设、RDS运维、余额宝项目轻松筹...
WEB网站应用连接阿里云RDS数据库实例(小白也能学会的通俗易懂版),为什么要发这个阿里云RDS数据库实例呢,有的同学可能买了阿里云RDS实例不太会用,看了阿里云配置步骤还是不会连接,所以就整理了一下,就一张PDF...
"阿里云专有云企业版V3.12.0云数据库RDS用户指南MySQL版" 本文档是阿里云专有云企业版V3.12.0云数据库RDS用户指南MySQL版,目的是帮助用户快速上手使用云数据库RDS产品。下面是本文档的关键知识点总结: 法律声明 ...
标题为“阿里云RDS for MySQL的若干优化”的文章,由彭立勋撰写,他是阿里巴巴云计算集团数据库技术组的数据库专家。本文将围绕这一主题,对文章中提到的各个知识点进行详细探讨。 ### 1. 数据库优化的重要性 ...
阿里云在法律声明中明确了用户在使用云数据库RDS时的权利和义务,包括下载、使用、传播和修改等方面的规定。 在法律声明中,阿里云还明确了云数据库RDS的所有权和知识产权,包括商标权、专利权、著作权、商业秘密等...
袋鼠云-数据库服务总监 俊达在2017杭州云栖大会中做了题为《袋鼠云基于阿里云RDS的数据库架构实践》的分享,就余额宝项目,轻松筹分布式改造,金融云迁移做了深入的分析。
阿里云数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务。基于飞天分 布式系统和全SSD盘高性能存储,支
阿里云专有云企业版V3.8.1云数据库RDS版技术白皮书20190910 本文档是阿里云专有云企业版V3.8.1云数据库RDS版技术白皮书,旨在为用户提供关于阿里云云数据库RDS版的详细信息和技术指南。 法律声明 阿里云对用户...