`
和你在一起
  • 浏览: 682147 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

淘宝iDataForum归来

阅读更多

 

今天参加了淘宝的iDataForum,收获不少。详细的PPT过段时间能发在官方网站上。

Topic 1:淘宝架构的变迁

这个topic主要讲淘宝这几年数据库面临的一些问题以及问题的解决。下面的数据还是老一些的数据。


  • 淘宝现在有10亿种商品。
  • 小文件和图片加起来有1000T
  • CDN流量为138G/s
  • 13亿/天(个人算了下,忙时3w~4w/s)的PV
  • 读写比例大致为10:1
  • 单个核心DB(Oracle+IBM小机+EMC高端存储),处理数的SQL为4w/s
  • 用户中心的api请求数为60亿次/天
  • search index,每秒增量build一次,每天全量build一次。build时间很快,因为数据分散到很多机器。
  • 淘宝现在的核心DB数量小于10个,mysql库有500+个。这个数据很有意义,可以看到在这种业务量级下的服务器数量。还不包括应用服务器和CDN服务器。


  • 使用Oracle Dataguard进行数据备份
  • 淘宝原先是基于lamp构建,后改为java/Oracle等,现在又考虑把一些非核心的使用mysql进行替代。
  • Mysql和Oracle的关系是考虑读写分离,Oracle上主要负责数据存储和持久化,Mysql为读取库(Master-Slave方式)。数据同步时延小于200ms
  • 淘宝对数据进行了垂直拆分的方式,把数据划分为“用户中心”、“商品中心”、“交易中心”等。这种中心的方式,使得各个中心能够隔离,同时可以针对各部分进行优化。
  • 中心的拆分带来的问题是完整数据可能需要从多个中心进行,淘宝使用了HFS(类似RPC方式,注重高效)负责各中心之间数据的交互。
  • 淘宝正在研发自主的数据库OceanBase。一个很抢眼的特性是,能够把随机IO合并为顺序IO。

Topic 2:数据库性能模型与容量规划

提出了以响应时间为核心的规划思想,有点意思。hellodba的博主,之前看过他的blog,讲的也是这方面的,这次更透彻了。
  • 数据库的时间模型,详见ppt吧。
  • 影响IOPS的因素:磁盘转速,寻道时延
  • 影响吞吐量的因素:磁盘转速,接口类型,内外部接口传输速率
  • Oracle的redolog:连续的随机IO。一个很贴切的说法。小于5ms是比较合理的。
  • Oracle的datalog:小于10ms是合理的。
  • 对Oracle数据库而言,CPU和IO时间外的其他等待事件应该小于5%

Topic 3:NoSQL数据库研发之路


对应NoSQL个人了解不是太多,讲的又是ttserver这种具体的应用。没记下什么东西。感觉一直在说的一个问题是,NoSQL产品很多,各自特性不同,需要根据自己的业务特点来选取适合自己的产品。


Topic 4:淘宝分布式数据层的前世今生

一个很好的东西,解决了Oralce数据到MySQL数据的复制问题。

  • 简称tddl
  • 重写的JDBC部分,加入的数据复制、数据拆分的功能
  • 接管了上层应用的SQL请求,由他负责进行和不同数据源交互
  • 实现了基于自定义规则的数据拆分
  • 使用了消息通知的异步方式进行数据复制(写入或更新成功后发送消息),由专门的服务器完成后续复制

 

5
3
分享到:
评论
4 楼 caoyun 2015-04-30  
楼主分析得很到位,选择淘宝是对的。
相关阅读:

u站联盟http://www.uzhanlianmeng.com/
3 楼 marcopolo 2012-10-16  
想了解一下,淘宝现在是不是彻底放弃了Oracle,改用Mysql?
2 楼 和你在一起 2010-12-18  
确实不错,淘宝的实力很强,明年还有机会~
stone2oo6 写道
不错不错,可以没能去现场膜拜下

1 楼 stone2oo6 2010-12-13  
不错不错,可以没能去现场膜拜下

相关推荐

    淘宝数据应用开发平台iData

    淘宝数据应用开发平台iData

    大数据云计算技术 淘宝网基于Hadoop的数据应用开发平台iData(共27页).pptx

    《淘宝网基于Hadoop的大数据应用开发平台iData详解》 淘宝网作为中国最大的电子商务平台,每天都会产生海量的数据。为了有效地管理和利用这些数据,淘宝构建了一套基于Hadoop的数据应用开发平台——iData。该平台...

    淘宝技术嘉年华峰会上的7月10日全部PPT下载

    7月10日iDataForum专场 iDataForum --- 主论坛 【9:30 - 10:30】 开场致辞 阳振坤/正祥(淘宝网) 【10:30 - 11:30】 开放环境下的数据管理 周晓方(澳大利亚昆士兰大学) 【11:00 - 12:00】 MySQL+SSD数据库优化...

    大数据云计算技术 淘宝网基于Hadoop的数据应用开发平台iData(共27页).rar

    在这个场景中,淘宝网基于Hadoop的数据应用开发平台iData,是大数据云计算技术的具体应用实例。 Hadoop是Apache基金会开源的一个分布式计算框架,它是大数据处理的核心工具之一。Hadoop的核心组件包括HDFS(Hadoop ...

    南方idata 说明书

    南方iData数据工厂是由广东南方数码科技有限公司自主开发的测绘数据生产处理平台,该平台结合了公司近20年来在测绘和GIS领域的软件开发经验,经过三年的自主研发,在2012年8月推出。这个一体化测绘数据生产处理平台...

    idata开发资料

    idata开发资料包,里面保护条码扫描的代码

    移动iData补丁

    移动iData补丁是针对PDA(个人数字助理)移动终端设计的一种软件更新工具,它主要目的是为了优化和增强iData应用程序的功能、性能以及稳定性。在PDA设备上,iData通常被用作数据采集和处理的核心应用,尤其是在工业...

    移动iData同步驱动

    移动iData同步驱动是专为PDA(个人数字助手)终端设计的一款软件,它使得这些手持设备能够与个人计算机之间实现高效的数据同步。在信息化高度发达的今天,数据同步成为了移动设备用户日常工作中不可或缺的一部分,...

    A5V2R2刷机工具_idata95w刷机_idata95v刷机_iData95刷机_iData95刷机_pda刷机软件_

    标题提到的"A5V2R2刷机工具"是专为idata95w、idata95v以及iData95系列设备设计的一款刷机软件,适用于这些设备的固件更新和维护。 ida95w、idata95v和iData95是不同型号的掌上电脑(PDA)或工业级数据采集设备,...

    IData95ScanActivity.zip

    IData95ScanActivity.zip文件似乎是一个专门针对idata移动物联网设备的开发资源包,它主要用于实现红外扫描枪的功能集成。接下来,我们将深入探讨如何在Android项目中有效地利用这个资源,以实现红外扫描枪的应用。 ...

    iData PDA RFID开发包 iData RFID开发资料 iData UHF模块接口文档 UHF模块开发指南

    iData UHF 安卓开发资料大全 开发包版本 UHF开发包_V1.8 库文件 UHFJar_V1.4.03.aar 接口文档 UHF接口文档_v1.4 测试demo是否可用:将UHFDemo_v1.2.528.apk安装在PDA上,打开应用 测试功能是否可用。若可以正常使用...

    普元IDATA智慧数据平台

    Primeton iDataTM为企业数据应用提供了基础能力,包括前端展现、ETL、作业调度等功能,...使用iData,可以让数据应用具备更绚丽的跨平台展现能力、更快速的数据集成开发能力、海量任务的自动化调度/监控与管理能力。

    iData wince系统wifi助手

    《iData WinCE系统WiFi助手:提升无线网络测试与优化的专业工具》 在现代移动设备中,Wi-Fi连接已经成为不可或缺的一部分。特别是在工业级设备如iData 90上,稳定可靠的Wi-Fi性能对于数据传输和远程操作至关重要。...

    idata95v开发源码扫描抢

    【idata95v开发源码扫描抢】是一个针对idata95型号扫描枪的Android应用程序开发源码包。这个源码包旨在帮助开发者构建能够高效、准确地捕获和处理条形码与二维码的应用。在深入探讨相关知识点之前,我们需要了解几个...

    南方idata操作手册文字版

    南方idata是一款专注于地理信息数据处理的软件,其操作手册详细介绍了软件的基本使用方法、数据格式、功能特点以及具体的操作步骤。手册强调了使用开放的数据格式标准,避免技术壁垒,采用插件式的数据读写接口,...

    南方数码iData三调用户手册

    这份用户手册是广东南方数码科技股份有限公司推出的iData数据工厂三调版操作手册,全手册共计621页,主要面向使用iData软件进行第三次全国土地调查的用户。手册内容详尽地指导用户完成软件安装、操作界面使用、平台...

    iData扫描枪RFID串口开发DEMO

    《iData扫描枪RFID串口开发DEMO详解》 在IT行业中,高效的数据采集与管理是企业运营的关键环节之一,而RFID(Radio Frequency Identification)技术作为一种非接触式的自动识别技术,因其远距离识别、高速读取和...

Global site tag (gtag.js) - Google Analytics