`
阅读更多

原文地址:http://www.itivy.com/ivy/archive/2011/8/13/the-architecture-of-youku.html

 

 

 

 

记得以前给大家介绍过视频网站龙头老大YouTube的技术架构,相信大家看了都会有不少的感触,互联网就是这么一个神奇的东西。今天我突然想到,优酷网在国内也算是视频网站的老大了,不知道他的架构相对于YouTube是怎么样的,于是带着这个好奇心去网上找了优酷网架构的各方面资料,虽然谈得没有YouTube那么详细,但多少还是挖掘了一点,现在总结一下,希望对喜欢架构的朋友有所帮助。

一、网站基本数据概览

  • 据2010年统计,优酷网日均独立访问人数(uv)达到了8900万,日均访问量(pv)更是达到了17亿,优酷凭借这一数据成为google榜单中国内视频网站排名最高的厂商。
  • 硬件方面,优酷网引进的戴尔服务器主要以 PowerEdge 1950与PowerEdge 860为主,存储阵列以戴尔MD1000为主,2007的数据表明,优酷网已有1000多台服务器遍布在全国各大省市,现在应该更多了吧。

二、网站前端框架

从一开始,优酷网就自建了一套CMS来解决前端的页面显示,各个模块之间分离得比较恰当,前端可扩展性很好,UI的分离,让开发与维护变得十分简单和灵活,下图是优酷前端的模块调用关系:

这样,就根据module、method及params来确定调用相对独立的模块,显得非常简洁。下面附一张优酷的前端局部架构图:

 

三、数据库架构

应该说优酷的数据库架构也是经历了许多波折,从一开始的单台MySQL服务器(Just Running)到简单的MySQL主从复制、SSD优化、垂直分库、水平sharding分库,这一系列过程只有经历过才会有更深的体会吧,就像MySpace的架构经历一样,架构也是一步步慢慢成长和成熟的。

1、简单的MySQL主从复制:

MySQL的主从复制解决了数据库的读写分离,并很好的提升了读的性能,其原来图如下:

其主从复制的过程如下图所示:

但是,主从复制也带来其他一系列性能瓶颈问题:

  1. 写入无法扩展
  2. 写入无法缓存
  3. 复制延时
  4. 锁表率上升
  5. 表变大,缓存率下降

那问题产生总得解决的,这就产生下面的优化方案,一起来看看。

 

2、MySQL垂直分区

如果把业务切割得足够独立,那把不同业务的数据放到不同的数据库服务器将是一个不错的方案,而且万一其中一个业务崩溃了也不会影响其他业务的正常进行,并且也起到了负载分流的作用,大大提升了数据库的吞吐能力。经过垂直分区后的数据库架构图如下:

然而,尽管业务之间已经足够独立了,但是有些业务之间或多或少总会有点联系,如用户,基本上都会和每个业务相关联,况且这种分区方式,也不能解决单张表数据量暴涨的问题,因此为何不试试水平sharding呢?

 

3、MySQL水平分片(Sharding)

这是一个非常好的思路,将用户按一定规则(按id哈希)分组,并把该组用户的数据存储到一个数据库分片中,即一个sharding,这样随着用户数量的增加,只要简单地配置一台服务器即可,原理图如下:

如何来确定某个用户所在的shard呢,可以建一张用户和shard对应的数据表,每次请求先从这张表找用户的shard id,再从对应shard中查询相关数据,如下图所示:

但是,优酷是如何解决跨shard的查询呢,这个是个难点,据介绍优酷是尽量不跨shard查询,实在不行通过多维分片索引、分布式搜索引擎,下策是分布式数据库查询(这个非常麻烦而且耗性能)

 

四、缓存策略

貌似大的系统都对“缓存”情有独钟,从http缓存到memcached内存数据缓存,但优酷表示没有用内存缓存,理由如下:

  1. 避免内存拷贝,避免内存锁
  2. 如接到老大哥通知要把某个视频撤下来,如果在缓存里是比较麻烦的

而且Squid 的 write() 用户进程空间有消耗,Lighttpd 1.5 的 AIO(异步I/O) 读取文件到用户内存导致效率也比较低下。

但为何我们访问优酷会如此流畅,与土豆相比优酷的视频加载速度略胜一筹?这个要归功于优酷建立的比较完善的内容分发网络(CDN),它通过多种方式保证分布在全国各地的用户进行就近访问——用户点击视频请求后,优酷网将根据用户所处地区位置,将离用户最近、服务状况最好的视频服务器地址传送给用户,从而保证用户可以得到快速的视频体验。这就是CDN带来的优势,就近访问,有关CDN的更多内容,请大家Google一下。

五、其他相关架构文章推荐

Flickr网站架构
回顾MySpace架构的坎坷之路
国内图片网站Yupoo架构
twitter网站架构
PlentyOfFish.com .NET网站的又一传奇

好了,就总结这么多了,有兴趣的同学接着补充,虽然很多资料图片都来自网络,但整理也不容易,欢迎转载,转载留个出处:青藤屋 原文链接

分享到:
评论

相关推荐

    系统架构师学习笔记

    系统架构师的学习笔记,通常是资深架构师或者对架构有深入研究的专业人士根据个人经验和学习总结所撰写的学习资料,它可以帮助开发工程师向系统架构师的职业发展道路上迈进。 从提供的内容来看,系统架构师的学习...

    微服务架构 学习笔记

    微服务架构 学习笔记 微服务架构 学习笔记 微服务架构 学习笔记

    优酷网架构学习笔记

    今天我突然想到,优酷网在国内也算是视频网站的老大了,不知道他的架构相对于YouTube是怎么样的,于是带着这个好奇心去网上找了优酷网架构的各方面资料,虽然谈得没有YouTube那么详细,但多少还是挖掘了一点,现在...

    2019年软考系统架构设计师学习笔记.pdf

    在2019年的软考系统架构设计师学习笔记中,这一角色的定义更加细化,强调了架构师应具备的技术素质和管理素质。 技术素质方面,系统架构师需掌握软件工程的标准和规范,能对技术方案进行清晰的规划和设计。他们需要...

    电商高并发、高可用技术架构学习笔记

    电商高并发、高可用技术架构学习笔记

    软考系统架构设计师学习笔记.pdf

    整体来看,系统架构设计师的学习笔记是一份系统而全面的学习资料,覆盖了架构师的理论知识、技术实践以及行业应用,为准备成为系统架构师的专业人士提供了宝贵的学习资源。对于软件架构师的培养,笔记强调了需要通过...

    网络架构师学习笔记

    针对该认证考试,学习的详细笔记,对考试结构进行了完整的描述,推荐资源

    ARMv8架构与指令集.学习笔记

    本学习笔记将详细讲解ARMv8架构与指令集,包括执行状态、异常模型、寄存器、指令集以及流水线等关键知识点。 首先,在ARMv8简介章节,基础认识部分明确了ARMv8架构继承了ARMv7的技术,支持16/32位的Thumb2指令集,...

    2021年系统架构复习笔记(按章节).docx

    本篇复习笔记主要涵盖了2021年系统架构师考试的关键知识点,...总的来说,这份复习笔记全面覆盖了系统架构师考试的要点,从系统架构的理论到实际操作,再到计算机网络和操作系统的基础,为备考者提供了丰富的学习材料。

    系统架构师学习笔记(pdf)

    尽管短期培训难以培养出成熟的架构师,但持续的学习和实践是成为优秀架构师的关键。 #### 五、计算机基础知识 - **操作系统**:作为计算机系统的核心,操作系统负责管理和调度计算机硬件资源,提供软件运行的环境...

    软件考试系统架构设计师学习笔记(整理版)

    《软件考试系统架构设计师学习笔记(整理版)》是一份详尽的学习资料,主要针对的是软件考试中的系统架构设计师这一专业领域。这份笔记包含了自2008年以来的历年试题,是备考者全面掌握该考试内容的重要参考资料。...

    Java学习笔记学习笔记

    Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习笔记Java学习...

    字节跳动移动架构学习笔记.zip

    【标题】"字节跳动移动架构学习笔记.zip" 提供了一个深入了解字节跳动公司移动应用架构设计的宝贵资源。作为一家全球知名的科技企业,字节跳动在移动开发领域有着独特的见解和技术实践,其架构设计对于提升应用性能...

    python学习笔记架构

    python学习笔记架构

    软考系统架构师学习笔记

    软考系统架构师学习笔记

    CCNA学习笔记 CCNA学习笔记

    CCNA学习笔记 CCNA学习笔记 CCNA学习笔记

    网络工程师学习笔记.

    网络工程师学习笔记.网络工程师学习笔记.

    第一行代码 android学习笔记 完整版

    Android学习笔记是Android开发者的必读书籍,书中涵盖了Android系统架构、Activity、Intent、资源管理等多方面的知识。本笔记对应的学习资源《第一行代码》是Android开发者的入门必读书籍,书中系统地介绍了Android...

Global site tag (gtag.js) - Google Analytics