`
grantbb
  • 浏览: 271640 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

大型网站架构之优酷篇

    博客分类:
  • WEB
阅读更多

首先列出了网站架构关注的一些要点,包括:

  • 在线升级
  • 效率
  • 核心简单
  • 独立性
  • 模块化


再播报一组优酷的数据:

  • 用户数:4000万
  • 视频数:2000万
  • PV:1.3亿
  • VV:1.6亿


主要采用的也都是一些非常常见,成熟的软件和操作系统
包括:centos/LVS/PHP

采用简单的方式对URL进行规划:
http://domain/modules/method/params/

举例:
http://www.youku.com/playlist_showlist/t2d1c123.html  资讯频道的豆单列表页面
http://www.youku.com/playlist_show/id_3219807.html    某个豆单的浏览页面
http://v.youku.com/v_playlist/f3220308o1p0.html    豆单中某个视频的播放页面


优酷每周规定周二固定时间进行发布(这样可以简化一些发布上线的流程)
通过自建的CMS解决了大部分的页面的内容维护和生成的问题。

缓存的设计

缓存黄金原则:让数据更靠近 CPU

CPU-->CPU 一级缓存-->二级缓存-->内存-->硬盘-->LAN-->WAN

讲到了 Youku 自己的内部项目,针对大文件缓存的。
目前开源软件中,Squid 的 write() 用户进程空间有消耗,(这个需要看源码才能看到)
Lighttpd1.5 的 AIO(异步I/O) 读取文件到用户内存导致效率也比较低下。
Youku不用内存做缓存(避免内存拷贝,避免内存锁)。(优酷应该也用了不少memcached)
值得注意的是,缓存技术容易被滥用,也有副作用,比如接到老大通知要把某个视频撤下来,如果在缓存里是比较麻烦的。

 

MySQL数据库的优化


曾经也考虑过使用数据库中间层来解决数据库的问题,但是考虑的方案比较复杂不够简单,所以放弃。(简单最重要)


数据库采用水平扩展,主从复制,随着从数据库的增多,复制延迟越来越厉害,最终无法忍受。

最终还是采用数据库的sharding,把一组用户相关的表和数据放到一组数据库上。

使用SSD来优化mysql的I/O,性能提升明显,每块16G,6块SSD做RAID。

数据库的类型选用MYISAM

数据库的拆分策略,先纵向按照业务或者模块拆分。对于一些特别大的表,再采用垂直拆分

根据用户进行分片,尽可能不要跨篇查询。如果确实要跨片查询,可以考虑搜索的方案,先索引再搜索。

分布式的数据库方案太复杂,否掉。

网络服务器优化

如果要优化服务器的性能,必须对Libevent 非常熟悉,因为常见的memcached/squid/lighttpd等都有用到。确实很重要。

libevent封装了epoll/kqueue

视频的去重方案:md5和视频指纹。

关键的业务要自己来做。

25
5
分享到:
评论
11 楼 grantbb 2009-04-20  
Arden 写道

lighttpd 1.5?哪来的1.5啊~~


这个版本应该有些问题
10 楼 Arden 2009-04-16  
lighttpd 1.5?
哪来的1.5啊~~
9 楼 moonranger 2009-04-16  
优酷的搜索功能太垃圾了,其他的都很不错。
8 楼 天机老人 2009-04-16  
哥们顶你,好好写,呵呵!
7 楼 bachmozart 2009-04-16  
lighttpd 用了libevent??

没有吧
6 楼 bachmozart 2009-04-16  
lighttpd 用了
5 楼 yatwql 2009-04-16  
这文章和http://www.dbanotes.net/arch/youku_arch.html有好大的相似度哦
4 楼 yumi301 2009-04-15  
缓存的设计



缓存黄金原则:让数据更靠近 CPU 。

CPU-->CPU 一级缓存-->二级缓存-->内存-->硬盘-->LAN-->WAN

讲到了 Youku 自己的内部项目
,针对大文件缓存的。

应该是在书上看到的,比如程序员杂志。
3 楼 flyfan 2009-04-15  
想知道你怎么对优酷这么清楚的,开发人员?
2 楼 JimyChen 2009-04-15  
希望继续发这些大型网站的架构,最近超感兴趣
1 楼 whaosoft 2009-04-15  
刚出的我的青春谁做主 又被优酷删了

相关推荐

    大型网站技术架构.pdf

    大型网站技术架构书籍大型网站技术架构书籍大型网站技术架构书籍大型网站技术架构书籍大型网站技术架构书籍

    实战 搭建一个大型网站架构的实验环境

    1搭建一个大型网站架构的实验环境(虚拟机篇) .pdf 2搭建一个大型网站架构的实验环境(FreeBSD系统安装篇).pdf 3搭建一个大型网站架构的实验环境(FreeBSD系统设置篇) .pdf 4搭建一个大型网站架构的实验环境...

    大型网站技术架构:核心原理与案例分析

    1 大型网站架构演化 2 大型网站架构模式 3 大型网站核心架构要素 第2篇 架构 4 瞬时响应:网站的高性能架构 5 万无一失:网站的高可用架构 6 永无止境:网站的伸缩性架构 7 随需应变:网站的可扩展架构 8 ...

    [网盘]大型分布式网站架构设计与实践.pdf

    大型分布式网站架构设计与实践.pdf <br/>《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定...

    大型网站技术架构:核心原理与案例分析.pdf

    《大型网站技术架构:核心原理与案例分析》通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原理,并通过一组典型网站技术架构设计案例,为读者呈现一幅包括技术选型、...

    从运维角度看中大型网站架构演变之路

    ### 从运维角度看中大型网站架构演变之路 随着互联网的发展,中大型网站面临的挑战日益增多,这不仅体现在用户数量的增长上,还体现在对系统稳定性和性能的要求上。本文旨在通过一个具体的案例,来探讨中大型网站...

    大型网站技术架构PDF

    《大型网站技术架构:核心原理与案例分析》通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原理,并通过一组典型网站技术架构设计案例,为读者呈现一幅包括技术选型、...

    《大型网站技术架构演进与性能优化》

    《大型网站技术架构演进与性能优化》这本书深入探讨了互联网行业中大型网站在技术架构上的发展路径和性能优化策略。随着互联网的飞速发展,大型网站的架构设计和性能优化成为了决定企业竞争力的关键因素。本篇文章将...

    中大型网站架构演变之路.pdf

    在这个演变之路上,网站架构师需要考虑的关键因素包括服务器的可伸缩性、系统的高可用性、数据的一致性与安全性,以及处理高并发请求的能力等。 初期阶段,单台服务器部署是最常见的起点,此时网站访问量小,硬件...

    大型网站架构案例

    在IT行业中,大型网站架构是构建可扩展、高可用、高性能和高安全性的网络应用程序的关键。这个主题涵盖了许多技术和策略,旨在处理大量并发用户、大数据量以及复杂的业务逻辑。本案例将深入探讨一些核心概念和实践,...

    大型网站架构之分布式消息队列

    大型网站架构之分布式消息队列,讲述了网站架构中的消息处理问题

    大型网站技术架构 核心原理与案例分析 高清完整版 李智慧.pdf

    大型网站技术架构:核心原理与案例分析 本书作者是阿里巴巴网站构建的亲历者,拥有核心技术部门的一线工作经验,直接体验了大型网站构建与发展过程中的种种生与死,蜕与变,见证了一个网站架构从幼稚走向成熟稳定的...

    大型分布式网站架构设计与实践.带目录书签.完整版.rar

    《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定性保障和海量数据分析等内容;深入地讲述了...

    大型分布式网站架构设计与实践

    《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定性保障和海量数据分析等内容;深入地讲述了...

    大型网站架构 易趣网(实战篇)

    在互联网技术飞速发展的今天,构建稳定、高效且可扩展的大型网站已成为各大企业的核心竞争力之一。易趣网(eBay)作为全球知名的电子商务平台,在处理海量数据和高并发请求方面积累了丰富的经验和技术解决方案。本篇...

    大型网站技术架构:核心原理与案例分析PDF电子下载.txt

    1.大型网站架构演化 2.大型网站架构模式 3.大型网站核心架构要素 4.网站高性能架构5.网站的高可用架构6.网站伸缩性架构7.网站的可扩展架构8.网站的安全架构9. 淘宝网的架构演化案例分析10. 维基百科的高性能架构...

    大型分布式网站架构设计与实践.pdf

    《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定性保障和海量数据分析等内容;深入地讲述了...

    大型互联网网站架构心得

    基于.Net 大型互联网网站架构心得,数据库,图片处理设计

    大型网站架构

    《大型网站架构:核心原理与案例分析》这本书深入探讨了构建和优化大型网站所需的关键技术和策略。在现代互联网环境中,大型网站面临着高并发、海量数据处理、高性能、高可用性等挑战,本书针对这些挑战提供了详尽的...

    大型分布式网站架构设计与实践 PDF(带目录清晰完整版)

    ### 大型分布式网站架构设计与实践 #### 一、引言 在当前互联网时代,随着用户数量的急剧增加以及业务复杂度的不断提高,传统的单体应用架构已经无法满足高并发、高性能的需求。因此,越来越多的企业开始采用...

Global site tag (gtag.js) - Google Analytics