`
zznj1123
  • 浏览: 124602 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

大型网站架构

阅读更多

http://blog.csdn.net/kongqz/archive/2008/12/29/3637339.aspx 

http://www.ad0.cn/netfetch/read.php/1114.htm 

http://www.ad0.cn/netfetch/read.php/1114.htm 

http://www.ad0.cn/netfetch/read.php/1113.htm 

http://www.ad0.cn/netfetch/read.php/1117.htm 

http://www.ad0.cn/netfetch/read.php/1110.htm 

http://www.ad0.cn/netfetch/read.php/1111.htm 

http://www.itpub.net/viewthread.php?tid=908636 

http://www.25175.com/200609/25175/25175_html/2006-11/723.html 

 

 

 

 

1. PlentyOfFish 网站架构学习 

http://www.dbanotes.net/arch/plentyoffish_arch.html 

 

采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个 PlentyOfFish。这个站点提供 “Online Dating” 服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况 Markus Frind 每天只用两个小时打理网站–可操作性很强嘛。 

 

2. 从LiveJournal后台发展看 大型网站系统架构以及性能优化方法 

http://www.example.net.cn/archives/2006/03/olivejournaloio.html 

 

LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用,以实现以下功能: 

* 博客,论坛 

* 社会性网络,找到朋友 

* 聚合,把朋友的文章聚合在一起 

 

LiveJournal采用了大量的开源软件,甚至它本身也是一个开源软件。 

 

在上线后,LiveJournal实现了非常快速的增长: 

* 2004年4月份:280万注册用户。 

* 2005年4月份:680万注册用户。 

* 2005年8月份:790万注册用户。 

* 达到了每秒钟上千次的页面请求及处理。 

* 使用了大量MySQL服务器。 

* 使用了大量通用组件。 

 

3. YouTube 的架构扩展 

http://www.dbanotes.net/opensource/youtube_web_arch.html 

 

在西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。 

Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源) 

 

4. WikiPedia 技术架构学习分享 

http://www.dbanotes.net/opensource/wikipedia_arch.html 

 

维基百科(WikiPedia.org)位列世界十大网站,目前排名第八位。这是开放的力量。 

 

来点直接的数据: 

 

* 峰值每秒钟3万个 HTTP 请求 

* 每秒钟 3Gbit 流量, 近乎375MB 

* 350 台 PC 服务器 

 

5. Tailrank 网站架构 

http://www.dbanotes.net/review/tailrank_arch.html 

 

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。 

 

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r。 

 

6. LinkedIn 架构笔记 

http://www.dbanotes.net/arch/linkedin.html 

 

LinkedIn 雇员有 180 个,在 Web 2.0 公司中算是比较多的,不过人家自从 2006 年就盈利了,这在 Web 2.0 站点中可算少的。用户超过 1600 万,现在每月新增 100 万,50% 会员来自海外(中国用户不少,也包括我). 

 

7. Yahoo!社区架构 

http://www.dbanotes.net/arch/yahoo_arch.html 

 

旧金山举行的 QCon 会议带给我们很多新鲜的信息。虽然没机会参加,但是看看各个网站”晒架构”也是个比较过瘾的事情。请参观并收藏这个页面:Architectures you’ve always wondered about。 

 

8. Craigslist 的数据库架构 

http://www.dbanotes.net/database/craigslist_database_arch.html 

 

Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道: 

 

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。 

 

9. Fotolog.com 的技术信息拾零 

http://www.dbanotes.net/review/fotolog_arch.html 

 

尽管是世界上最大的图片服务网站, Fotolog.com 在国内的名气并不是很响亮, 每当提到图片服务, 很多人第一个会想起 Flickr. 但实际上 Fotolog 也的确是很猛的, Alexa 上的排名一直在 Flickr 前面, 目前注册用户超过 1100 万. 而前不久也卖了一个好价钱, 9000 万美金. 算下来的话, 1 个注册用户大约 9 美金. Yupoo 的刘平阳可以偷着算算自己的网站如果卖给老外是怎样一个价格了. 

 

10. Digg 网站架构 

http://www.dbanotes.net/arch/digg_arch_cache_and_shard.html 

 

Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100 左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了),可以粗略分成三个部分:数据库服务器,Web 服务器,搜索服务器。 

 

11. Amazon 的 Dynamo 架构 

http://www.dbanotes.net/techmemo/amazon_dynamo.html 

 

我在 DBAnotes.net 上记录过不少比较大的网站架构分析(eg: eBay [1], eBay [2]) ,Amazon 一直找不到太多的资料。国庆期间读到了一篇关于 Amazon Dynamo 的论文,非常精彩。Amazon Dynamo 这个高可用、可扩展存储体系支撑了Amazon 不少核心服务. 

 

12. 财帮子(caibangzi.com)网站架构 

http://www.dbanotes.net/arch/caibangzi_web_arch.html 

 

财帮子(caibangzi.com) 定位在”基金理财社区”。是国内访问量最大的基于 Ruby on rails 的 startup 项目。“理财”这个词据说是光大银行发明的,且不去管,不可否认的是,目前国内”理财”是个很有潜力的切入点。财帮子网站潜在用户群还是很大的。 

 

13. 了解一下 Technorati 的后台数据库架构 

http://www.dbanotes.net/web/technorati_db_arch.html 

 

目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上. 每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离, 似乎消除了数据库的瓶颈. 值得一提的是, 该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主. 从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用. 

 

14. 说说大型高并发高负载网站的系统架构 

http://www.toplee.com/blog/?p=71 

 

我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构升级等工作,同时自己接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验,可以和大家一起探讨一下。 

 

15. 大型高负载网站架构 的感想 

http://atman.memoab.com/articles/194 

 

 

1. PlentyOfFish 网站架构学习 

http://www.dbanotes.net/arch/plentyoffish_arch.html 

 

采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个 PlentyOfFish。这个站点提供 “Online Dating” 服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况 Markus Frind 每天只用两个小时打理网站–可操作性很强嘛。 

 

2. 从LiveJournal后台发展看 大型网站系统架构以及性能优化方法 

http://www.example.net.cn/archives/2006/03/olivejournaloio.html 

 

LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用,以实现以下功能: 

* 博客,论坛 

* 社会性网络,找到朋友 

* 聚合,把朋友的文章聚合在一起 

 

LiveJournal采用了大量的开源软件,甚至它本身也是一个开源软件。 

 

在上线后,LiveJournal实现了非常快速的增长: 

* 2004年4月份:280万注册用户。 

* 2005年4月份:680万注册用户。 

* 2005年8月份:790万注册用户。 

* 达到了每秒钟上千次的页面请求及处理。 

* 使用了大量MySQL服务器。 

* 使用了大量通用组件。 

 

3. YouTube 的架构扩展 

http://www.dbanotes.net/opensource/youtube_web_arch.html 

 

在西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。 

Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源) 

 

4. WikiPedia 技术架构学习分享 

http://www.dbanotes.net/opensource/wikipedia_arch.html 

 

维基百科(WikiPedia.org)位列世界十大网站,目前排名第八位。这是开放的力量。 

 

来点直接的数据: 

 

* 峰值每秒钟3万个 HTTP 请求 

* 每秒钟 3Gbit 流量, 近乎375MB 

* 350 台 PC 服务器 

 

5. Tailrank 网站架构 

http://www.dbanotes.net/review/tailrank_arch.html 

 

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。 

 

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r。 

 

6. LinkedIn 架构笔记 

http://www.dbanotes.net/arch/linkedin.html 

 

LinkedIn 雇员有 180 个,在 Web 2.0 公司中算是比较多的,不过人家自从 2006 年就盈利了,这在 Web 2.0 站点中可算少的。用户超过 1600 万,现在每月新增 100 万,50% 会员来自海外(中国用户不少,也包括我). 

 

7. Yahoo!社区架构 

http://www.dbanotes.net/arch/yahoo_arch.html 

 

旧金山举行的 QCon 会议带给我们很多新鲜的信息。虽然没机会参加,但是看看各个网站”晒架构”也是个比较过瘾的事情。请参观并收藏这个页面:Architectures you’ve always wondered about。 

 

8. Craigslist 的数据库架构 

http://www.dbanotes.net/database/craigslist_database_arch.html 

 

Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道: 

 

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。 

 

9. Fotolog.com 的技术信息拾零 

http://www.dbanotes.net/review/fotolog_arch.html 

 

尽管是世界上最大的图片服务网站, Fotolog.com 在国内的名气并不是很响亮, 每当提到图片服务, 很多人第一个会想起 Flickr. 但实际上 Fotolog 也的确是很猛的, Alexa 上的排名一直在 Flickr 前面, 目前注册用户超过 1100 万. 而前不久也卖了一个好价钱, 9000 万美金. 算下来的话, 1 个注册用户大约 9 美金. Yupoo 的刘平阳可以偷着算算自己的网站如果卖给老外是怎样一个价格了. 

 

10. Digg 网站架构 

http://www.dbanotes.net/arch/digg_arch_cache_and_shard.html 

 

Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100 左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了),可以粗略分成三个部分:数据库服务器,Web 服务器,搜索服务器。 

 

11. Amazon 的 Dynamo 架构 

http://www.dbanotes.net/techmemo/amazon_dynamo.html 

 

我在 DBAnotes.net 上记录过不少比较大的网站架构分析(eg: eBay [1], eBay [2]) ,Amazon 一直找不到太多的资料。国庆期间读到了一篇关于 Amazon Dynamo 的论文,非常精彩。Amazon Dynamo 这个高可用、可扩展存储体系支撑了Amazon 不少核心服务. 

 

12. 财帮子(caibangzi.com)网站架构 

http://www.dbanotes.net/arch/caibangzi_web_arch.html 

 

财帮子(caibangzi.com) 定位在”基金理财社区”。是国内访问量最大的基于 Ruby on rails 的 startup 项目。“理财”这个词据说是光大银行发明的,且不去管,不可否认的是,目前国内”理财”是个很有潜力的切入点。财帮子网站潜在用户群还是很大的。 

 

13. 了解一下 Technorati 的后台数据库架构 

http://www.dbanotes.net/web/technorati_db_arch.html 

 

目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上. 每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离, 似乎消除了数据库的瓶颈. 值得一提的是, 该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主. 从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用. 

 

14. 说说大型高并发高负载网站的系统架构 

http://www.toplee.com/blog/?p=71 

 

我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构升级等工作,同时自己接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验,可以和大家一起探讨一下。 

 

15. 大型高负载网站架构 的感想 

http://atman.memoab.com/articles/194

分享到:
评论

相关推荐

    大型网站架构演变和知识体系.

    在IT行业中,大型网站架构是构建高可用、高性能、高并发系统的核心所在。随着互联网的快速发展,用户量的剧增,传统的单体架构已经无法满足需求,因此大型网站的架构经历了从简单到复杂,从单一到分布式的发展过程。...

    大型网站架构资源集合

    在IT行业中,大型网站架构是构建可扩展、高性能和高可用性互联网服务的关键。这个资源集合专注于探讨在Windows和Linux平台上常见的大型网站架构方法。以下是对这些文件内容的详细解读: 1. **architecture.bmp**:...

    中大型网站架构演变之路.pdf

    中大型网站架构的演变是伴随着互联网技术发展和业务需求增长而不断优化和升级的过程。在这个演变之路上,网站架构师需要考虑的关键因素包括服务器的可伸缩性、系统的高可用性、数据的一致性与安全性,以及处理高并发...

    大型网站架构演变和知识体系.pdf

    ### 大型网站架构演变与知识体系解析 #### 架构演变的第一步:物理分离Web服务器与数据库 在网站发展的初期阶段,往往由于资源限制,Web应用与数据库部署在同一台服务器上。随着用户访问量的增长,单一服务器上的...

    从运维角度看中大型网站架构演变之路

    ### 从运维角度看中大型网站架构演变之路 随着互联网的发展,中大型网站面临的挑战日益增多,这不仅体现在用户数量的增长上,还体现在对系统稳定性和性能的要求上。本文旨在通过一个具体的案例,来探讨中大型网站...

    疯狂代码,大型网站架构系列之一

    ### 大型网站架构设计的关键知识点 #### 一、海量数据处理 在构建大型网站时,数据处理能力是首要考虑的问题。与小型站点相比,大型网站每天可能产生数百万条数据,这要求系统具备高效的数据处理机制。在设计初期...

    实战 搭建一个大型网站架构的实验环境

    实战 搭建一个大型网站架构的实验环境: 1搭建一个大型网站架构的实验环境(虚拟机篇) .pdf 2搭建一个大型网站架构的实验环境(FreeBSD系统安装篇).pdf 3搭建一个大型网站架构的实验环境(FreeBSD系统设置篇) .pdf ...

    大型网站架构说明 一个很好的网站架构说明

    《大型网站架构说明》是一份深入探讨网站架构的宝贵资料,包含了从基础到高级的多个层面,旨在帮助读者理解如何构建稳定、可扩展且高效的大型网站。这份文档分为三部分,即“大型网站架构系列一”、“大型网站架构...

    大型网站架构案例

    在IT行业中,大型网站架构是构建可扩展、高可用、高性能和高安全性的网络应用程序的关键。这个主题涵盖了许多技术和策略,旨在处理大量并发用户、大数据量以及复杂的业务逻辑。本案例将深入探讨一些核心概念和实践,...

    大型网站架构文档

    《大型网站架构文档》 大型网站架构是互联网技术领域中的一个重要课题,涉及到多个技术栈的综合运用,旨在处理高并发、大数据量、高可用性以及快速响应等挑战。本文档主要探讨了像Facebook、淘宝、豆瓣这样的大型...

    分布式 大型网站架构 高性能mysql

    分布式大型网站架构、高性能MySQL是构建现代互联网应用的关键技术,对于理解如何处理高并发、海量数据的场景至关重要。本文将深入探讨这些主题,并结合提供的书籍资源进行解析。 首先,我们来看"大型网站技术架构:...

    疯狂代码,大型网站架构系列

    《疯狂代码:大型网站架构系列》是一套深入探讨大规模网站架构设计的文档集,涵盖了从基础概念到高级策略的广泛内容。在这个系列中,我们将会深入理解大型网站背后的技术架构和设计思想,以应对高并发、大数据量以及...

    大型网站架构方案pdf

    ### 大型网站架构演变详解 #### 架构演变第一步:物理分离Web服务器与数据库 在网站初期,可能仅有一台服务器集成了Web服务与数据库服务。随着网站流量的增加,这种架构会面临性能瓶颈,因为Web应用和数据库之间...

    一步步构建大型网站架构

    ### 一步步构建大型网站架构 随着互联网的发展与普及,网站架构设计成为了确保网站高效稳定运行的关键环节。本文基于“一步步构建大型网站架构”的主题,详细分析了网站从初始搭建到逐步扩展过程中经历的关键阶段和...

    大型网站架构-高性能网站架构

    大型网站架构-高性能网站架构 在大型网站架构设计中,选择合适的操作系统、Web 服务器、数据库和脚本语言是至关重要的。以下是对大型网站架构的详细分析: 选择高性能 OS 在选择操作系统时,我们需要考虑多个因素...

    收集的大型网站架构实例

    【大型网站架构实例详解】 大型网站架构是互联网领域中至关重要的话题,它涉及到如何设计和构建能够处理海量用户访问、高并发请求以及复杂业务逻辑的系统。以下是对几个著名大型网站架构实例的深入分析: 1. **...

    详解:大型网站架构演变和知识体系

    大型网站架构演变和知识体系 之前也有一些介绍大型网站架构演变的文章,例如LiveJournal的、ebay的,都是非常值得参考的,不过感觉他们讲的更多的是每次演变的结果,而没有很详细的讲为什么需要做这样的演变,再...

    大型网站架构演变和知识体系

    【大型网站架构演变和知识体系】的探讨是一个深入的话题,涉及到互联网行业中网站设计与优化的关键环节。随着网站规模的增长,架构也需要不断演进以应对日益增大的访问压力和复杂的功能需求。以下是对这一主题的详细...

Global site tag (gtag.js) - Google Analytics