`
sslaowan
  • 浏览: 380341 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

[ZZ]大型网站架构技术方案集锦

 
阅读更多

1. PlentyOfFish 网站架构学习

http://www.dbanotes.net/arch/plentyoffish_arch.html

采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个 PlentyOfFish。这个站点提供 “Online Dating” 服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况 Markus Frind 每天只用两个小时打理网站–可操作性很强嘛。

2. 从LiveJournal后台发展看 大型网站系统架构以及性能优化方法

http://www.example.net.cn/archives/2006/03/olivejournaloio.html

LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用,以实现以下功能:

* 博客,论坛

* 社会性网络,找到朋友

* 聚合,把朋友的文章聚合在一起

LiveJournal采用了大量的开源软件,甚至它本身也是一个开源软件。

在上线后,LiveJournal实现了非常快速的增长:

* 2004年4月份:280万注册用户。

* 2005年4月份:680万注册用户。

* 2005年8月份:790万注册用户。

* 达到了每秒钟上千次的页面请求及处理。

* 使用了大量MySQL服务器。

* 使用了大量通用组件。

3. YouTube 的架构扩展

http://www.dbanotes.net/opensource/youtube_web_arch.html

在西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。

Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源)

4. WikiPedia 技术架构学习分享

http://www.dbanotes.net/opensource/wikipedia_arch.html

维基百科(WikiPedia.org)位列世界十大网站,目前排名第八位。这是开放的力量。

来点直接的数据:

* 峰值每秒钟3万个 HTTP 请求

* 每秒钟 3Gbit 流量, 近乎375MB

* 350 台 PC 服务器

5. Tailrank 网站架构

http://www.dbanotes.net/review/tailrank_arch.html

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r。

6. LinkedIn 架构笔记

http://www.dbanotes.net/arch/linkedin.html

LinkedIn 雇员有 180 个,在 Web 2.0 公司中算是比较多的,不过人家自从 2006 年就盈利了,这在 Web 2.0 站点中可算少的。用户超过 1600 万,现在每月新增 100 万,50% 会员来自海外(中国用户不少,也包括我).

7. Yahoo!社区架构

http://www.dbanotes.net/arch/yahoo_arch.html

旧金山举行的 QCon 会议带给我们很多新鲜的信息。虽然没机会参加,但是看看各个网站”晒架构”也是个比较过瘾的事情。请参观并收藏这个页面:Architectures you’ve always wondered about。

8. Craigslist 的数据库架构

http://www.dbanotes.net/database/craigslist_database_arch.html

Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。

9. Fotolog.com 的技术信息拾零

http://www.dbanotes.net/review/fotolog_arch.html

尽管是世界上最大的图片服务网站, Fotolog.com 在国内的名气并不是很响亮, 每当提到图片服务, 很多人第一个会想起 Flickr. 但实际上 Fotolog 也的确是很猛的, Alexa 上的排名一直在 Flickr 前面, 目前注册用户超过 1100 万. 而前不久也卖了一个好价钱, 9000 万美金. 算下来的话, 1 个注册用户大约 9 美金. Yupoo 的刘平阳可以偷着算算自己的网站如果卖给老外是怎样一个价格了.

10. Digg 网站架构

http://www.dbanotes.net/arch/digg_arch_cache_and_shard.html

Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100 左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了),可以粗略分成三个部分:数据库服务器,Web 服务器,搜索服务器。

11. Amazon 的 Dynamo 架构

http://www.dbanotes.net/techmemo/amazon_dynamo.html

我在 DBAnotes.net 上记录过不少比较大的网站架构分析(eg: eBay [1], eBay [2]) ,Amazon 一直找不到太多的资料。国庆期间读到了一篇关于 Amazon Dynamo 的论文,非常精彩。Amazon Dynamo 这个高可用、可扩展存储体系支撑了Amazon 不少核心服务.

12. 财帮子(caibangzi.com)网站架构

http://www.dbanotes.net/arch/caibangzi_web_arch.html

财帮子(caibangzi.com) 定位在”基金理财社区”。是国内访问量最大的基于 Ruby on rails 的 startup 项目。“理财”这个词据说是光大银行发明的,且不去管,不可否认的是,目前国内”理财”是个很有潜力的切入点。财帮子网站潜在用户群还是很大的。

13. 了解一下 Technorati 的后台数据库架构

http://www.dbanotes.net/web/technorati_db_arch.html

目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上. 每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离,似乎消除了数据库的瓶颈. 值得一提的是, 该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主. 从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用.

14. 说说大型高并发高负载网站的系统架构

http://www.toplee.com/blog/?p=71

我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构 升级等工作,同时自己接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验,可以和大家一起探讨一下。

15. 大型高负载网站架构 的感想

http://atman.memoab.com/articles/194

昨日认识了位健谈的IT人,原在verycd作系统管理的叶宁(这哥们现飘泊去见首都人民了).

以前sweater给我介绍的他写的《大型高负载网站架构和应用初探》, 他总结了很多信息和数据,感谢叶宁的辛劳成果. 这里我也想就此PPT写些自己的感想.

分享到:
评论

相关推荐

    智慧物流落地场景解决方案 zz.pptx

    - **后台**:提供技术支持和服务的底层架构,包括工作流引擎等。 - **接口平台**:实现各平台间的互联互通,确保数据的顺畅流转。 通过这样的综合服务建设,可以实现物流行业的全面升级,为企业创造更大的价值,...

    EPC工程总包项目型成套SAP ERP解决方案zz.pptx

    - **工程机械及矿山设备**:针对此类大型复杂设备的生产制造过程,SAP提供了专门的解决方案,帮助企业在设计、生产、物流等多个环节实现高效管理。 - **能源及电力设备**:面对日益增长的能源需求,SAP解决方案可以...

    财务共享服务中心四大系统整体解决方案zz.pptx

    ### 一、财务共享服务中心四大系统整体解决方案概述 #### 1.1 财务共享服务中心概念 - **定义**: 财务共享服务中心(FSSC)是一种新型财务管理方式,旨在通过集中化、标准化的方式为多个业务单元提供财务管理服务。 -...

    中兴通讯CDMA2000 3GCN综合解决方案

    中兴通讯的CDMA2000 3GCN综合解决方案,通过引入先进的软交换技术和IP网络架构,展现了对未来移动通信发展趋势的深刻理解和技术实力,旨在与全球运营商共同步入更加辉煌的3G时代。这一解决方案的实施,不仅提升了...

    JAVA高级工程师简历模板

    - ZZ项目:一款大型电子商务平台,作为技术负责人,领导团队实现高并发、高可用的交易系统,有效处理双11大促期间的流量高峰。 六、教育背景 列出您的学历,包括毕业院校、专业和学位,以及在校期间的相关课程和...

    电子通信设计资料数字化会议系统的分析与设计

    假设某大型企业计划引入一套完整的电子通信设计资料数字化会议解决方案来改善其内部协作效率。通过对市场上现有产品的调研对比,最终选择了集成了上述所有关键技术与功能模块的系统。实施后,企业员工可以通过电脑或...

    Python3项目开发51商城的程序

    2. **设计架构**:根据需求设计合理的系统架构,包括前端页面布局、后端接口设计等。 3. **技术选型**:选择合适的开发框架和技术栈,如上文提到的Django或Flask等。 4. **编码实现**:按照设计方案进行编码实现...

    FPGA项目verilog实例资料带项目源码设计文档基于FPGA的64位8级流水线加法器

    2. **方案设计**:根据需求选择合适的架构和技术方案,比如采用何种进位预测算法、如何分配流水线级数等。 3. **代码编写**:使用Verilog HDL编写加法器的代码。需要注意的是,由于FPGA具有并行计算的能力,因此在...

    IBMDS8870手册.pdf

    IBM DS8870是一款高性能、高可用性的企业级存储解决方案,适用于大型数据中心和关键业务环境。 本手册覆盖了IBM DS8870的多个方面,包括系统架构、硬件组件、软件功能以及实施和维护策略。以下是手册中涉及的一些...

    JavaEE源码在线考试系统无数据库源码文档

    JavaEE强调的是服务器端的应用,适用于构建大型的B/S结构的应用程序。 ### 二、在线考试系统的背景与意义 随着信息技术的发展,传统的纸质考试方式已经无法满足现代社会高效、便捷的需求。在线考试系统应运而生,...

    宿舍管理系统

    【宿舍管理系统】是一种基于软件工程理念设计的,用于高校或大型机构管理学生宿舍的信息化解决方案。这个系统采用经典的MVC(Model-View-Controller)架构,以提高代码的可维护性和可扩展性。MVC模式将应用程序分为...

    linux学习心得 多年的总结

    这使得Linux不仅能够适应互联网的需求,如Web服务器、DNS、FTP、电子邮件等服务,还能作为小型服务器和大型企业级系统的解决方案。Linux提供了丰富的桌面环境,如KDE和GNOME,以及支持各种编程语言,如C、C++、Perl...

    JAVA源码多用户在线游戏服务器端框架Marauroa.tar

    对于那些需要支持数千甚至上万玩家同时在线的大规模MMORPG游戏而言,Marauroa凭借其优秀的性能表现和可扩展性成为了理想的解决方案之一。 #### 2. 社交网络游戏服务端开发 社交类网络游戏通常涉及到复杂的用户间...

    资料基于AVRAT90S8515的多通道智能大厦自动抄表系统

    本文将详细介绍一种基于AVRAT90S8515微控制器的多通道智能大厦自动抄表系统的设计原理、硬件结构以及软件实现方案。 #### 二、系统概述 ##### 2.1 系统架构 本系统采用集中式管理与分布式采集相结合的方式,主要由...

    Unity3D((2018-2019)版本游戏源码(2018,2019)电子积木

    Unity3D 是一款跨平台的游戏开发引擎,广泛应用于独立开发者及大型游戏工作室中。它支持多种编程语言如 C#,并允许开发者为多个平台(包括 Windows、Mac、Linux、iOS 和 Android 等)创建高质量的 2D 和 3D 游戏。...

Global site tag (gtag.js) - Google Analytics