xiaogui9317170

浏览: 225201 次
性别:
来自: 上海

最近访客更多访客>>

liyudays

_无极键圣

liumingwei2009

webeasymail

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

WikiPedia 技术架构学习分享

博客分类：

架构设计

MySQL lighttpd Cache 应用服务器 memcached

WikiPedia 技术架构学习分享

作者: Fenng | 可以转载, 转载时务必以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.dbanotes.net/opensource/wikipedia_arch.html

维基百科(WikiPedia.org )位列世界十大网站，目前排名第八位。这是开放的力量。

来点直接的数据：

    * 峰值每秒钟3万个 HTTP 请求
    * 每秒钟 3Gbit 流量, 近乎375MB
    * 350 台 PC 服务器
      (数据来源 )

架构示意图如下

WikiPedia_arch.png Copy @Mark Bergsma
GeoDNS

在我写的这些网站架构的 Blog 中，GeoDNS 第一次出现，这东西是啥? "A 40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家，各个地域。
负载均衡：LVS

WikiPedia 用 LVS 做负载均衡, 是章文嵩博士发起的项目,也算中国人为数不多的在开源领域的骄傲啦。LVS 维护的一个老问题就是监控了，维基百科的技术人员用的是 pybal.
图片服务器:Lighttpd

Lighttpd 现在成了准标准图片服务器配置了。不多说。
Wiki 软件: MediaWiki
对 MediaWiki 的应用层优化细化得快到极致了。用开销相对比较小的方法定位代码热点，参见实时性能报告，瓶颈在哪里，看这样的图树展示一目了然。另外一个十分值得重视的经验是，尽可能抛弃复杂的算法、代价昂贵的查询，以及可能带来过度开销的 MediaWiki 特性。

Cache! Cache! Cache!

维基百科网站成功的第一关键要素就是 Cache 了。CDN(其实也算是 Cache) 做内容分发到不同的大洲、Squid 作为反向代理. 数据库 Cache 用 Memcached，30 台，每台 2G 。对所有可能的数据尽可能的Cache，但他们也提醒了 Cache 的开销并非永远都是最小的，尽可能使用，但不能过度使用。
数据库: MySQL

MediaWiki 用的DB 是 MySQL. MySQL 在 Web 2.0 技术上的常见的一些扩展方案他们也在使用。复制、读写分离......应用在 DB 上的负载均衡通过 LoadBalancer.php 来做到的，可以给我们一个很好的参考。

运营这样的站点，WikiPedia 每年的开支是 200 万美元，技术人员只有 6 个，惊人的高效。

参考文档：

Wikimedia architecture （PDF)
Todd Hoff 的文章

分享到：

YouTube 的架构扩展 | 保险财务管理

2008-11-24 00:22
浏览 1992
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

WikiPedia 技术架构学习分享

WikiPedia 技术架构学习分享

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

WikiPedia 技术架构学习分享

WikiPedia 技术架构学习分享

评论

发表评论

相关推荐

大型网站架构不得不考虑的10个问题

规划 SOA 参考架构

架构师书单

架构师之路

应用架构选型讨论

系统构架设计应考虑的因素

负载均衡－－大型在线系统实现的关键（服务器集群架构的设计与选择）

LinkedIn Architecture

eBay Architecture

LiveJournal Architecture

Google Architecture

YouTube Architecture

Flickr Architecture

Digg Architecture

37signals Architecture

Scaling Twitter: Making Twitter 10000 Percent Fast

Amazon Architecture

Facebook 海量数据处理

Scalability Best Practices: Lessons from eBay

Yapache-Yahoo! Apache 的秘密

最近访客更多访客>>