WikiPedia 技术架构学习分享 - zt - huangxx

huangxx

浏览: 325607 次
来自: ...

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

WikiPedia 技术架构学习分享 - zt

博客分类：

tec.java.j2ee架构

MySQL lighttpd Cache 应用服务器 memcached

维基百科(WikiPedia.org)位列世界十大网站，目前排名第八位。这是开放的力量。

来点直接的数据：

峰值每秒钟3万个 HTTP 请求
每秒钟 3Gbit 流量, 近乎375MB
350 台 PC 服务器(数据来源)

架构示意图如下：
Copy @Mark Bergsma

在我写的这些网站架构的 Blog 中，GeoDNS 第一次出现，这东西是啥? "A 40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家，各个地域。

负载均衡：LVS

WikiPedia 用 LVS 做负载均衡, 是章文嵩博士发起的项目,也算中国人为数不多的在开源领域的骄傲啦。LVS 维护的一个老问题就是监控了，维基百科的技术人员用的是 pybal.

图片服务器:Lighttpd

Lighttpd 现在成了准标准图片服务器配置了。不多说。

Wiki 软件: MediaWiki

对 MediaWiki 的应用层优化细化得快到极致了。用开销相对比较小的方法定位代码热点，参见实时性能报告，瓶颈在哪里，看这样的图树展示一目了然。另外一个十分值得重视的经验是，尽可能抛弃复杂的算法、代价昂贵的查询，以及可能带来过度开销的 MediaWiki 特性。

Cache! Cache! Cache!

维基百科网站成功的第一关键要素就是 Cache 了。CDN(其实也算是 Cache) 做内容分发到不同的大洲、Squid 作为反向代理. 数据库 Cache 用 Memcached，30 台，每台 2G 。对所有可能的数据尽可能的Cache，但他们也提醒了 Cache 的开销并非永远都是最小的，尽可能使用，但不能过度使用。

数据库: MySQL

MediaWiki 用的DB 是 MySQL. MySQL 在 Web 2.0 技术上的常见的一些扩展方案他们也在使用。复制、读写分离......应用在 DB 上的负载均衡通过 LoadBalancer.php 来做到的，可以给我们一个很好的参考。

运营这样的站点，WikiPedia 每年的开支是 200 万美元，技术人员只有 6 个，惊人的高效。

参考文档：

Wikimedia architecture （PDF)
Todd Hoff 的文章

分享到：

Digg 网站架构 - zt | Web缓存加速指南 - zt

2008-02-26 21:56
浏览 1167
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

WikiPedia 技术架构学习分享 - zt

GeoDNS

负载均衡：LVS

图片服务器:Lighttpd

Wiki 软件: MediaWiki

Cache! Cache! Cache!

数据库: MySQL

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

WikiPedia 技术架构学习分享 - zt

GeoDNS

负载均衡：LVS

图片服务器:Lighttpd

Wiki 软件: MediaWiki

Cache! Cache! Cache!

数据库: MySQL

评论

发表评论

相关推荐

SSL and Varnish

PlentyOfFish 网站架构学习 - zt

性能扩展问题要趁早 - zt

高性能服务器设计 - zt

Yupoo! 的网站技术架构 - zt

说说大型高并发高负载网站的系统架构 - zt

使用开源软件，设计高性能可扩展互动网站 - zt

从LiveJournal后台发展看 大型网站系统架构以及性能优化方法 - zt

新浪发起的UNIX开源软件项目memcachedb - zt

Memcached学习摘要 - zt

实战web2.0技术篇-MemCache深度分析 - zt

Yahoo！社区架构 - zt

Tailrank 网站架构 - zt

Web缓存加速指南 - zt

Digg 网站架构 - zt

Twitter 的架构扩展: 100 倍性能提升 - zt

最便宜的高负载网站架构 - zt

分析mixi.jp and Yeejee.com：用开源搭建的可扩展大型SNS网站 - zt

开发大型高负载类网站应用的几个要点 - zt

FeedBurner:基于MySQL和JAVA的可扩展Web应用 - zt

最近访客更多访客>>

从LiveJournal后台发展看大型网站系统架构以及性能优化方法 - zt