`
daniel_tu
  • 浏览: 182617 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

一个PHP巨型网站的架构

    博客分类:
  • Web
阅读更多

Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融合了很多技术,如 Nigix、MySql、CouchDB、Erlang、Memcached、RabbitMQ、PHP、Graphite、Red5以及Tsung。

统 计信息

  • 200万注册用户数;
  • 2万并发用户数;
  • 每天20万条私有消息;
  • 每 天25万登录次数;
  • 项目团队有11个开发人员,两个设计,两个系统管理员;


商业模式
该 网站采用免费增值模式,用户可以免费使用下面任何服务:

  • 搜索其他用户;
  • 给好友发送消息;
  • 上 载图片和视频;
  • 寻找好友;
  • 视频聊天;
  • 更多…

但如果用户想享受不受限制发送消 息和上载图片,那么就得根据需要支付不同类型的会员服务,视频聊天及网站其他服务也采用同样的策略。

工具箱
Nginx
Poppen.de 所有的服务都是基于Nginx服务上的。前端有两台Nginx服务器在高峰期提供每分钟15万次请求的负载,每个机器已经有四年寿命,并且只有一个CPU 和3GB RAM。Poppen.de拥有三台独立的图像服务器,由三台Nginx服务器为*.bilder.poppen.de提供每分钟8万次请求服务。

Nginx 架构中一个很酷的设计就是有很多请求是由Memcached处理的,因此请求从缓存中获取内容而不需要直接访问PHP机器。比如,用户信息页(user profile)是网站需要密集处理的内容,如果把用户信息页全部缓存到Memcached上,那么请求直接从Memcached上获取内容。 Poppen.de的Memcached每分钟可以处理8000次请求。

架构中有三个Nginx图像服务器提供本地图像缓存,用户上载图 像到一个中央文件服务器。当向这三个Nginx之一中请求图像时,如果服务器本地中没有存在该图像,则从中央文件服务器下载到该服务器上作缓存并提供服 务。这种负载均衡的分布式图像服务器架构设计可以减轻主要存储设备的负载。

PHP-FPM
该网站运行在PHP- FPM上。共有28台双CPU、6GB内存的PHP机器,每个机器上运行100个PHP-FPM的工作线程。使用启用了APC的PHP5.3.x。 PHP5.3可以降低CPU和内存使用率的30%以上。

程序代码是基于Symfony1.2框架之上开发的。一是可以使用外部资源,二是 能够提高项目开发进度,同时在一个著名的框架上可以让新开发人员更容易加入到团队中来。虽然没有任何事情都是十全十美的,但可以从Symfony框架中得 到很多好处,让团队可以更多的精力放在Poppen.de的业务开发上去。

网站性能优化使用XHProf,这是Facebook开源出来 的一个类库。这个框架非常容易个性化和配置,能够可以缓存大部分高代价的服务器计算。

MySQL
MySQL是网站 主要的RDBMS。网站又几个MySql服务器:一台4CPU、32GB的服务器存储用户相关信息,如基本信息、照片描述信息等。这台机器已经使用了4 年,下一步计划会使用共享集群来替换它。目前仍基于这个系统上进行设计,以简化数据访问代码。根据用户ID进行数据分区,因为网站中大部分信息都是以用户 为中心的,如照片、视频、消息等。

有三台服务器按主-从-从配置架构提供用户论坛服务。一台从服务器负责网站自定义消息存储,到现在有 2.5亿条消息。另外四台机器为主-从配置关系。

另外由4台机器配置成NDB族群专门服务于密集型写操作数据,如用户访问统计信息。

数 据表设计尽量避免关联操作,尽可能缓存最多的数据。当然,数据库的结构化规范已经完全被破坏掉了。因此,为了更容易搜索,数据库设计创建了数据挖掘表。

大 部分表是MyISAM型表,可以提供快速查找。现在的问题是越来越多的表已经全表锁住了。Poppen.de正考虑往XtraDB存储引擎上迁移。

Memcached
网 站架构中Memcached应用相当多,超过45GB的高速缓存和51个节点。缓存了Session会话、视图缓存以及函数执行缓存等。架构中有一个系统 当记录被修改时可以自动地把数据更新到缓存中去。未来改善缓存更新的可能方案是使用新的Redis Hash API或者MongoDB。

RabbitMQ
在 2009年中开始在架构中使用RabbitMQ。这是一个很好的消息解决方案,便于部署和集中到这个架构中去,在LVS后运行了两台RabbitMQ服务 器。在上个月,已经把更多的东西集成到该队列中,意味着同一时刻有28台PHP服务器每天要处理50万次请求。发送日志、邮件通知、系统消息、图像上载等 更多的东西到这个队列中。

应用PHP-FPM中的fastcgi_finish_request()函数集成队列消息,可以把消息异步发 送到队列中。当系统需要给用户发送HTML或JSON格式响应时,就调用这个函数,这样用户就没有必要等到PHP脚本清理。

这个系统可以 改善架构资源管理。例如,在高峰期服务每分钟可以处理1000次登录请求。这表示有1000并发更新用户表保存用户的登录时间。由于使用了队列机制,可以 按相反的顺序来运行这些查询。如果需要提高处理速度,只需要增加更多的队列处理者即可,甚至可以增加更多的服务器到这集群中去,而不需要修改任何配置和部 署新节点。

CouchDB
日志存储CouchDB运行在一台机器上。在这台机器上可以根据模块/行为进行日志查询 /分组,或者根据错误类型等等。这对定位问题非常有用。在使用日志聚合服务CouchDB之前,不得不逐台登录到PHP服务器上设法日志分析定位问题,这 是非常麻烦的。而现在把所有的日志集中到队列中保存到CouchDB中,可以集中进行问题检查和分析。

Graphite
网 站使用Graphite采集网站实时信息并统计。从请求每个模块/行为到Memcached的命中和未命中、RabbitMQ状态监控以及Unix负载等 等。Graphite服务平均每分钟有4800次更新操作。实践已经证实要监测网站发发生什么是非常有用的,它的简单文本协议和绘图功能可以方便地即插即 用的方式用于任何需要监控的系统上。

一件很酷的事情是使用Graphite同时监控了网站的两个版本。一月份部署了Symfony框架新 版本,以前代码作为一个备份部署。这就意味着网站可能会面临性能问题。因此可以使用Graphite来对两个版本在线进行对比。

发现新版 本上的Unix负载表较高,于是使用XHProf对两个版本进行性能分析,找出问题所在。

Red5
网站为用户也提 供了两种类型的视频服务,一种是用户自己上载的视频,另外一种是视频聊天,用户视频互动和分享。到2009年年中,每月为用户提供17TB的流量服务。

Tsung
Tsung 是一个Erlang编写的分布式基准分析工具。在Poppen.de网站中主要用于HTTP基准分析、MySQL与其他存储系统(XtraDB)的对比分 析。用一个系统记录了主要的MySQL服务器的流量,再转换成Tsung的基准会话。然后对该流量进行回放,由Tsung产生数以千计的并发用户访问实验 室的服务器。这样就可以在实验环境中与真实场景非常接近。

memcache mysql Nginx 公司的项目一直有在用。别的就没接触过了。现在的项目压测时并发到1000多就会出现各种各样的问题了。不知道什么时候能有机会接触到这样宠大的系统架构。

PHP和配套的一系列东西现在承载了很多牛B的网站。facebook这样的架构也能用php实现。大有可为。大有可为

分享到:
评论

相关推荐

    巨型睡莲优化算法2023

    巨型睡莲优化算法2023新出的算法 测试函数对比 效果不错 巨型睡莲优化算法2023新出的算法 测试函数对比 效果不错 巨型睡莲优化算法2023新出的算法 测试函数对比 效果不错 巨型睡莲优化算法2023新出的算法 测试函数...

    搜:通向世界的巨型引擎.rar

    “A5下载- 更全的站长资源平台.url”是一个快捷方式或者书签,指向A5网站,这是一个提供各种站长资源和服务的平台,包括但不限于网站模板、插件、SEO工具和网络营销策略等。这可能为学习者提供了额外的参考资料和...

    巨型柱核心筒结构设计研究

    首先,巨型柱核心筒结构体系是一种新型的高层建筑结构体系,它的特点是通过巨型型钢混凝土柱构成的巨型框架和钢筋混凝土筒体结构共同工作,形成了一个高效的抗侧力系统。这种结构体系具有很好的灵活性和高效性,它在...

    超高层结构复杂截面钢管混凝土巨型柱设计与建造技术.ppt

    超高层结构复杂截面钢管混凝土巨型柱设计与建造技术

    千万级巨型汉语词库【目录】.zip

    标题中的“千万级巨型汉语词库【目录】.zip”表明这是一个包含大量汉语词汇的数据集,主要用于自然语言处理(NLP)和知识图谱相关的研究或应用。这个压缩包可能包含了一个文本文件“千万级巨型汉语词库【目录】.txt...

    CDN运营支撑平台架构实践.pdf

    - CDN是云架构的一种应用平台,具有虚拟化、分布化、服务按需化等特点。 - CDN能改善网站响应能力和提高访问的可靠性、可用性。 - CDN架构具备良好的负载均衡能力和快速的服务部署能力。 5. CDN基本架构原理: ...

    学校(fzu)布置的作业,自己写的巨型整数类(C++)

    在本项目中,学生以C++编程语言实现了自定义的巨型整数类,这是一个用于处理大整数计算的高级数据结构。在C++中,标准库并没有提供原生支持超大整数运算的功能,因此这样的类设计对于学习者来说是一个挑战,同时也...

    巨型整数的加减乘除运算

    在这个程序中提供. 用字符串.长整形初始化一个巨型整数 巨型整数程序实现了巨型整数的加减乘除运算

    工业上巨型帧应用讲解.zip

    通常,标准以太网的MTU大小为1500字节,但巨型帧可以扩展到远远超过这个限制,一般可达9000字节或更大。这种技术的引入旨在提高网络性能,减少数据传输的分片和重组,从而降低延迟和提高带宽利用率。 **巨型帧的...

    巨型帧技术优劣分析.pdf

    巨型帧(Jumbo Frame)技术是一种旨在提高以太网性能的解决方案,它通过增加帧的大小来减少网络包的处理数量,从而提高网络的带宽和吞吐量。然而,自从巨型帧技术被提出来已经过去十年了,但它仍然没有被广泛采纳和...

    论文研究 - 巨型芒草的增长率(

    美国能源部目前正在制定扩大清洁和可再生能源来源的战略,而高大,生长Swift的草丛,例如巨型桔梗(Miscanthus×giganteus)和巨型芦苇(Arundo donax)是众多物种中的两个可以填补这一可再生能源的利基市场。...

    CDN运营支撑平台架构实践

    本文将围绕“CDN运营支撑平台架构实践”这一主题,探讨云架构的发展趋势、互联网商业架构的趋势以及在网络问题下如何构建高效的CDN运营支撑平台。 #### 二、云架构发展趋势 云架构是指利用网络技术将计算资源、...

    巨型花明兔品种简介.pdf

    巨型花明兔,又称为Flemish Giant,是一种体型...如果你有足够的精力和资源来照顾这种大型兔子,那么巨型花明兔会成为一个忠诚且友好的伴侣。然而,对于没有经验或者居住环境有限的人来说,这种兔种可能不是最佳选择。

    从单体式应用到微服务的架构演变.docx

    在现代软件开发中,单体式应用(monolith)是指一个包含所有功能和组件的巨型应用程序。然而,随着业务规模的扩大和技术的更新,单体式应用会出现各种问题,如难以维护、扩展和更新。因此,逐渐将单体式应用拆分成...

    巨型文件编辑器

    当你打开日志或是更多内容的Txt时,普通的文件编辑器无法打开,可以使用这个打开巨型的文档

    S-对偶与巨型磁子色散关系

    我们使用S-对偶性和平面性为AdS5×S5上的IIB型弦理论中的巨型磁子解的色散关系的非重新归一化提出了一个论点。 我们使用N = 4超级杨米尔斯的库仑分支中带电和磁荷超对称态的中心电荷特性,通过强耦合从场论计算了(p...

    基于java的开发源码-写的巨型LCD液晶时钟显示屏.zip

    基于java的开发源码-写的巨型LCD液晶时钟显示屏.zip 基于java的开发源码-写的巨型LCD液晶时钟显示屏.zip 基于java的开发源码-写的巨型LCD液晶时钟显示屏.zip 基于java的开发源码-写的巨型LCD液晶时钟显示屏.zip 基于...

    国产巨型机

    - 银河—Ⅰ:1983年,国防科技大学研制出中国第一台亿次巨型电子计算机,表明中国成为能够独立设计和制造巨型机的国家之一。 - 银河—Ⅱ:1992年,国防科大推出的10亿次巨型计算机,填补了我国在大型科学工程计算...

    行业分类-设备装置-一种将废旧巨型工程轮胎分解的设备.zip

    在当前的环保与资源再利用领域,废旧巨型工程轮胎的处理是一个重要的课题。"行业分类-设备装置-一种将废旧巨型工程轮胎分解的设备.zip"这个压缩包文件中,主要探讨了一种创新的设备设计,专门用于高效、安全地分解...

    巨型文件切割机.zip

    文件分割是一种将一个大文件分解为多个小文件的过程,通常用于解决电子邮件附件大小限制、存储空间不足以及加快文件传输速度等问题。在《巨型文件切割机》中,用户可以选择自定义分割大小或按份数进行切割,这样可以...

Global site tag (gtag.js) - Google Analytics