`

百万级PHP网站架构方案

    博客分类:
  • php
阅读更多
在了解过世界最大的PHP站点,Facebook的后台技术后,今天我们来了解一个百万级PHP站点的网站架构:Poppen.de。 Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融合了很多技术,如 Nigix、MySql、CouchDB、Erlang、Memcached、RabbitMQ、PHP、Graphite、Red5以及Tsung。

Poppen.de目前有200万注册用户数、2万并发用户数、每天20万条私有消息、每天25万登录次数。而项目团队有11个开发人员,两个设计,两个系统管理员。该站点的商业模式采用免费增值模式,用户可以使用搜索用户、给好友发送消息、上载图片和视频等功能。

如果用户想享受不受限制发送消息和上载图片,那么就得根据需要支付不同类型的会员服务,视频聊天及网站其他服务也采用同样的策略。

Nginx
Poppen.de 所有的服务都是基于Nginx服务上的。前端有两台Nginx服务器在高峰期提供每分钟15万次请求的负载,每个机器已经有四年寿命,并且只有一个CPU 和3GB RAM。Poppen.de拥有三台独立的图像服务器,由三台Nginx服务器为*.bilder.poppen.de提供每分钟8万次请求服务。

Nginx 架构中一个很酷的设计就是有很多请求是由Memcached处理的,因此请求从缓存中获取内容而不需要直接访问PHP机器。比如,用户信息页(user profile)是网站需要密集处理的内容,如果把用户信息页全部缓存到Memcached上,那么请求直接从Memcached上获取内容。 Poppen.de的Memcached每分钟可以处理8000次请求。
架构中有三个Nginx图像服务器提供本地图像缓存,用户上载图 像到一个中央文件服务器。当向这三个Nginx之一中请求图像时,如果服务器本地中没有存在该图像,则从中央文件服务器下载到该服务器上作缓存并提供服务。这种负载均衡的分布式图像服务器架构设计可以减轻主要存储设备的负载。

PHP-FPM(PHP FastCGI进程管理器)

该网站运行在PHP- FPM上。共有28台双CPU、6GB内存的PHP机器,每个机器上运行100个PHP-FPM的工作线程。使用启用了APC的PHP5.3.x。 PHP5.3可以降低CPU和内存使用率的30%以上。

程序代码是基于Symfony1.2框架之上开发的。一是可以使用外部资源,二是 能够提高项目开发进度,同时在一个著名的框架上可以让新开发人员更容易加入到团队中来。虽然没有任何事情都是十全十美的,但可以从Symfony框架中得 到很多好处,让团队可以更多的精力放在Poppen.de的业务开发上去。
网站性能优化使用XHProf,这是Facebook开源出来的一个类库。这个框架非常容易个性化和配置,能够可以缓存大部分高代价的服务器计算。

MySQL
MySQL是网站主要的RDBMS。网站有几个MySql服务器:一台4CPU、32GB的服务器存储用户相关信息,如基本信息、照片描述信息等。这台机器已经使用了4 年,下一步计划会使用共享集群来替换它。目前仍基于这个系统上进行设计,以简化数据访问代码。根据用户ID进行数据分区,因为网站中大部分信息都是以用户 为中心的,如照片、视频、消息等。

有三台服务器按主-从-从配置架构提供用户论坛服务。一台从服务器负责网站自定义消息存储,到现在有 2.5亿条消息。另外四台机器为主-从配置关系。另外由4台机器配置成NDB族群专门服务于密集型写操作数据,如用户访问统计信息。

数据表设计尽量避免关联操作,尽可能缓存最多的数据。当然,数据库的结构化规范已经完全被破坏掉了。因此,为了更容易搜索,数据库设计创建了数据挖掘表。大部分表是MyISAM型表,可以提供快速查找。现在的问题是越来越多的表已经全表锁住了。Poppen.de正考虑往XtraDB存储引擎上迁移。

Memcached
网站架构中Memcached应用相当多,超过45GB的高速缓存和51个节点。缓存了Session会话、视图缓存以及函数执行缓存等。架构中有一个系统 当记录被修改时可以自动地把数据更新到缓存中去。未来改善缓存更新的可能方案是使用新的Redis Hash API(Redis是一个高性能的key-value数据库)或者MongoDB(B-tree设计的非分布式NoSQL数据库)。

RabbitMQ
RabbitMQ 是一个实现了AMQP协议的消息服务器。该版本引入一个全新的插件体系结构,提供更强的扩展性;外提升了集群处理中跨节点消息路由的性能;更严格的 channel.flow 来确保 RabbitMQ 阻止生产者停止发送消息的流程。

在 2009年中开始在架构中使用RabbitMQ。这是一个很好的消息解决方案,便于部署和集中到这个架构中去,在LVS(Linux Virtual Server,Linux服务器集群系统)后运行了两台RabbitMQ服务 器。在上个月,已经把更多的东西集成到该队列中,意味着同一时刻有28台PHP服务器每天要处理50万次请求。发送日志、邮件通知、系统消息、图像上载等 更多的东西到这个队列中。

应用PHP-FPM中的fastcgi_finish_request()函数集成队列消息,可以把消息异步发 送到队列中。当系统需要给用户发送HTML或JSON格式响应时,就调用这个函数,这样用户就没有必要等到PHP脚本清理。

这个系统可以改善架构资源管理。例如,在高峰期服务每分钟可以处理1000次登录请求。这表示有1000并发更新用户表保存用户的登录时间。由于使用了队列机制,可以 按相反的顺序来运行这些查询。如果需要提高处理速度,只需要增加更多的队列处理者即可,甚至可以增加更多的服务器到这集群中去,而不需要修改任何配置和部 署新节点。

CouchDB
CouchDB 是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作,并可以通过视图来操纵文档的组织和呈现。 CouchDB 也是 Apache 基金会的顶级开源项目。
日志存储CouchDB运行在一台机器上。在这台机器上可以根据模块/ 行为进行日志查询 /分组,或者根据错误类型等等。这对定位问题非常有用。在使用日志聚合服务CouchDB之前,不得不逐台登录到PHP服务器上设法日志分析定位问题,这是非常麻烦的。而现在把所有的日志集中到队列中保存到CouchDB中,可以集中进行问题检查和分析。

Graphite
网站使用Graphite采集网站实时信息并统计。从请求每个模块/行为到Memcached的命中和未命中、RabbitMQ状态监控以及Unix负载等等。Graphite服务平均每分钟有4800次更新操作。实践已经证实要监测网站发发生什么是非常有用的,它的简单文本协议和绘图功能可以方便地即插即 用的方式用于任何需要监控的系统上。
一件很酷的事情是使用Graphite同时监控了网站的两个版本。一月份部署了Symfony框架新 版本,以前代码作为一个备份部署。这就意味着网站可能会面临性能问题。因此可以使用Graphite来对两个版本在线进行对比。
发现新版本上的Unix负载表较高,于是使用XHProf对两个版本进行性能分析,找出问题所在。

Red5
网站为用户也提供了两种类型的视频服务,一种是用户自己上载的视频,另外一种是视频聊天,用户视频互动和分享。到2009年年中,每月为用户提供17TB的流量服务。

Tsung
Tsung 是一个Erlang编写的分布式基准分析工具。在Poppen.de网站中主要用于HTTP基准分析、MySQL与其他存储系统(XtraDB)的对比分 析。用一个系统记录了主要的MySQL服务器的流量,再转换成Tsung的基准会话。然后对该流量进行回放,由Tsung产生数以千计的并发用户访问实验 室的服务器。这样就可以在实验环境中与真实场景非常接近。

XHProf
XHProf是一个分层PHP性能分析工具。它报告函数级别的请求次数和各种指标,包括阻塞时间,CPU时间和内存使用情况。一个函数的开销,可细分成调用者和被调用者的开销。原始数据收集部分是用纯C实现的,是一个名叫xhprof的 Zend扩展 。
分享到:
评论

相关推荐

    可扩展、高可用、负载均衡网站架构设计方案

    可扩展、高可用、负载均衡网站架构设计方案 本文将详细介绍一个可扩展、高可用、负载均衡网站架构设计方案,该方案旨在解决高访问量网站的性能和可靠性问题。该方案包括以下几个方面: 一、基本需求 1. 高可用性...

    PHP进阶之路 - 周梦康亿级 PV 网站架构的技术细节 .docx

    1、亿级 pv 网站架构的技术细节与套路 2、亿级pv网站架构实战之性能压榨 3、做一名优秀的工程师入门篇 4、后端多元化之快速切入Java开发 5、如何在面试中脱颖而出 6、零基础构建自己的服务治理框架(上) 7、零...

    Linux-Apache-MySQL-PHP网站架构方案分析

    Linux-Apache-MySQL-PHP(LAMP)网站架构是一种广泛应用的开源技术组合,尤其适合构建Web服务。这个架构的核心组件包括: 1. **Linux操作系统**:Linux是免费且开源的Unix-like操作系统,提供了多种发行版,如Red ...

    LAMP网站架构方案+安装配置详解

    本文旨在详细介绍LAMP网站架构方案的安装配置和详解,涵盖从Linux操作系统到Apache网络服务器、MySQL数据库、PHP编程语言的各个方面,旨在帮助读者了解LAMP架构的整体架构和实现方法。 一、LAMP架构的整体架构 ...

    天翼云高级解决方案架构师认证重点知识点V2.0.1

    天翼云高级解决方案架构师认证重点知识点V2.0.1 天翼云高级解决方案架构师认证重点知识点V2.0.1是架构设计基础必备掌握知识点的集合。本节课将详细介绍IT架构设计的演进过程、云上IT架构设计的演进过程,并对传统IT...

    LAMP网站架构方案 安装配置详解

    LAMP网站架构是目前国际上非常流行的网站开发与部署方案,它以开源、跨平台、高性能和低价格的优势,在互联网中广泛应用。LAMP分别代表Linux操作系统、Apache网络服务器、MySQL数据库、Perl/PHP/Python编程语言。...

    一种面向中小型企业的WebMIS架构方案

    【WebMIS 架构方案概述】 WebMIS(Web-based Management Information System)是一种基于Web技术的管理信息系统,它利用互联网技术将企业内部的信息管理和业务流程整合在一起,提供了一个便捷、高效的在线工作环境...

    LAMP网站架构方案分析.pdf

    LAMP(Linux-Apache-MySQL-PHP)网站架构是一种广泛应用的开源Web开发框架,尤其适合构建大流量、高并发的网站系统。该架构的核心组件包括: 1. **Linux操作系统**:作为开源操作系统,Linux提供了多个发行版,如...

    亿级 pv 网站架构的技术细节与套路

    ### 亿级PV网站架构的技术细节与套路 在构建能够支撑亿级页面访问量(PV)的大型网站架构过程中,需要关注多个方面的技术细节与实践经验。以下内容将围绕这一主题展开,详细介绍包括但不限于后端架构设计、服务治理...

    微服务架构设计方案.docx

    单体架构(Monolithic Architecture)是企业级应用的常见方式,会把大量功能堆积到同一个单体架构中去。单体架构的初期效率很高,应用会随着时间推移逐渐变大。在每次的迭代中,开发团队都会面对新功能,然后开发...

    婚恋网站架构方案.pdf

    婚恋网站架构方案是一个综合性的系统设计,旨在构建一个高效、安全且用户友好的在线交友平台。该方案采用PHP+MYSQL作为技术基础,运行于UNIX操作系统,旨在为用户提供一个稳定且高效的交友环境。 **系统核心架构** ...

    LAMP网站架构方案分析.doc

    LAMP(Linux-Apache-MySQL-PHP)网站架构是一种广泛应用的开源技术组合,用于构建高效、可扩展的Web应用程序。这一框架的核心组件包括Linux操作系统、Apache HTTP服务器、MySQL数据库管理系统以及Perl、PHP或Python...

    架构PHPMySQL方案.pdf

    一个pdf文档,简要介绍linux和windows下架构php的注意点。相信你可以从中学到不同的东西!

    高并发网站架构设计方案

    【标题】: "高并发网站架构设计方案" 【描述】: "设计高并发网站架构的关键在于优化性能和确保系统的稳定性,以应对大规模用户访问的压力。本文将探讨几种关键的策略和技术,包括网页HTML静态化、图片服务器分离、...

    mysql性能优化PHP高级开发工程师架构设计

    另外,根据业务需求,适时引入分布式数据库解决方案,如MyCat或ShardingSphere,可以进一步提升处理能力和可用性。 总之,MySQL性能优化、PHP高级开发和架构设计三者相辅相成,共同构建高效稳定的系统。开发者不仅...

    AWS(亚马逊)云解决方案架构师面试实践过程作业全英文PPT演示

    综上所述,AWS云解决方案架构师在面试中应展示出对业务需求的深刻理解,设计出满足这些需求的架构方案,并能清晰地阐述其优势和成本效益。这份全英文PPT演示文档将有助于准备面试者熟悉这一流程,避免在实际面试中走...

    B2B分站式网站架构开发方案书.docx

    【B2B分站式网站架构开发方案书】 在当今数字化商业环境中,B2B(Business-to-Business)电子商务网站已成为企业间交易的重要平台。一个高效且适应性强的B2B分站式网站架构对于企业的在线业务拓展至关重要。本方案...

    网站架构之负载均衡必须要考虑的八个方案

    本文将基于标题“网站架构之负载均衡必须要考虑的八个方案”以及相关内容,深入探讨负载均衡在网站架构中的应用与策略。 ### 1. 静态HTML页面缓存 对于大型网站而言,静态HTML页面缓存是一项非常实用的技术。通过...

Global site tag (gtag.js) - Google Analytics