`
zhengdl126
  • 浏览: 2552915 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类

PHP搭建百万级网站架构技术揭秘:Poppen.de德国社交

阅读更多

 在了解过世界最大的PHP 站点,Facebook的后台技术后,今天我们来了解一个百万级PHP站点的网站架构:Poppen.de。Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融合了很多技术,如 Nigix、MySql 、CouchDB、Erlang、Memcached、RabbitMQ、PHP、Graphite、Red5以及Tsung。

统计信息

◆200万注册用户数;

◆2万并发用户数;

◆每天20万条私有消息;

◆每天25万登录次数;

◆项目团队有11个开发人员,两个设计,两个系统管理员;

商业模式

该网站采用免费增值模式,用户可以免费使用下面任何服务:

◆搜索其他用户;

◆给好友发送消息;

◆上载图片和视频;

◆寻找好友;

◆视频聊天;

◆更多…

但如果用户想享受不受限制发送消息和上载图片,那么就得根据需要支付不同类型的会员服务,视频聊天及网站其他服务也采用同样的策略。

工具箱

Nginx

Poppen.de 所有的服务都是基于Nginx服务上的。前端有两台Nginx服务器在高峰期提供每分钟15万次请求的负载,每个机器已经有四年寿命,并且只有一个CPU 和3GB RAM。Poppen.de拥有三台独立的图像服务器 ,由三台Nginx服务器为*.bilder.poppen.de提供每分钟8万次请求服务。

Nginx 架构中一个很酷的设计就是有很多请求是由Memcached处理的,因此请求从缓存中获取内容而不需要直接访问PHP机器。比如,用户信息页(user profile)是网站需要密集处理的内容,如果把用户信息页全部缓存到Memcached上,那么请求直接从Memcached上获取内容。 Poppen.de的Memcached每分钟可以处理8000次请求。

架构中有三个Nginx图像服务器提供本地图像缓存,用户上载图 像到一个中央文件服务器。当向这三个Nginx之一中请求图像时,如果服务器本地中没有存在该图像,则从中央文件服务器下载到该服务器上作缓存并提供服 务。这种负载均衡的分布式图像服务器架构设计可以减轻主要存储设备的负载。

PHP-FPM

该网站运行在PHP- FPM上。共有28台双CPU、6GB内存的PHP机器,每个机器上运行100个PHP-FPM的工作线程。使用启用了APC的PHP5.3.x。 PHP5.3可以降低CPU和内存使用率的30%以上。

程 序代码是基于Symfony1.2框架之上开发的。一是可以使用外部资源,二是 能够提高项目开发进度,同时在一个著名的框架上可以让新开发人员更容易加入到团队中来。虽然没有任何事情都是十全十美的,但可以从Symfony框架中得 到很多好处,让团队可以更多的精力放在Poppen.de的业务开发上去。

网站性能优化使用XHProf,这是Facebook开源出来的一个类库。这个框架非常容易个性化和配置,能够可以缓存大部分高代价的服务器计算。

MySQL

MySQL 是网站 主要的RDBMS。网站又几个MySql服务器:一台4CPU、32GB的服务器存储用户相关信息,如基本信息、照片描述信息等。这台机器已经使用了4 年,下一步计划会使用共享集群来替换它。目前仍基于这个系统上进行设计,以简化数据访问代码。根据用户ID进行数据分区,因为网站中大部分信息都是以用户 为中心的,如照片、视频、消息等。

有三台服务器按主-从-从配置架构提供用户论坛服务。一台从服务器负责网站自定义消息存储,到现在有 2.5亿条消息。另外四台机器为主-从配置关系。另外由4台机器配置成NDB族群专门服务于密集型写操作数据,如用户访问统计信息。

数 据表设计尽量避免关联操作,尽可能缓存最多的数据。当然,数据库的结构化规范已经完全被破坏掉了。因此,为了更容易搜索,数据库设计创建了数据挖掘表。大 部分表是MyISAM型表,可以提供快速查找。现在的问题是越来越多的表已经全表锁住了。Poppen.de正考虑往XtraDB存储引擎上迁移。

Memcached

网 站架构中Memcached应用相当多,超过45GB的高速缓存和51个节点。缓存了Session会话、视图缓存以及函数执行缓存等。架构中有一个系统 当记录被修改时可以自动地把数据更新到缓存中去。未来改善缓存更新的可能方案是使用新的Redis Hash API或者MongoDB。

RabbitMQ

在 2009年中开始在架构中使用RabbitMQ。这是一个很好的消息解决方案,便于部署和集中到这个架构中去,在LVS后运行了两台RabbitMQ服务 器。在上个月,已经把更多的东西集成到该队列中,意味着同一时刻有28台PHP服务器每天要处理50万次请求。发送日志、邮件通知、系统消息、图像上载等 更多的东西到这个队列中。

应用PHP-FPM中的fastcgi_finish_request()函数集成队列消息,可以把消息异步发 送到队列中。当系统需要给用户发送HTML或JSON格式响应时,就调用这个函数,这样用户就没有必要等到PHP脚本清理。

这 个系统可以改善架构资源管理。例如,在高峰期服务每分钟可以处理1000次登录请求。这表示有1000并发更新用户表保存用户的登录时间。由于使用了队列 机制,可以 按相反的顺序来运行这些查询。如果需要提高处理速度,只需要增加更多的队列处理者即可,甚至可以增加更多的服务器到这集群中去,而不需要修改任何配置和部 署新节点。

CouchDB

日志存储CouchDB运行在一台机器上。在这台机器上可以根据模块/行为进行日志查询 /分组,或者根据错误类型等等。这对定位问题非常有用。在使用日志聚合服务CouchDB之前,不得不逐台登录到PHP服务器上设法日志分析定位问题,这 是非常麻烦的。而现在把所有的日志集中到队列中保存到CouchDB中,可以集中进行问题检查和分析。

Graphite

网 站使用Graphite采集网站实时信息并统计。从请求每个模块/行为到Memcached的命中和未命中、RabbitMQ状态监控以及Unix负载等 等。Graphite服务平均每分钟有4800次更新操作。实践已经证实要监测网站发发生什么是非常有用的,它的简单文本协议和绘图功能可以方便地即插即 用的方式用于任何需要监控的系统上。

一件很酷的事情是使用Graphite同时监控了网站的两个版本。一月份部署了Symfony框架新 版本,以前代码作为一个备份部署。这就意味着网站可能会面临性能问题。因此可以使用Graphite来对两个版本在线进行对比。

发现新版本上的Unix负载表较高,于是使用XHProf对两个版本进行性能分析,找出问题所在。

Red5

网站为用户也提供了两种类型的视频服务,一种是用户自己上载的视频,另外一种是视频聊天,用户视频互动和分享。到2009年年中,每月为用户提供17TB的流量服务。

Tsung

Tsung 是一个Erlang编写的分布式基准分析工具。在Poppen.de网站中主要用于HTTP基准分析、MySQL与其他存储系统(XtraDB)的对比分 析。用一个系统记录了主要的MySQL服务器的流量,再转换成Tsung的基准会话。然后对该流量进行回放,由Tsung产生数以千计的并发用户访问实验 室的服务器。这样就可以在实验环境中与真实场景非常接近。

分享到:
评论

相关推荐

    Titan-Newsfeed:此版本基于石墨数据库(Titan)构建,因预算有限而放弃。 所以它可以作为未来的参考发布

    泰坦新闻提要服务此版本基于石墨... +--------------------+ +---------------------+ | | | | | Poppen.de | | Newsfeed Service | | | | | +--------------------+ +---------------------+ | | Http(Restful) Tita

    com.visionsecurity

    更新至SDK 3-支持Homey v5-新开发者(Martijn Poppen) V1.4.8 ZP3102篡改运动和二进制触点拆分 V1.4.7 ZG8101额外输入分配 V1.4.6 ZM1602脚架动作流程 V1.4.4 ZM8101添加了产品ID和产品类型ID V1.4.2 ZM1602...

    popn-rankchart:https

    弹出顺序表此页面用于在PopPen音乐的每个级别的排名表上标记奖牌。 可以按歌曲/难度级别进行标记,并且可以通过“保存”按钮将其另存为图像。 创建人: 建造安装npm install开放式开发服务器npm run dev

    .NET5仓储管理系统:集成EFCore、Redis缓存、RabbitMQ等技术实现企业级应用

    内容概要:本文详细介绍了基于.NET5开发的一个仓储管理系统,涵盖了多个关键技术的应用。首先,在数据访问方面,使用了EF Core进行ORM操作,并引入了全局逻辑删除和多租户过滤等功能。其次,权限管理部分采用Policy机制实现动态按钮权限控制,权限数据存储于Redis中,确保高效响应。再次,消息队列方面,通过RabbitMQ实现库存变动后的异步通知,保障库存数据的一致性和可靠性。此外,系统还支持多租户模式,能够根据不同租户的需求灵活切换数据库连接。前端则选择了LayUI作为主要框架,配合WebSocket实现库存变化的实时推送。部署环节涉及Ocelot网关、Consul服务注册以及Docker容器化部署,确保系统的高可用性和扩展性。 适合人群:具有一定.NET开发经验的研发人员和技术爱好者。 使用场景及目标:适用于希望深入了解.NET5企业级应用开发的技术人员,尤其是对仓储管理系统感兴趣的人群。通过学习本文,读者可以掌握如何将多种现代技术集成到一个完整的解决方案中,从而提高开发效率和系统性能。 其他说明:文中提供了大量实际代码片段,帮助读者更好地理解和实践相关技术。同时,作者分享了许

    中国联通自智网络技术白皮书-云光和云网专线场景的技术特征与应用

    内容概要:本文档是中国联通发布的关于自智网络技术白皮书,详细介绍了云光和云网专线场景下的自智网络技术。主要内容涵盖行业洞察、中国联通专线自智网络概述、云光和云网专线自智网络的技术特征、分级标准及其关键技术,以及专线自智网络的分级测评和认证体系。文中强调了自智网络在提升网络智能化、自动化方面的关键作用,特别是在云光和云网专线场景的应用,旨在为行业客户提供高品质的专线服务,促进网络向融合化、智能化、绿色化发展。 适合人群:适用于通信行业的技术人员、研究人员、管理人员,尤其是关注自智网络技术及其应用的专业人士。 使用场景及目标:①帮助行业客户理解自智网络技术在云光和云网专线场景中的应用;②为运营商提供技术参考,提升网络智能化水平;③促进产业链上下游协同发展,推动自智网络的商业化应用。 其他说明:本文档不仅提供了详细的理论和技术解析,还结合了中国联通的实际案例,展示了自智网络在实际应用中的成效和发展前景。

    三菱Q系列PLC在液晶电视导光板加工中的应用:QD75MH总线伺服与自动化控制系统详解

    内容概要:本文详细介绍了三菱Q系列PLC在液晶电视导光板加工中的应用案例。主要内容涵盖Q系列PLC的使用、QD75MH定位模块和SSNET总线伺服的应用、伺服控制、触摸屏程序设计以及温控器的使用。文中不仅提供了详细的硬件配置和软件编程实例,还深入解析了各个组件的工作原理及其协同工作的机制。此外,文章还分享了一些实际操作中的经验和常见问题解决方案,如伺服控制中的加减速曲线优化、温控器的Modbus通讯调试、以及总线通讯中的丢包问题处理等。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是对三菱Q系列PLC和伺服控制系统感兴趣的读者。 使用场景及目标:适用于液晶电视导光板加工生产线的设计、安装、调试和维护。目标是帮助技术人员理解和掌握三菱Q系列PLC及相关组件的应用,提升系统的稳定性和精度。 其他说明:文章通过具体的代码示例和实际操作经验,展示了如何利用三菱Q系列PLC实现高效、稳定的工业自动化控制。对于希望深入了解工业自动化控制技术和三菱PLC编程的读者来说,是一份非常有价值的参考资料。

    (源码)基于Go语言的用户积分系统 PointSystem.zip

    # 基于Go语言的用户积分系统 PointSystem ## 项目简介 本项目是一个基于Go语言的用户积分系统,旨在实现常见的用户积分功能,包括积分的获取、扣除和查询等。该系统适用于各种需要用户积分的场景,如购物网站、社区论坛等。 ## 项目的主要特性和功能 1. 用户积分管理系统能够记录用户的积分变化,包括增加积分和减少积分。 2. 积分查询用户可以查询自己的总积分。 3. 积分明细查询用户可以查询自己的积分变化明细,包括积分增加和扣除的记录。 4. 日志记录系统能够记录操作日志,方便问题追踪和审计。 ## 安装使用步骤 1. 确保已安装Go语言环境,并设置好环境变量。 2. 下载项目的源代码文件,解压到本地目录。 3. 在项目根目录下,找到并打开文件 confconf.go,根据实际需求修改数据库连接配置信息(mysqlHost、mysqlUsername、mysqlPassword、mysqlDb 和 LogPath)。

    (源码)基于Arduino的SIMONTRONI游戏.zip

    # 基于Arduino的SIMONTRONI游戏 ## 项目简介 SIMONTRONI是一个基于Arduino的交互式记忆游戏。玩家需要记住并重复由LED灯显示的随机序列。随着游戏的进行,序列的长度会逐渐增加,挑战玩家的记忆能力。该项目还包括一个音量调节功能,通过旋钮调节游戏音量。 ## 项目的主要特性和功能 1. 记忆挑战玩家需要记住并重复LED灯显示的序列。 2. 多级游戏随着游戏的进行,序列的长度会逐渐增加,增加游戏的难度。 3. 音量调节通过旋钮调节游戏音量,满足不同玩家的需求。 4. 硬件交互使用Arduino Uno、LED灯、按钮和电阻等硬件组件,实现游戏的物理交互。 ## 安装使用步骤 1. 准备硬件 1个Arduino Uno 4个LED灯 4个按钮 1个蜂鸣器 1个5k电位器 若干电阻(220和330) 1个面包板和若干导线 2. 下载代码

    sqlite-devel-3.26.0-15.el8.x64-86.rpm.tar.gz

    1、文件说明: Centos8操作系统sqlite-devel-3.26.0-15.el8.rpm以及相关依赖,全打包为一个tar.gz压缩包 2、安装指令: #Step1、解压 tar -zxvf sqlite-devel-3.26.0-15.el8.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm

    (源码)基于Python的迷宫探索强化学习项目.zip

    # 基于Python的迷宫探索强化学习项目 ## 项目简介 本项目是一个基于强化学习算法的迷宫探索任务。它使用Python编程语言和多种强化学习算法(如QLearning、Sarsa、Sarsa Lambda等)来训练智能体,使其在随机变化的迷宫环境中找到最短路径到达目标点。 ## 项目的主要特性和功能 1. 迷宫环境模拟项目使用CSV文件定义迷宫地图,模拟二维迷宫环境,包括障碍物、悬崖和终点等。 2. 强化学习算法实现实现了QLearning、Sarsa、Sarsa Lambda等强化学习算法,用于智能体的决策过程。 3. 奖励函数设计设计了多种奖励函数,包括距离奖励、危险区域惩罚、防止终点区域“守株待兔”现象和重复路径惩罚等,以引导智能体更好地探索迷宫。 4. 经验回放策略采用了经验回放策略,以提高数据利用效率并稳定学习过程。 5. 可视化界面提供了基于pygame库的可视化界面,用于展示迷宫的布局、智能体的移动和奖励曲线等。

    JAVA画图形学(论文+源代码).zip

    Java项目课程设计,包含源码+数据库+论文

    (源码)基于Vue框架的商家管理系统.zip

    # 基于Vue框架的商家管理系统 ## 项目简介 本项目是一个基于Vue框架开发的前端项目,主要实现了商家展示、搜索、购物车管理、用户评价等功能。通过本项目的学习和实践,可以深入理解Vue框架的核心思想和相关技术要点,包括组件化开发、异步数据处理、动态数据展示等。 ## 项目的主要特性和功能 1. 异步数据处理通过Vuex管理应用状态,实现前后端数据交互和异步数据处理。包括登录注册功能、商家信息的展示和搜索功能等。 2. 组件化开发项目采用组件化开发模式,将页面拆分成多个独立组件,提高代码复用性和可维护性。 3. 动态数据展示利用Vue的响应式机制,实现动态数据展示,包括轮播图、商家列表等。 4. 交互体验优化通过使用betterscroll插件实现页面的滑动效果,提升用户体验。同时,使用vuelazyload插件实现图片懒加载,优化页面加载速度。 ## 安装使用步骤 2. 安装依赖在项目根目录下运行npm install命令,安装项目所需依赖。

    基于Modbus协议的TeslaModbusSCADA安卓组态软件:实现工业与农业物联网控制

    内容概要:本文介绍了TeslaModbusSCADA安卓组态软件的功能特点及其应用场景。该软件通过Wi-Fi和Modbus协议实现了对工业生产设备和农业设施的数据采集与控制。其主要优点包括全中文界面、简易组态、丰富的控件库、无数据点限制以及良好的通信稳定性。文中详细展示了如何快速搭建监控界面,并通过多个实例说明了其在实际项目中的应用效果。 适用人群:适用于工农业生产、物联网控制领域的工程师和技术爱好者,尤其是希望简化数据采集和设备控制流程的用户。 使用场景及目标:①用于构建工业生产线上设备的状态监测与控制系统;②应用于农业大棚、养殖厂等场所的环境参数监控;③提供灵活易用的界面设计工具,降低开发门槛,提高工作效率。 其他说明:尽管存在一些局限性(如暂时不支持OPC UA协议),但未来版本计划增加更多功能,进一步拓展其应用范围。

    JAVA编写的socket服务,可以实现以多种方式的通信 接收socket客户端服务端发送的信息,发送给socket 服务端客户的顶端信息

    JAVA编写的socket服务,可以实现以多种方式的通信 接收socket客户端服务端发送的信息,发送给socket 服务端客户的顶端信息

    Docker最佳实战教程.zip

    docker

    深度探索:国产AI大模型DeepSeek的技术水平及其应用前景

    内容概要:本文详细探讨了国产AI大模型DeepSeek的技术水平及其在全球范围内的影响力。首先介绍了DeepSeek的技术背景与核心优势,强调其在自然语言处理、计算机视觉、强化学习和多模态融合等方面的表现。其次,解析了DeepSeek的核心技术,包括自然语言处理、计算机视觉、强化学习和多模态融合的具体应用。接着,阐述了DeepSeek的架构设计与性能优化措施,展示了其在电商、医疗、教育等多个领域的实际应用案例。最后,展望了DeepSeek的未来发展趋势,如多模态融合、实时视频分析、三维视觉与增强现实、模型轻量化、联邦学习以及AI伦理与可持续发展。 适合人群:对人工智能技术感兴趣的科研人员、工程师、产品经理和技术爱好者。 使用场景及目标:适用于希望深入了解国产AI大模型技术水平及其应用前景的人士,目标是掌握DeepSeek的技术特点、应用场景和发展方向。 其他说明:本文不仅介绍了DeepSeek的技术优势,还通过具体案例展示了其在不同行业中的实际应用效果,有助于读者全面了解DeepSeek的潜力和价值。

    (源码)基于 Vue 3 + Vite 和 TensorFlow 的视力测试图形识别游戏系统.zip

    # 基于 Vue 3 + Vite 和 TensorFlow 的视力测试图形识别游戏系统 ## 项目简介 本项目是一个集图像识别与游戏化视力测试为一体的系统。借助 Vue 3 + Vite 搭建项目框架,运用 TensorFlow 完成图像识别功能,同时利用 PIXI 框架绘制 2D 游戏界面。用户在游戏过程中,通过对特定字母图像的识别来进行视力测试。 ## 项目的主要特性和功能 1. 前端框架采用 Vue 3 + Vite 搭建,具备高效的模块打包和快速的服务器启动能力,确保开发和使用的流畅性。 2. 图像识别借助 TensorFlow 的算法模型,实现精确的图像识别功能,为游戏的准确性提供保障。 3. 游戏绘制使用 PIXI 2D canvas 框架绘制游戏界面,包含多个界面布局,如开始界面、介绍界面和主界面,且对界面元素进行了封装,方便维护和复用。

    (源码)基于Vue框架的后台管理模板.zip

    # 基于Vue框架的后台管理模板 ## 项目简介 本项目是一个基于Vue框架的后台管理模板,精简版是从优秀的vuepureadmin项目中提炼出的主体功能,更适合实际项目开发。该项目拥有高效的代码结构、丰富的功能组件和友好的用户体验设计。通过全局引入elementplus,打包后的文件大小仍然低于2.3MB,并且通过brotli压缩和cdn替换本地库模式,打包大小可进一步降低到低于350KB。项目还提供了官方快速开发文档,方便开发者快速上手和使用。 ## 项目的主要特性和功能 1. 环境要求项目需要node版本不小于16,pnpm版本不小于6。为优化npm包管理工具的兼容性,该项目推荐使用pnpm作为包管理工具。 2. Vue版本项目推荐使用Vue3.3 Composition API进行组件开发,更加符合现代前端开发趋势。

    (源码)基于Python的微信智能聊天机器人.zip

    # 基于Python的微信智能聊天机器人 ## 项目简介 本项目是一个基于Python的微信智能聊天机器人,旨在通过ChatGPT的强大对话和信息整合能力,将微信打造成一个智能机器人。它支持多端部署,包括个人微信、微信公众号和企业微信应用,能够进行智能对话、语音识别、图片生成等多种功能,并且支持丰富的插件扩展。 ## 主要特性和功能 多端部署支持个人微信、微信公众号和企业微信应用等多种部署方式。 智能对话支持私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT3、GPT3.5、GPT4模型。 语音识别可识别语音消息,通过文字或语音回复,支持Azure、Baidu、Google、OpenAI等多种语音模型。 图片生成支持图片生成和图生图(如照片修复),可选择DellE、Stable Diffusion、Replicate模型。 丰富插件支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件。

    基于PHP+MySQL的B/S架构图书馆管理系统设计与实现

    内容概要:本文详细介绍了基于B/S架构,采用PHP、CSS、JavaScript和MySQL技术栈构建的图书馆管理系统。首先阐述了系统的架构和技术亮点,如B/S架构的优势、PHP的灵活性、CSS的美化能力以及JavaScript的交互性和MySQL的数据管理功能。接着具体展示了系统的功能模块,包括用户注册登录、管理员权限管理、图书管理、借还书操作等。文中还特别强调了安全性措施,如验证码机制、会话管理和密码哈希等。最后给出了项目的搭建方法和一些优化建议,如使用phpstudy和navicat工具,以及数据库性能优化等。 适合人群:具有一定编程基础的技术爱好者、Web开发者、图书馆管理人员。 使用场景及目标:适用于希望快速搭建并部署图书馆管理系统的个人或机构,旨在提高图书馆管理效率,同时提供一个完整的Web开发案例供学习和参考。 其他说明:文中提供的代码片段和搭建指南有助于理解和实践,同时也指出了一些潜在的安全隐患和改进方向,如避免SQL注入、使用预处理语句等。

Global site tag (gtag.js) - Google Analytics