`
wbj0110
  • 浏览: 1611450 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

Facebook运用软件(转载)

阅读更多

2010年6月,Facebook现在的经营规模,诸多传统服务器的技术均将崩溃或根本无法支撑。那么面对5亿的活跃用户,
Facebook的工程师们又将如何让网站平稳运转呢?这篇文章将展示Facebook的工程师
完成这个艰巨任务所用到的一系列软件。

 

Facebook级别规模的挑战
在我们深入细节之前,先了解一组Facebook不得不面对数据,你就可以想象这种规模。
1) Facebook每月的PV量:630,000,000,000 (6万3千亿)
2) Facebook上的图片数量超过其他图片网站的总和(包括诸如Flickr这样的图片网站)
3) 每个月有超过30亿的图片上传到Facebook
4) Facebook系统每秒可以处理120万张图片。这还不包括Facebook的CDN处理的图片。
5) 每月处理超过250亿的信息内容(包括用户状态更新,评论等)
6) Facebook的服务器数量超过3万台(此数据为2009年的数据)

 

Facebook所用的软件
从某些方面来说,Facebook还是属于LAMP类型网站,但是,为了配合其他大量的组件和服务,
Facebook对已有的方法,已经做了必要的改变、拓展和修改。

 

Memcached
是一款相当有名的软件。它是分布式内存缓存系统。Facebook(还有大量的网站)用它作为
Web服务器和MySQL服务器之间的缓存层。经过多年,Facebook已在Memcached和其相关软件(比如,网
络栈)上做了大量优化工作。
Facebook运行着成千上万的Memcached服务器,借以及时处理TB级的缓存数据。可以这样说,
Facebook拥有全球最大的Memcached设备。

 

HipHop for PHP
和运行在本地服务器上代码相比,PHP的运行速度相对较慢。HipHop把PHP代码转换成C++代码,提高
编译时的性能。因为Facebook很依赖PHP来处理信息,有了HipHop,Facebook在Web服务器方面更是如虎
添翼。
HipHop诞生过程:在Facebook,一小组工程师(最初是3位)用了18个月研发而成。

 

 Haystack
 是Facebook高性能的图片存储/检索系统。(严格来说,Haystack是一对象存储,所以它不一定
要存储图片。)Haystack的工作量超大。Facebook上有超过2百亿张图片,每张图片以四种不同分辨率保存,
所以,Facebook有超过8百亿张图片。
Haystack的作用不单是处理大量的图片,它的性能才是亮点。我们在前面已提到,Facebook每秒大概处
理120万张图片,这个数据并不包括其CDN处理的图片数。这可是个惊人的数据!!!

 

BigPipe
BigPipe是Facebook开发的动态网页处理系统。为了达到最优,Facebook用它来处理每个网页的分块
(也称“Pagelets”)。
比如,聊天窗口是独立检索的,新闻源也是独立检索的。这些Pagelets是可以并发检索,性能也随之提
高。如此,即使网站的某部分停用或崩溃后,用户依然可以使用。

 

Cassandra

是一个没有单点故障的分布式存储系统。它是前NoSQL运动的成员之一,现已开源(已加入
Apache工程)。Facebook用它来做邮箱搜索。
除了Facebook之外,Cassandra也适用于很多其他服务,比如Digg。

 

Scribe
 Scribe是个灵活多变的日志系统,Facebook把它用于多种内部用途。Scribe用途:处理Facebook级别日
志,一旦有新的日志分类生成,Scribe将自动处理。(Facebook有上百个日志分类)。

 

Hadoop and Hive
 Hadoop是款开源Map/Reduce框架,它可以轻松处理海量数据。Facebook用它来做数据分析。(前面
就说到了,Facebook的数据量是超海量的。)Hive起源于Facebook,Hive可以使用SQL查询,让非程序员比
较容易使用Hadoop。(注1: Hive是是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一
张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。 )

 

Thrift
Facebook在其不同的服务中,使用了不同的语言。比如: PHP用在前端,Erlang用于聊天系统,Java和
C++用于其它地方,等等。Thrift是内部开发的跨语言的框架,把不同的语言绑定在一起,使之可以相互“交
流”。这就让Facebook的跨语言开发,变得比较轻松。
Facebook已把Thrift开源,Thrift支持的语言种类将更多。


Varnish
Varnish是一个HTTP加速器,担当负载均衡角色,同时也用于快速处理缓存内容。
Facebook用Varnish处理图片和用户照片,每天都要处理十亿级的请求。和Facebook其他的应用应用一
样,Varnish也是开源的。

 

Facebook可以平稳运行,还得利于其他方面

 虽然上面已经提到了一些构成Facebook系统的软件,但是处理如此庞大的系统,本身就是一项复杂的任
务。所以,下面还将列出使Facebook能平稳运行的一些东西。
   逐步发布&暗启动
   Facebook有一个系统,他们称之为“门卫”。该系统可以针对不同种类的用户运行不同的代码。(它简单
介绍了代码库中的不同条件。)该系统让Facebook逐步发布新特性、A/B测试、激活仅针对Facebook员工的
特性 等等。
   门卫系统也让Facebook做些“暗启动”的事情。比如,在某一特性上线之前,可以激活该特性背后的元
件。另外,它还可以做模拟压力测试,发现瓶颈和潜在的问题。默默启动一般都是在正式启动之前的2周完成。

       实时系统的简介
   Facebook会仔细监控自身系统,有趣的是,它还监控每个PHP函数在实时生产环境下的性能。这一实时
PHP环境监控是通过一个叫XHProf的开源工具完成的。

      逐步禁用某些特性,借以提高性能
   如果Facebook遇到性能问题,Facebook有大量的途径来逐步禁用不很重要的特性,以提高其核心特性性
能。

 

   尚未提到的东西
   虽然这里无法过多深入硬件方面,但硬件绝对是Facebook能达到空前规模的重要因素。比如,和其他大型
网站一样,Facebook也用CDN来处理静态内容。Facebook还在美国西部的俄勒冈州建有一超大的数据中心,
可以随时增加服务器。
   当然了,除了前面已经提到的,还有其他大量的软件没有说到。但是,希望能突出其中非常有特色的。
   Facebook和开源之间的“恋情”
   Facebook和开源之间联系,此文不能不提,虽不能说Facebook是多么地钟爱开源,但至少可以这样说,

Facebook是“爱”着开源的。

       Facebook不仅使用(也捐赠)开源软件,比如,Linux、Memcached、MySQL、Hadoop等等,它还内
部开发不少软件,并且也将之开源。

Facebook开发的开源工程,包括HipHop、Cassandra、Thrift和Scribe。另外,Facebook也把Tornado
开源了。Tornado是一个高性能的Web服务器框架,由FriendFeed幕后团队开发而成。(2009年8月,
Facebook收购 FriendFeed。)
   (Facebook所用到的开源软件,可以在Facebook的开源页面找到。)

 

       面临更多的大规模挑战
   Facebook以一种令人难以置信的速度成长。它的用户群几乎是成倍增加,活跃用户数量现已接近5亿。而
且,谁都无法预测今年底,活跃用户量会到多少。
   Facebook甚至成立了一个专门的“成长小组”,该小组不断思考如何让人们使用facebook并融入到
facebook中。
   这一快速成长,意味着Facebook将遇到不同的性能瓶颈。Facebook会面临来这如下方面的挑战:PV、搜
索、上传的图片和状态消息,用户之间的交互和用户和Facebook之间的交互带来的挑战。
   这也是Facebook面对的事实。Facebook的工程师们将继续寻求新方法来扩展(这不只是增加服务器的问
题了)。比如,随着网站成长,其图片存储系统已经多次完全重写。
   所以,我们将看到Facebook的工程师们奔向下一个“山头”。我们相信他们不会辜负众望。毕竟,他们正
跨越山头,那个我们大多数人仅能向往的山头;他们正扩展网站,那个用户来自全球各地的网站。当你实现那
个里程碑时,你将彪炳史册。

分享到:
评论

相关推荐

    bitlbee-facebook, 用于BitlBee的Facebook协议插件.zip

    bitlbee-facebook, 用于BitlBee的Facebook协议插件 bitlbee的Facebook协议插件。 这个插件使用基于 Facebook Messenger mqtt的协议。这里项目与 Facebook 。Inc不相关。用法bitlbee wiki中提供了通用用法说明:...

    预测facebook签到位置

    Facebook签到位置预测是一个涉及大数据分析、地理位置服务和社交网络行为学的复杂...通过综合运用这些工具和方法,我们可以更准确地预测用户的未来签到行为,为个性化推荐、市场研究或城市规划等领域提供有价值的洞察。

    facebook api和facebook_jar包

    Facebook API和Facebook_JAR包是开发者用来与Facebook平台进行交互的重要工具,它们使得开发者能够创建应用程序,集成到Facebook生态系统中,实现数据交换、用户登录验证、发布内容等功能。Facebook API通常指的是...

    facebook分享

    在IT行业中,Facebook分享是一项常见的功能,特别是在移动应用和网页开发中。Facebook分享允许用户将内容,如文本、图片或链接,快速便捷地发布到他们的Facebook时间线,从而扩大信息的传播范围。在这个"facebook...

    facebook技术架构.pdf

    Facebook作为全球最流行的社交平台之一,拥有庞大的用户基础和流量,其技术架构自然成为了业界关注的焦点。为了维持高效的分享和通信能力,Facebook构建了一个复杂的系统来应对难以想象的访问量和数据规模。2007年11...

    Facebook-Android-sdk-4.8.2

    Facebook Android SDK 4.8.2 是Facebook提供的一款用于帮助Android开发者在其应用中集成Facebook功能的开发工具包。这个版本的SDK包含了实现Facebook登录、分享、邀请、广告以及分析等功能所需的库和资源。通过使用...

    facebook sdn

    **Facebook SDN(软件定义网络)详解** Facebook作为全球最大的社交网络平台,其背后的基础设施规模庞大且复杂。为了高效管理其数据中心的网络流量,Facebook采用了SDN(Software-Defined Networking,软件定义网络...

    云计算英文论文 Facebook

    其次,论文可能深入研究Facebook如何运用分布式计算和大数据处理技术。Facebook每天处理数十亿用户的活动数据,这需要高效的数据存储和分析系统。例如,Facebook可能使用Hadoop、Spark等开源工具进行大数据处理,以...

    Facebook免费WiFi

    具体来说,Facebook WiFi利用了Facebook账号作为认证凭据,通过与路由器制造商合作,在路由器上安装特定的软件模块,以支持Facebook WiFi认证流程。当用户尝试连接支持Facebook WiFi的Wi-Fi网络时,路由器会自动检测...

    wordpress WooCommerce Facebook 多像素插件

    **WordPress WooCommerce Facebook 多像素插件...通过熟练掌握并运用这个插件,你能够更好地利用 Facebook 的广告平台,提升 WooCommerce 商店的营销效果,实现销售增长。记得定期更新插件以获取最新的功能和安全修复。

    Facebook效应

    Facebook的故事启示我们,技术的力量在于其连接人与人、信息与信息的能力,而如何负责任地运用这一力量,则是我们共同面临的课题。马克·扎克伯格和他的团队将继续引领Facebook走向未知的未来,而我们每个人作为社交...

    facebook2008

    它可能包含了浏览器设置建议或者推荐的软件下载链接。 3. **爱书吧-2万本图书免费下载.url**:这是一个URL快捷方式,指向一个网站,该网站声称提供2万本图书的免费下载。虽然这个链接与Facebook直接相关性较小,但...

    facebook-android-sdk

    Facebook Android SDK 是一个专门为Android平台开发的应用程序接口(API),它允许开发者轻松地将...通过深入理解和熟练运用这个SDK,开发者可以构建更具有社交特性的应用程序,提升用户参与度和应用的商业价值。

    Facebook登录分享发布信息程序

    Facebook登录分享发布信息程序是基于C#编程语言和Facebook SDK(FaceBook.dll)构建的应用,旨在为用户提供一种简便的方式,通过Webview组件实现用户在Windows桌面应用中的Facebook账户登录,并授权应用发布信息到...

    打造Facebook:亲历Facebook爆发的5年

    这本书的书名——《打造Facebook:亲历Facebook爆发的5年》很嚣张,谁有资格可以说这句话呢,当然,扎克伯格最有资格,但他不会亲自来告诉你,至少从目前的情况来看,近几年都不大可能。而且,这不是一个人的公司。...

    Facebook PHP SDK 4.0

    Facebook PHP SDK 4.0

    FaceBook插件开发入门教程

    "FaceBook插件开发入门教程" 本文将从Facebook插件开发的角度,讲解如何创建一个简单的Facebook插件,并介绍Facebook插件开发的基本概念和流程。 一、Facebook插件开发简介 Facebook插件开发是指在Facebook平台上...

    FACEBOOK FLASH 示例 教程

    Facebook Flash 示例教程旨在帮助开发者和设计师了解如何在Flash环境中与Facebook平台进行集成,创建互动性的社交媒体应用程序或游戏。本教程将深入探讨以下关键知识点: 1. **Facebook API**:Facebook 提供了一组...

    Unity Facebook API 官方 Demo 完整工程 代码

    Unity Facebook API 官方 Demo 是一个为游戏开发者提供的完整工程,它展示了如何在Unity引擎中集成Facebook的功能,以便实现用户登录、得分分享、排行榜展示以及头像获取等社交互动功能。这个Demo项目名为...

Global site tag (gtag.js) - Google Analytics