阅读更多

50顶
7踩

编程语言

原创新闻 Yahoo! 启动了世界上最大的Hadoop生产应用[译]

2009-02-16 09:44 by 见习记者 ginge 评论(12) 有13540人浏览

原文:http://developer.yahoo.net/blogs/hadoop/2008/02/yahoo-worlds-largest-production-hadoop.html

 

 

最近,Yahoo! 启动了目前世界上最大的Apache Hadoop生产应用。Yahoo! Search WebmapHadoop应用,运行在超过10000Linux系统的集群里。Yahoo! 的网页搜索查询使用的数据正是由它生产的。

 

Webmap的构建从Yahoo! 对网页的爬行开始,之后产出包含一个所有已知网页和互联网站点的数据库,还生成一个关于所有页面和站点的海量数据组。这些数据再输送给位于Yahoo! Search中心懂得排行算法的计算机。

 

一些Webmap数字:

l  索引中页面间的链接数量:大概1T 个链接

l  数据产出量的大小:超过300T,还是经过压缩的!

l  运行一个Map-Reduce任务的核心数量:超过10000

l  生产环境中使用的存储量:超过5P

 

这个流程并不新鲜,新鲜的是Hadoop的使用。Hadoop让我们系统只用前Hadoop时代66%的时间运行同一个流程。它在做管理的同时处理了上述的流程。我们更加相信随着我们加大Hadoop的规模,我们将可以根据需要增大生产任务至更大的集群规模。

 

YahooWebmapHadoop开发,我们的团队感到非常的兴奋。因为尽管Hadoop还处在开发的初级阶段(甚至是未成熟阶段),Hadoop就已经可以以低成本的方式胜任真正互联网级别的项目。这个以及Yahoo!其他生产系统的开发,其他组织证明Hadoop正获得市场的青睐,其价值正在增加。

 

 

2006年以来,Yahoo!网格计算团队一直在很多研究和开发任务中使用和增强Hadoop。将Hadoop从一个两年前还在几十个计算机上运行,带领成为今天成千上万上计算机上运行的系统,我们感到非常的骄傲。Webmap证明了Hadoop解决真正互联网级别问题,令人信任地在一个大型生产规模运作的能力。可以说,Yahoo!每月产生的几十亿个Web搜索查询结果很大程度归功于Hadoop集群生产的数据。

 

Eric Baldeschwieler
Senior Director, Grid Computing
Yahoo! Inc.

50
7
评论 共 12 条 请登录后发表评论
12 楼 shuchaoo 2009-02-18 13:40
hadoop有那么强?
11 楼 weidewei 2009-02-18 09:20
强大
10 楼 raymond2006k 2009-02-17 14:15
lzy.je 写道

真想不明白,erlang在这方面的天生优势,居然拼不过java的后天技能。崩溃了。这可能就是语言、框架、平台的区别和力量吧。


map-reduce 特色更在于超大规模集群计算能力, 在于发挥架构的魔力。 erlang 强于多核计算,在于充分发挥cpu的能力
9 楼 monke82 2009-02-17 11:56
把小飞象搞强搞大!!!!
8 楼 quiii 2009-02-17 11:21
gongmingwind 写道

hadoop是什么意思?


小飞象
7 楼 woods 2009-02-17 11:20
Sky net 只是想到了这个...
6 楼 lzy.je 2009-02-17 11:11
真想不明白,erlang在这方面的天生优势,居然拼不过java的后天技能。崩溃了。

这可能就是语言、框架、平台的区别和力量吧。
5 楼 gongmingwind 2009-02-17 08:48
hadoop是什么意思?
4 楼 worldmaomao 2009-02-16 18:25
平民级的。
3 楼 gqf2008 2009-02-16 13:21
hadoop起初的设计目标是1000个节点,yahoo已经搞了1万的节点,真是太强了
2 楼 showtime520 2009-02-16 13:07
类似google?
1 楼 whaosoft 2009-02-16 12:28
yahoo还是那么有钱~!

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • hcw.exe相关文件

    提示hcw.exe 出错时 使用,将文件夹解压并添加路径到PATH

  • windows找不到文件'hcw'

    解决方法: 1. 下载并安装hcw.exe http://download.csdn.net/detail/cgf_909/6205293 允许它安装到 C:\Program Files\Help Workshop\. 2. 控制面板 -> 系统 -> 高级 -> 环境变量 在系统变量里,找到Path, 在变量值后加上; C:\Program Files\Help Wor

  • vs2008编译提示“系统找不到HCW.exe”的解决办法

    VC6项目迁移至vs2008出现“系统找不到HCW.exe”,

  • vc6.0项目到vc2013移植记录

    从vc6.0移植到vc2013的相关经验记录

  • vue+element-ui中实现多层级复杂的维度根据数据自动生成的表头

    表头主要复杂在:1,有三层,一层是大类,第二层是具体项,第三层是标准值/对比值2,首列和末尾列是一层3,整个表格的维度是根据数据的输入自己生成,也就是动态的下面是在 vue + eleUI 中的解决方案:<el-table :data="tableData" border style="width: 100%" max-height="700" v-loading="areaLoading"...

  • 基于若依springboot架构实现数据多维统计

    基于springboot架构实现数据多维统计,列表动态增减列,mybatis动态传入字段等内容

  • 解决vc6迁移到vs2010时出现的 “系统找不到文件 hcw” 错误

    找到hcw.exe,位于“...\Microsoft Visual Studio\Common\Tools”,然后将路径加入到环境变量中就OK了!!     错误信息:   1>  Making help include file... 1>  Making help file... 1>  系统找不到文件 hcw。 1>hlp\Simulation.hpj...

  • 用Htmlhelp Workshop制作符合Windows98规范的帮助文件

    Windows   98的帮助文件与Windows   95的比有较大的改变,它使用一种基于HTML文件特征的帮助文件,用Internet   Explorer显示帮助内容,支持HTML、ActiveX、Java、脚本(Java脚本和VB脚本)以及HTML图像格式(.JPEG、G

  • ^^^^^^^^WIN95帮助文件制作^^^^^^^^^^

    google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//<script type="text/javascript"

  • 如何制作和使用帮助文件

    如何制作和使用帮助文件  整理编辑:China ASP     带 有 帮 助 文 件 的 应 用 程 序 无 论 对 程 序 员 还 是 用 户 都 是 不 同 凡 响 的, 它 能 节 省 印 刷 大 量 用 户 手 册 的 开 支, 对 程 序 员 编 辑 修 改 和 用 户 手 册 的 复 制 保 存 都 极 为 方 便。 帮 助 文 件 的 另 一 个 很 有 前 景 的 应 用 是 单

  • WebAudioAPIError(解决方案).md

    项目中常见的问题,记录一下解决方案

  • avnet(安富利)网站详情页数据样例

    avnet(安富利)网站详情页数据样例

  • 1-全国各地区建筑业-二级专业承包建筑业企业利润总额2005-2012年-社科数据.zip

    该数据集涵盖了2005至2012年间全国各地区二级专业承包建筑业企业的利润总额。这些数据不仅包括了原始数据,还提供了线性插值和ARIMA填补的版本,以便于研究者能够根据不同的需求选择合适的数据形式进行分析。数据集中包含了行政区划代码、地区名称、是否属于长江经济带、经纬度信息、年份以及利润总额等关键指标。这些指标为评估企业的经营效益和盈利水平提供了重要依据,同时也反映了建筑业在不同地区的发展态势。数据来源为国家统计局,确保了数据的权威性和准确性。通过这些数据,研究者可以深入分析建筑业的经济贡献及其在宏观经济中的作用,为政策制定和行业规划提供数据支持。

  • CentOS6.4X64安装Oracle11g中文2.05MB最新版本

    本文档主要讲述的是CentOS6.4 X64安装Oracle11g;在CentOS安装oracle11g比安装oracle10g简单很多,oracle可以不设置比如OS内核参数、防火墙、环境变量等,所以实施时推荐安装oracle11g。感兴趣的朋友可以过来看看

Global site tag (gtag.js) - Google Analytics