阅读更多

50顶
7踩

编程语言

原创新闻 Yahoo! 启动了世界上最大的Hadoop生产应用[译]

2009-02-16 09:44 by 见习记者 ginge 评论(12) 有13571人浏览

原文:http://developer.yahoo.net/blogs/hadoop/2008/02/yahoo-worlds-largest-production-hadoop.html

 

 

最近,Yahoo! 启动了目前世界上最大的Apache Hadoop生产应用。Yahoo! Search WebmapHadoop应用,运行在超过10000Linux系统的集群里。Yahoo! 的网页搜索查询使用的数据正是由它生产的。

 

Webmap的构建从Yahoo! 对网页的爬行开始,之后产出包含一个所有已知网页和互联网站点的数据库,还生成一个关于所有页面和站点的海量数据组。这些数据再输送给位于Yahoo! Search中心懂得排行算法的计算机。

 

一些Webmap数字:

l  索引中页面间的链接数量:大概1T 个链接

l  数据产出量的大小:超过300T,还是经过压缩的!

l  运行一个Map-Reduce任务的核心数量:超过10000

l  生产环境中使用的存储量:超过5P

 

这个流程并不新鲜,新鲜的是Hadoop的使用。Hadoop让我们系统只用前Hadoop时代66%的时间运行同一个流程。它在做管理的同时处理了上述的流程。我们更加相信随着我们加大Hadoop的规模,我们将可以根据需要增大生产任务至更大的集群规模。

 

YahooWebmapHadoop开发,我们的团队感到非常的兴奋。因为尽管Hadoop还处在开发的初级阶段(甚至是未成熟阶段),Hadoop就已经可以以低成本的方式胜任真正互联网级别的项目。这个以及Yahoo!其他生产系统的开发,其他组织证明Hadoop正获得市场的青睐,其价值正在增加。

 

 

2006年以来,Yahoo!网格计算团队一直在很多研究和开发任务中使用和增强Hadoop。将Hadoop从一个两年前还在几十个计算机上运行,带领成为今天成千上万上计算机上运行的系统,我们感到非常的骄傲。Webmap证明了Hadoop解决真正互联网级别问题,令人信任地在一个大型生产规模运作的能力。可以说,Yahoo!每月产生的几十亿个Web搜索查询结果很大程度归功于Hadoop集群生产的数据。

 

Eric Baldeschwieler
Senior Director, Grid Computing
Yahoo! Inc.

50
7
评论 共 12 条 请登录后发表评论
12 楼 shuchaoo 2009-02-18 13:40
hadoop有那么强?
11 楼 weidewei 2009-02-18 09:20
强大
10 楼 raymond2006k 2009-02-17 14:15
lzy.je 写道

真想不明白,erlang在这方面的天生优势,居然拼不过java的后天技能。崩溃了。这可能就是语言、框架、平台的区别和力量吧。


map-reduce 特色更在于超大规模集群计算能力, 在于发挥架构的魔力。 erlang 强于多核计算,在于充分发挥cpu的能力
9 楼 monke82 2009-02-17 11:56
把小飞象搞强搞大!!!!
8 楼 quiii 2009-02-17 11:21
gongmingwind 写道

hadoop是什么意思?


小飞象
7 楼 woods 2009-02-17 11:20
Sky net 只是想到了这个...
6 楼 lzy.je 2009-02-17 11:11
真想不明白,erlang在这方面的天生优势,居然拼不过java的后天技能。崩溃了。

这可能就是语言、框架、平台的区别和力量吧。
5 楼 gongmingwind 2009-02-17 08:48
hadoop是什么意思?
4 楼 worldmaomao 2009-02-16 18:25
平民级的。
3 楼 gqf2008 2009-02-16 13:21
hadoop起初的设计目标是1000个节点,yahoo已经搞了1万的节点,真是太强了
2 楼 showtime520 2009-02-16 13:07
类似google?
1 楼 whaosoft 2009-02-16 12:28
yahoo还是那么有钱~!

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • windows找不到文件'hcw'

    vs2008编译出错:windows找不到文件'hcw',需下载hcw.exe并安装

  • hcw.exe相关文件

    提示hcw.exe 出错时 使用,将文件夹解压并添加路径到PATH

  • vs2008编译提示“系统找不到HCW.exe”的解决办法

    VC6项目迁移至vs2008出现“系统找不到HCW.exe”,

  • vc6.0项目到vc2013移植记录

    从vc6.0移植到vc2013的相关经验记录

  • vue+element-ui中实现多层级复杂的维度根据数据自动生成的表头

    表头主要复杂在:1,有三层,一层是大类,第二层是具体项,第三层是标准值/对比值2,首列和末尾列是一层3,整个表格的维度是根据数据的输入自己生成,也就是动态的下面是在 vue + eleUI 中的解决方案:<el-table :data="tableData" border style="width: 100%" max-height="700" v-loading="areaLoading"...

  • 基于若依springboot架构实现数据多维统计

    基于springboot架构实现数据多维统计,列表动态增减列,mybatis动态传入字段等内容

  • 解决vc6迁移到vs2010时出现的 “系统找不到文件 hcw” 错误

    找到hcw.exe,位于“...\Microsoft Visual Studio\Common\Tools”,然后将路径加入到环境变量中就OK了!!     错误信息:   1>  Making help include file... 1>  Making help file... 1>  系统找不到文件 hcw。 1>hlp\Simulation.hpj...

  • 用Htmlhelp Workshop制作符合Windows98规范的帮助文件

    Windows   98的帮助文件与Windows   95的比有较大的改变,它使用一种基于HTML文件特征的帮助文件,用Internet   Explorer显示帮助内容,支持HTML、ActiveX、Java、脚本(Java脚本和VB脚本)以及HTML图像格式(.JPEG、G

  • ^^^^^^^^WIN95帮助文件制作^^^^^^^^^^

    google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//<script type="text/javascript"

  • 如何制作和使用帮助文件

    如何制作和使用帮助文件  整理编辑:China ASP     带 有 帮 助 文 件 的 应 用 程 序 无 论 对 程 序 员 还 是 用 户 都 是 不 同 凡 响 的, 它 能 节 省 印 刷 大 量 用 户 手 册 的 开 支, 对 程 序 员 编 辑 修 改 和 用 户 手 册 的 复 制 保 存 都 极 为 方 便。 帮 助 文 件 的 另 一 个 很 有 前 景 的 应 用 是 单

  • FPGA电机控制方案解析:基于Verilog与Nios2的软硬协同设计

    内容概要:本文详细介绍了基于FPGA的电机控制系统设计方案,重点探讨了Verilog和Nios2软核的协同工作。系统通过将底层驱动(如编码器处理、坐标变换、SVPWM生成等)交给Verilog实现,确保实时性和高效性;同时,复杂的算法(如Park变换、故障保护等)则由Nios2处理。文中展示了多个具体实现细节,如四倍频计数、定点数处理、查表法加速、软硬件交互协议等。此外,还讨论了性能优化方法,如过调制处理、五段式PWM波形生成以及故障保护机制。 适合人群:具备一定FPGA和嵌入式系统基础知识的研发人员,尤其是从事电机控制领域的工程师。 使用场景及目标:适用于希望深入了解FPGA在电机控制中的应用,掌握软硬件协同设计方法,提高系统实时性和效率的技术人员。目标是通过学习本方案,能够独立设计并实现高效的电机控制系统。 其他说明:本文不仅提供了详细的代码片段和技术细节,还分享了许多实践经验,如调试技巧、常见错误及其解决办法等。这对于实际工程项目非常有帮助。

  • 模拟太阳系、轨道进动、时间延迟、光线偏折、黑洞阴影、星团以及航天器轨迹 matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

  • 计算机数控(CNC)装置.pdf

    计算机数控(CNC)装置.pdf

  • 西门子PLC与TiA博途实现冷热水恒压供水系统的变频器控制及多参数调控

    内容概要:本文详细介绍了使用西门子PLC和TiA博途软件构建冷热水恒压供水系统的具体方法和技术要点。主要内容涵盖变频器控制、模拟量输入输出处理、温度控制、流量计算控制及配方控制等方面。文中不仅提供了具体的编程实例,如LAD和SCL语言的应用,还分享了许多实用的经验和技巧,例如模拟量处理中的滤波方法、PID控制的优化策略、流量计算的高精度算法等。此外,针对实际应用中的常见问题,如信号干扰和参数整定,作者也给出了有效的解决方案。 适合人群:从事自动化控制系统开发的技术人员,尤其是对西门子PLC和TiA博途有一定了解并希望深入掌握冷热水恒压供水系统设计的专业人士。 使用场景及目标:适用于工业环境中需要精确控制水压、温度和流量的冷热水供应系统的设计与维护。主要目标是帮助工程师理解和实施基于西门子PLC和TiA博途的冷热水恒压供水系统,提高系统的稳定性和效率。 其他说明:文中提到的实际案例和编程代码片段对于初学者来说非常有价值,能够加速学习进程并提升实际操作能力。同时,关于硬件配置的选择建议也为项目规划提供了指导。

Global site tag (gtag.js) - Google Analytics