`

互联网就是一块“云”

阅读更多

    如果把互联网和云计算结合在一起,就会拥有一台完整的机器,完成大脑的三项重要工作:信息存储、处理和交流

我不知道50年后互联网的发展情况。但是我确实清楚它未来10年至20年的发展,我确定它的发展将建立在脑科学 的理论基础之上。这个行业的其他竞争者也预见了这一事实。

Google的拉里·佩奇和谢尔盖·布林在斯坦福大学学习人工智能,师从特里·威诺格拉德,他是这个领域杰出的权威,并且他们把所学付诸实践,成立 并发 展了他们的公司,这绝非巧合。(实际上,Google的第18位员工就是一名脑外科医生,他后来成为Google的营运主管。)

事实上,最成功的互联网公司都直接或间接地以一个信念为前提,即互联网将会发展得越来越像人脑。

计算机的下一轮变革开始了,这是一个“云计算”取代独立的计算机的阶段。数以百万计的公司开始选择使用具有再生能力的“云”资源,“云”中老去的部件很快会被更新更快的部件取代,“云”就像具有生命力的生物。

 

谷歌的秘密建筑群

   一座名叫达拉斯的城市,在这里,人们发现了一座神秘的建筑矗立在这片荒芜的景观中。这座建筑有两个橄榄球场那么长,上方耸立着4个冷却塔,周围是高高的带刺铁丝网围栏。

当这项建筑工程开工的时候,达拉斯的居民只是知道这个建筑群是由互联网搜索巨人Google建造的,其余的情况就不得而知了。在得知附近OVF公司 (Orchard View Farms)的IT经理和其他几个当地人加盟其中之后, 各种猜测声迭起。当签署了保密协议的Google新员工不愿意描述他们在里面所看到的和他们所从事的工作时,猜测声更加强烈。

Google最后决定邀请《达拉斯纪事报》(The Dalles Chronicle)的记者和编辑来采访。如果这些记者真正深入这幢建筑物的核心区域,他们可能会看到:数以千计的计算机,连接在金属箱里,有40台或 50台中央处理器的热气大量地飘浮在上空,升腾到4个冷却塔。他们还可能会看到灰色的电缆和蓝色、橙色的以太网电缆蜿蜒遍布整幢建筑物,连接着个人计算 机,大约100位IT员工为这些个人计算机的需求提供服务,为了保护耳朵不受风扇发出的嘈杂声所影响,他们都戴上了隔音耳套。

如果你想象一下电影《黑客帝国》中的场景,许多人被聚集在一起,用来收集电能,那么你的想象是正确的,只不过那些人被替换成了计算机。

 

互联网将越变越大

   为什么会如此神秘呢?部分原因是出于竞争优势的考虑。将数以千计的普通计算机相连,Google构建了一个超级计算机。

达拉斯服务器集群(也称为多处理器群)是Google——也可能是世界上——在进行并行计算方面最先进的成就:使用许多计算机同时完成多重任务。达 拉斯 服务器集群似乎是Google最先进的成就, 但它不是唯一的:Google有24个大型服务器集群遍布整个美国。即使细节信息不为人知,服务器的总数也很可能超过50万个,它们具有200PB(千万 亿字节)硬盘存储容量和4PB随机存储容量。这样想一下,1PB相当于10000004个字节,你的iPod就能容纳100多万首歌。

通过由多部服务器集群所组成的庞大系统进行一项工程浩大的计算工作,Google创造了“云计算”,即数千台价格低廉的计算机通过大规模并行处理来 获得巨 大的计算能力。问题的关键在于,这样做不仅便宜,而且,从普通计算机的随机存储器获取信息,要比从一个超级计算机密集的磁盘驱动器获取信息的速度更快。

Google的“云计算”开始于克里斯托夫·比希利亚,他是一位27岁的计算机工程师。Google已经发明了分布式计算系统(云计算的核心技 术),这 是一个专利软件,它可以将一项任务分拆成无数项子任务,由大量的计算机来执行,然后在十亿分之一秒内完成处理结果。现在比希利亚又向Google的总裁埃 里克·施密特提出了新的想法:利用分布式计算系统的基本功能,由小型个人计算机构建一台大型计算机。他的想法得到了施密特的鼓励。

接 着,IBM的总裁萨姆·帕米萨诺也给予了支持——40台计算机连接在一起——这项试验开始了。这一年是2006年。现在Google有50万台计算机在并 行工作。实际上,正在独立建立云计算服务器集群的公司(包括Google、IBM、微软、雅虎和亚马逊)现在有超过200万台计算机在同时工作。

这些机器消耗的电力和拉斯韦加斯市在炎热的夏日里消耗的一样多,所以这些公司面临的艰巨任务就是要找到更多(廉价)的电力资源。无巧不成书,中国正在考虑建立一系列核电站,这些提供云计算的公司已经迫不及待了——尽管他们不愿这样说。

它的未来在哪里?IBM的科研主管马克·迪恩曾经说过,随着云计算能力的发展,互联网也将越变越大。“互联网太小了,”他说,“有一天我们会嘲笑它的渺小。”

 

互联网的智能发展方向

   Google和其他云计算服务提供商希望他们的云计算能够具有一些类似人类的智慧。也就是说,他们寻求更好的分布式计算,这个目标与脑科学家吉姆·安德森和他的人造大脑团队的追求目标是一致的。这个目标就是:创造人类大脑中的迂回渐进、反复的思维模式。

Google的工作开始于分布式计算系统,一个简单的、功能强大的软件程序,能够进行自动的并行处理和大规模计算工作的分布。也就是说,它能够让 Google使用“云”资源和互联网来并行思考。分布式计算系统和我们大脑的工作方式一样:对重要的信息进行分类,然后把它们分布到个人计算机组成的服务 群里,删除不相关的信息;而计算机——与分布式计算系统和大脑不同——接收所有的信息。

分布式计算系统摒弃了传统计算机的机械性(正如 Google一位资深的副总裁最近吹嘘的,“我们建立的服务器集群比其他公司的都灵活”)。Google现在把分布式计算系统应用于数万个程序中,从卫星 图像的处理、大规模机器学习问题,到语言处理和常见问题的回答。它每天要处理大约10万种不同功能的应用程序,分析20PB字节的数据。

分布式计算系统的发明者在最新的文章中指出:“它已经被广泛应用于Google内部的各个领域,这包括:大规模的机器学习问题、聚类问题;提取数据 进行 常见问题的报告;提取网页的特点用于新的实验和产品;卫星图像数据的处理;语言模式处理用于数据机器的翻译;大规模图表计算。”也就是说,Google完 成的任务和大脑发挥的功能很相似:学习、分类、视界和语言。

这一系列任务提供了大量信息数据的分析——从美国人投票习惯、飞机票价的波动,到大量的健康数据。“千万亿字节时代的最大挑战不是存储所有的数据,”《连线》杂志最新评论道,“而是如何理解这些数据。”理解数据,这正是互联网智能目前的发展方向。

 

互联网——一种“云”资源

    互联网和云计算有什么关联呢?互联网就是一块“云”——大量的计算机连接在一起进行交流。互联网主要不是进行计算的,但是,没有什么能够阻挡我们将 整个 互联网作为一个拥有巨大计算能力的资源库。如果你把互联网和云计算结合在一起,你就会拥有一台完整的机器,完成大脑的三项重要工作:信息存储、处理和交 流。

当信息处理云模式和信息交流云模式结合在一起,以类似于人脑的迂回渐进的思维方式并行运行时,人一样的智慧就可能在互联网上出现。 2003年,在还没有加盟Google的前几年,Google的总裁埃里克·施密特曾说过:“当网络变得和处理器一样快时,计算机中的信息就会释放出来, 遍布整个网络。”在这个阶段,互联网上所有的信息必须压缩,就像我们的纸质大脑模型一样;在这个阶段,必须建立模式;在这个阶段,大量的构想转瞬即逝,这 时候就产生了智能。

在最新一期的《纽约时报》上,比尔·盖茨 认为科技的发展——向智能发展——和大马哈鱼奋力逆流而上一样势不可挡。“它们(Google)做到了分布式计算系统。”他说,“但是我们的Dryad会做得更好。”他停顿了一下,然后不得不承认还会有更强大、更适合的系统出现,“而它们还会做得更好。”

比尔·盖茨说得没错,发展势不可挡。

 

(摘自《我们改变了互联网,还是互联网改变了我们?》第一篇,作者:[美]杰弗里·斯蒂伯,文章标题及文中小标题为编者加,艾经纬 整理)

 

转载于:开源中国社区(oschina.net),http://www.oschina.net/news/18151/internet-is-cloud

分享到:
评论

相关推荐

    天翼云认证考试练习题集(含高级)

    12. 天翼云弹性云主机中,当系统出现问题时,需要将一块磁盘的数据回滚到之前的某一时刻实现该功能所用的技术是快照回滚(C)。这说明了天翼云弹性云主机的故障恢复机制。 知识点:天翼云弹性云主机、快照回滚、...

    2019互联网面试题第2季,互联网面试题及答案,Java

    "2019互联网面试题第2季"聚焦了这一年度的重要面试趋势和热门问题,旨在帮助求职者更好地准备并理解面试官可能提出的各种问题。这份资料可能包含一系列的面试题目、解答以及相关思维导图,帮助求职者系统地梳理和...

    云计算、云存储、云安全

    云计算是信息技术领域的一项重要创新,它通过互联网将计算资源和服务以按需分配的方式提供给用户。这一模式使得企业和个人能够灵活地使用计算能力,而无需投资昂贵的硬件设备。云计算的核心概念包括基础设施即服务...

    腾讯云概述

    在存储与CDN服务方面,腾讯云提供了云硬盘、对象存储、云服务器使用的块存储设备以及通过API操作的对象存储服务。这些服务可以帮助用户高效地存储和管理数据,同时支持图片、视频、文件等多种格式的数据备份和传输。...

    阿里云和微软云对比

    由于互联网内容访问速度的用户感知对于业务成功至关重要,阿里云和Azure都提供了大量的CDN节点,以降低延迟和加速内容分发。这种服务对于视频点播、直播等场景尤为重要。 数据库服务也是云平台用户经常使用的服务之...

    中国互联网发展报告2019精华版.pdf

    IPv4地址数量为338,924,544个,IPv6地址达到41079块/32,显示出互联网地址资源的升级和优化。域名总数为3792.8万个,其中“.CN”域名略有增加,显示出中国互联网域名体系的发展。网站数量和网页数量分别达到523万个...

    阿里云服务器ECS介绍.pptx

    弹性计算服务-云服务器(ECS) 云服务器(ECS) 以虚拟化的方式将一台物理机拆分成多台云服务器,向广大互联网站长和开发者提供可伸缩的计算资源。 VMs 阿里云服务器ECS介绍全文共12页,当前为第3页。 弹性计算服务...

    云学习资料文件

    云平台是指通过互联网提供的计算服务,这些服务可以按需使用,并且通常按照使用量付费。它们提供了灵活、可扩展的基础架构,使得企业能够根据自身需求快速调整计算资源。 #### 二、水平扩容与垂直扩容 1. **水平扩...

    cloud云图片

    在IT行业中,"云"(Cloud)一词通常指的是云计算技术,它是一种通过互联网提供按需计算服务的模式,包括服务器、存储、数据库、网络、软件、分析等,无需用户进行物理硬件投资即可享用。云服务可以极大地提高效率,...

    云存储架构设计及解决方案.pdf

    对象存储是云存储架构设计的核心组件之一,提供了海量、稳定可靠、安全、高性能、低成本、互联网访问能力的特点。对象存储可以存放任何文件,比如各种非结构化数据、半结构化数据,如视频、图像、日志、文本、CSV等...

    金融云超市解决方案.pptx

    金融云超市是金融行业与互联网技术深度结合的产物,它整合了金融机构的各种产品和服务,包括但不限于信用卡、贷款、保险、基金、理财产品等,为个人和企业提供一站式金融解决方案。这一概念的兴起源于互联网金融的...

    移动云存储技术及应用策略.pdf

    云存储技术是一种通过网络将大量、可配置的计算资源池化并提供给用户使用的存储方式。这些资源包括存储空间、服务器和网络资源等,用户可以根据需要使用和分配。云存储技术可以实现数据的远程存储、备份、同步、共享...

    (云架构) 之“公有云和私有云”

    公有云是指由第三方提供商拥有并管理的云计算基础设施,它通过互联网提供给多个用户共享的资源池。这种模式下的云服务可以按照使用量付费,大大降低了企业的初始投资成本。公有云的主要特点包括: - **共享资源**:...

    云存储系统的实现.rar

    云存储是一种基于互联网的存储模型,用户无需关心底层硬件设施,只需通过互联网接口即可按需使用存储空间。它的主要优势包括: 1. 弹性扩展:根据业务需求动态调整存储容量,无需预先投入大量硬件资源。 2. 成本...

    阿里云产品手册2022-2023版.pdf

    - 块存储、文件存储NAS:分别提供高性能的块级存储和文件级共享存储。 2. 网络与安全服务: - 专有网络VPC(Virtual Private Cloud):构建隔离的私有网络环境。 - 云企业网CEN(Cloud Enterprise Network):...

    2019中国互联网发展报告-互联网协会-201907.pdf

    #### 一、2018年中国互联网用户与市场重要数据 - **网民规模与特征**:2018年底,中国网民规模达到8.29亿人,全年新增网民5653万人,互联网普及率达到59.6%,较2017年底提升3.8个百分点。手机网民规模达到8.17亿人...

    CAD插件《dop设计》插件云端图库版1.2.1

    这个功能使得用户可以直接从互联网上的云存储中获取设计资源,无需手动下载和导入。云库可能包含了各种类型的CAD模型、块、线型、图案填充等,涵盖了不同行业的标准组件和设计元素,大大节省了设计师查找和创建这些...

    阿里云 专有云企业版 V3.7.0 云服务器 ECS 技术白皮书 20181203.pdf

    云服务器ECS是一种基于互联网的计算资源,用户可以通过Web控制台或API来按需创建、扩展和管理服务器实例。ECS提供稳定、安全、高效和可扩展的计算能力,适用于各种业务场景,如Web服务、大数据分析、游戏开发等。 ...

    构建于廉价计算机集群上的云存储的研究与初步实现

    云存储是一种将大量数据存储和管理服务化、通过互联网提供按需访问的存储解决方案。它不依赖于特定的硬件设备,而是基于软件定义存储的概念,利用集群和分布式计算技术来构建。云存储的核心优势在于其弹性扩展性、高...

Global site tag (gtag.js) - Google Analytics