源:
评:
现在把早上看到的云计算和分布式计算,网格计算,并行计算的概念对比分析一下。
其实是要了解云计算,但是这几个名字叫得容易把问题搞混。就先从关系最不大的说吧。
并行计算(Parallel Computing)
并行计算或称平行计算是相对于串行计算来说的;所谓并行计算可分为时间上的并行和空间上的并行。 时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。并行计算科学中主要研究的是空间上的并行问题。从程序和算法设计人员的 角度来看,并行计算又可分为数据并行和任务并行。一般来说,因为数据并行主要是将一个大任务化解成相同的各个子任务,比任务并行要容易处理。
空 间上的并行导致了两类并行机的产生,按照Flynn的说法分为:单指令流多数据流(SIMD)和多指令流多数据流(MIMD)。我们常用的串行机也叫做单 指令流单数据流(SISD)。MIMD类的机器又可分为以下常见的五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机 (MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。
并行计算机有以下五种访存模型:均匀访存模型(UMA)、非均匀访存模型(NUMA)、全高速缓存访存模型(COMA)、一致性高速缓存非均匀存储访问模型(CC-NUMA)和非远程存储访问模型(NORMA)。
不像串行计算机那样,全世界基本上都在使用冯·诺伊曼的计算模型;并行计算机没有一个统一的计算模型。不过,人们已经提出了几种有价值的参考模型:PRAM模型,BSP模型,LogP模型,C^3模型等。(虽然上过高性能课,但是这几个模型都不清楚,很。。。。)
并行计算机是靠网络将各个处理机或处理器连接起来的,一般来说有以下几种方式:
静态连接:处理单元间有着固定连接的一类网络,在程序执行期间,这种点到点的链接保持不变;典型的静态网络有一维线性阵列、二维网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等。
动态连接:用交换开关构成的,可按应用程序的要求动态地改变连接组态;典型的动态网络包括总线、交叉开关和多级互连网络等。
节点度:射入或射出一个节点的边数。在单向网络中,入射和出射边之和称为节点度。
网络直径:网络中任何两个节点之间的最长距离,即最大路径数。
对剖宽度:对分网络各半所必须移去的最少边数。
对剖宽度:每秒钟内,在最小的对剖平面上通过所有连线的最大信息位(或字节)。
并行计算的性能度量
1,基本指标.
执行时间:
工作负载
存储性能
2,加速比评测.
Amdahl定理:
Gastofson定理:
Sun-Ni定理:
3,可扩放性标准.
等效率标准:
等速度标准
平均延迟标准:
这些在高性能课上老师都讲过,另附我不太喜欢这个老师。
刚才在并行计算部分已经提及分布式并行计算了,以我的理解分布式应该属于并行计算的一种,因为它是把任务分配到多机上然后一起执行。
所谓分布式计算是一门计算机科学,它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。 最近的分布式计算项目已经被用于使用世界各地成千上万位志愿者的计算机的闲置计算能力。
分布式要解决的项目都很庞大,需要惊人的计算量,仅仅由单个的电脑或是个人在一个能让人接受的时间内计算完成是决不可能的。在以前,这些问题都应该 由超级计算机来解决。但是, 超级计算机的造价和维护非常的昂贵,这不是一个普通的科研组织所能承受的。随着科学的发展,一种廉价的、高效的、维护方便的计算方法应运而生——分布式计 算!
分布式计算是近年提出的一种新的计算方式。所谓分布式计算就是在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。分布式计算比起其它算法具有以下几个优点:
1、稀有资源可以共享,
2、通过分布式计算可以在多台计算机上平衡计算负载,
3、可以把程序放在最适合运行它的计算机上,
其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。
实际上,网格计算就是分布式计算的一种。如果我们说某项工作是分布式的,那么,参与这项工作的一定不只是一台计算机,而是一个计算机网络,显然这种“蚂蚁搬山”的方式将具有很强的数据处理能力。网格计算的实质就是组合与共享资源并确保系统安全。
分布式计算使用的操作系统包括分布式操作系统,网络操作系统,基于中间件的操作系统
其中分布式操作系统又包括多处理器系统和多机系统,这个应该很好理解,多处理器系统肯定只有一个操作系统,多机系统的分布式也是只有一个操作系统分配机器资源,这样的分布式系统机器与机器之间具有非常高的透明性,
而网络操作系统,基于中间件的操作系统,都是由多个计算机组成,每个计算机有独立 的操作系统。
这些分布式计算的区分还有通信方式,资源管理方式等不同,这里就先不说了,大家有兴趣可以查一下。另附上面一段是根据我的分布式课的课件写的,很感谢这位对自己要求严格,却很懂变通的老师。
上面已经说了,网格计算是分布式计算的一种,依照我现在的判断以上分布式操作系统除了多处理器分布式计算不是网格计算以外,其他的都可以称为网格计算。
网格计算是伴随着互联网而迅速发展起来的,专门针对复杂科学计算的新型计算模式。这种计算模式是利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机就是一个“节点”,而整个计算是由成千上万个“节点”组成的“一张网格”,所以这种计算方式叫网格计算。这样组织起来的“虚拟的超级计算机”有两个优势,一个是数据处理能力超强;另一个是能充分利用网上的闲置处理能力。
下面终于轮到我们的主角云计算登场了。
云计算(Cloud computing),是一种新兴的共享基础架构的方法,可以将巨大的系统池连接在一起以提供各种IT服务。很多因素推动了对这类环境的需求,其中包括连接设备、实时数据流、SOA的采用以及搜索、开放协作、社会网络和移动商务等这样的Web2.0应用的急剧增长。 另外,数字元器件性能的提升也使IT环 境的规模大幅度提高,从而进一步加强了对一个由统一的云进行管理的需求。云计算被它的吹捧者视为“革命性的计算模型”,因为它使得超级计算能力通过互联网 自由流通成为了可能。企业与个人用户无需再投入昂贵的硬件购置成本,只需要通过互联网来购买租赁计算力,“把你的计算机当做接入口,一切都交给互联网 吧”。
狭 义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。 提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水 电一样使用IT基础设施。
广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以使任意其他的服务。
云计算的特点
(1) 超大规模。“云”具有相当的规模,Google云计算已经拥有100多万台服务器, Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力。
(2) 虚 拟化。云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无 需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。
(3) 高可靠性。“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。
(4) 通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。
(5) 高可扩展性。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。
(6) 按需服务。“云”是一个庞大的资源池,你按需购买;云可以象自来水,电,煤气那样计费。
(7) 极 其廉价。由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,“云”的通 用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间 才能完成的任务。
以上都摘自一个叫互动的wiki里,现在web2.0的东西越来越多了,我们可以自己发布学习资料,很方便。然而所谓的高深的云计算不过是分布式计算,和web2.0技术的结合,当然还有发展了。它的技术成熟必将给我们带来很大的方便。
GoogleMap就是一个云计算服务,Google里有很多服务,用户如果想使用GoogleMap,只要上网找到它,Google公司的后台服务器便开始竭尽所能为你提供你所申请的map
并且非常快,这么快捷的服务,当然依赖于各种资源分配算法和分布式技术等等。有报道说GoogleMap有一天会变成收费的,虽然目前它是免费的。
云 计算就是给我们承诺了一个这样的未来,我们可以不用在本地机器上安装软件,直接去网上就可以使用它。这样的好处当然是本地机器的处理能力不用很高,存储容 量也不用很大就可以完成各种高难度的任务,如果你需要的话。比如不用安装环境,就可以在网上编程,然后把编的程序存在网上,客户端就得到了很大程度的解 放。而且我们中国的公司也不用担心微软再向我们讨要什么版权费啥的。目前网上已经有了各种office工具,打击盗版的日子将随着云计算的普及消失。
当然无论如何我们平民大众都斗不过资本家,他们比猴都精,等人家让你尝够了云计算的好处,大家都开始使用网上服务以后,收费横空出世,大家先想着这 个时候盗版也没辙了,咱们该怎么办,我们是不是要老实巴交的给别人交服务费,那 新一轮的资本主义压榨可就要开始了!!!!!!
由于最近看明朝那些事儿,感触颇多,说话都变成这种腔调了,请大家原谅。
另附书中谈及,钱老说他之所以研究出了这么大成果,是因为马列主义影响了他。(充分的说明哲学这东西很管用,不光教人实践与认知的辩证关系,还教人为人处世之道。)
写了好长,头很疼,眼也花了。
相关推荐
分布式计算是云计算的基础之一,它涉及将大型任务分解成小部分,分布到多台计算机上同时处理,然后汇总结果。这种处理方式提高了处理效率,尤其适用于处理大数据量和复杂计算的任务。并行计算则更进一步,它是指多个...
分布式计算、并行计算、集群计算、网格计算和云计算的区别 分布式计算、并行计算、集群计算、网格计算和云计算是当前计算机领域中几个热门的概念,为了帮助读者更好地理解这些概念,我们将从它们的定义、特点、应用...
分布式计算、并行计算及集群、网格、云计算的区别.pdf
分布式计算的关键在于任务的分解和数据的分布,使得计算可以在不同的节点并行进行,从而加快处理速度。它广泛应用于大数据分析、网格计算和高性能计算等领域。 云计算和分布式计算之间的关系密切,但有明显的区别。...
高性能计算、分布式计算、网格计算、云计算概念与区别 高性能计算(High Performance Computing)是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。高...
1. **并行与分布式计算的区别**:并行计算通常在同一系统内的多处理器间进行,而分布式计算则跨越不同网络的独立系统。理解这两者的差异对于选择合适的计算模型至关重要。 2. **负载均衡**:在分布式系统中,确保...
例如,网格计算是一种分布式并行计算的形式,它利用全球范围内的闲置计算资源,构建虚拟超级计算机。 在实际应用中,分布式计算与并行处理被广泛应用于大数据分析。例如,Google的MapReduce是一种分布式计算模型,...
在云计算环境中,分布式计算常常结合并行计算,共同处理海量数据。这种计算模式在网格计算、透明计算、效用计算等前代计算模式的基础上进行了优化,为用户提供了一种按需使用的计算服务。 云计算的基础架构是一个...
云计算是分布式计算、并行计算和网格计算的进一步发展,是这些概念的商业化实现。云计算的核心特点是资源的集中管理,通过数据中心提供各种计算服务,如存储、处理、网络等。与网格计算相比,云计算更注重为企业提供...
虽然云计算和网格计算在目标上有所区别,但它们都面临着管理大规模设施、资源发现和分配、并行计算执行等共同问题。云计算的动态伸缩性和虚拟化能力使其在应对需求变化时更为灵活,而网格计算则更多地关注于资源的...
云计算则是分布式计算和网格计算概念的进一步发展和商业实现,它基于互联网提供相关服务,这些服务的增加、使用和交付模式使得用户可以根据需要扩展和方便地获取动态、虚拟化的资源。云计算被视为继个人计算机和...
PDC技术的核心概念包括并行算法设计、多线程编程、集群计算、云计算、网格计算和大规模数据处理等。这些概念的学习目标旨在让学生理解如何在现代计算环境中有效地实现这些技术。教育者必须能够灵活地调整课程内容,...
综上所述,云计算环境下,网格计算作为一种强大的分布式计算模型,为提高数据集成的可扩展性和性能提供了有效手段。通过合理设计和配置,可以充分发挥网格计算的优势,满足日益增长的数据处理需求。在未来的发展中,...
总的来说,分布式计算和网格计算是应对大数据和云计算时代挑战的重要工具,它们通过整合网络中的计算资源,提高了处理复杂问题的能力,同时也为各种科学研究和商业应用提供了新的可能性。随着技术的不断进步,分布式...
总的来说,云计算是一种综合了分布式计算、并行计算和网格计算优势的计算模型。它通过虚拟化技术实现资源的灵活配置,通过网络提供对资源的访问,用户可以根据自身需求快速获取相应的计算资源。云计算的特点在于其...
网格计算则更侧重于大规模分布式计算资源的整合与共享,它将不同地理位置、组织机构内的计算资源(如超级计算机、存储设备、数据源等)连接起来,形成一个虚拟的、统一的计算环境。网格计算的目标是实现资源的高效...
随着多核处理器的普及以及大数据和云计算的迅猛发展,学习并掌握并行与分布式计算已经成为未来计算机专业人才必备的技能之一。 并行与分布式计算之所以重要,首先是因为它们为大规模科学与工程计算、数据分析等提供...
尽管网格计算主要用于科学研究等领域,但其并行计算的思想对云计算的发展产生了重要影响。 - **服务化**:云计算强调服务化思维,即将传统的软件产品和服务化,让用户以订阅的形式获取所需的应用程序或平台服务,...