关于本书
本电子迷你书摘自《云计算与分布式系统:从并行处理到物联网》一书第 1、2、6章,由InfoQ制作,属于InfoQ软件开发丛书。
以下是《云计算与分布式系统:从并行处理到物联网》一书的介绍:
经过30年的发展,并行处理和分布式计算在计算机科学和信息技术中方兴未艾。许多高校现在已经开设相关课程。教师和学生一直在寻找一本可以全面涵盖 计算理论和信息技术(包括设计、编程和分布式系统应用)的教材。本书正是为了满足这一需求而设计,而且本书还可以作为相关领域专业技术人员的参考书。
本书介绍了硬件和软件、系统体系结构、新的编程范式,以及强调速度性能和节能的生态系统方面的最新进展。这些最新发展说明了如何创建高性能集群、可 扩展网络、自动数据中心和高吞吐量云/网格系统。我们还介绍了云编程以及如何将分布式系统和云系统应用于创新的互联网应用中。本书的目的是将传统的多处理 器和多计算机集群转换为Web规模网格、云以及在未来互联网中泛在使用的对等(P2P)网络,包括近年来快速发展的大型社会网络和物联网。
本书主要内容
我们已经在单独的一卷中介绍了许多里程碑式的发展。我们呈现的成果不仅来自于我们自己的研究团队,还来自于美国、中国和澳大利亚的主要研究组织。总的来说,本书总结了近年来从并行处理到分布式计算和未来互联网的进展。
本书从现代分布式模型概述开始,揭示并行、分布式与云计算系统的设计原理、系统体系结构和创新应用。本书试图将并行处理技术与基于网络的分布式系统 结合。书中通过开源和商业厂商的具体例子,重点介绍了用于研究、电子商务、社会网络、超级计算等应用的可扩展物理系统、虚拟化数据中心和云系统。
全书共9章内容,分为三部分:第一部分覆盖系统模型和关键技术,包括集群化和虚拟化。第二部分介绍数据中心设计、云计算平台、面向服务的体系结构、分布式编程范式和软件支持。第三部分研究计算/数据网格、对等网络、普适云、物联网和社会网络。
本书有6章内容涉及云计算方面的相关材料,分别是第1章、第3~6章和第9章。书中描述的云系统包括公有云:谷歌应用引擎、亚马逊Web服务、 Facebook、SalesForce.com等。这些云系统在升级Web服务和互联网应用方面发挥着越来越重要的作用。计算机架构师、软件工程师和系 统设计师可能想要利用云技术来建造未来计算机和基于互联网的系统。
本书特点
覆盖现代分布式计算技术,包括计算机集群、虚拟化、面向服务的体系结构、大规模并行处理器、对等系统、云计算、社会网络和物联网。
强调开发并行、分布式和云计算系统的普适性、灵活性、有效性、可扩展性、可用性和可编程性。
硬件、网络和系统体系结构方面的最新进展:
多核CPU和众核GPU(Intel、 Nvidia、AMD)。
虚拟机和虚拟集群(CoD、Violin、Amazon VPC)。
Top500体系结构(Tianhe-1A、Jaguar、Roadrunner等)。
谷歌应用引擎、亚马逊AWS、微软Azure、IBM蓝云。
TeraGrid、DataGrid、ChinaGrid、BOINIC、Grid' 5000和FutureGrid。
Chord、Napster、BiTorrent、KaZaA、PPlive、JXTA和.NET。
RFID、传感器网络、GPS、CPS和物联网。
Facebook、Force.Com、Twitter、SGI Cylone、Nebula和GoGrid。
范式、编程、软件和生态系统方面新的改进:
MapReduce、Dryad、Hadoop、MPI、Twister、BigTable、DISC等。
云服务和信任模型(SaaS、IaaS、PaaS和PowerTrust)。
编程语言和协议(Python, SOAP, UDDI, Pig Latin)。
虚拟化软件(Xen、KVM、VMware ESX等)。
云操作系统和混搭系统(Eucalyptus、Nimbus、OpenNebula、vShere/4等)。
面向服务的体系结构(REST、WS、Web 2.0、OGSA等)。
分布式操作系统(DCE、Amoeba和MOSIX)。
中间件和软件库(LSF、Globus、Hadoop、Aneka)。
书中含有100多个例题,并且每章末都有习题和进一步阅读建议。
涵盖多个来自主流分布式计算提供商(亚马逊、谷歌、微软、IBM、惠普、Sun、 Silicon Graphics、Rackspace、SalesForce.com、netSuite和Enomaly等)的案例研究。
原书目录
第一部分系统建模、集群化和虚拟化
第1章分布式系统模型和关键技术
1.1互联网之上的可扩展计算
1.1.1互联网计算的时代
1.1.2可扩展性计算趋势和新的范式
1.1.3物联网和CPS
1.2基于网络的系统技术
1.2.1多核CPU和多线程技术
1.2.2大规模和超大规模GPU计算
1.2.3内存、外部存储和广域网
1.2.4虚拟机和虚拟化中间件
1.2.5云计算的数据中心虚拟化
1.3分布式和云计算系统模型
1.3.1协同计算机集群
1.3.2网格计算的基础设施
1.3.3对等网络家族
1.3.4互联网上的云计算
1.4分布式系统和云计算软件环境
1.4.1面向服务的体系结构(SOA)
1.4.2分布式操作系统趋势
1.4.3并行和分布式编程模型
1.5性能、安全和节能
1.5.1性能度量和可扩展性分析
1.5.2容错和系统可用性
1.5.3网络威胁与数据完整性
1.5.4分布式计算中的节能
1.6参考文献和习题
第2章可扩展并行计算集群
2.1大规模并行集群
2.1.1集群发展趋势
2.1.2计算机集群的设计宗旨
2.1.3基础集群设计问题
2.1.4Top500超级计算机分析
2.2计算机集群和MPP体系结构
2.2.1集群组织和资源共享
2.2.2节点结构和MPP封装
2.2.3集群系统互连
2.2.4硬件、软件和中间件支持
2.2.5大规模并行GPU集群
2.3计算机集群的设计原则
2.3.1单系统镜像特征
2.3.2冗余高可用性
2.3.3容错集群配置
2.3.4检查点和恢复技术
2.4集群作业和资源管理
2.4.1集群作业调度方法
2.4.2集群作业管理系统
2.4.3集群计算的负载共享设备(LSF)
2.4.4MOSIX: Linux集群和云的操作系统
2.5顶尖超级计算机系统的个案研究
2.5.1Tianhe-1A:2010年的世界最快超级计算机
2.5.2Gray XT5 Jaguar:2009年的领先超级计算机
2.5.3IBM Roadrunner:2008年的领先超级计算机
2.6参考文献和习题
第3章虚拟机和集群与数据中心虚拟化
3.1虚拟化的实现层次
3.1.1虚拟化实现的层次
3.1.2VMM的设计需求和提供商
3.1.3操作系统级的虚拟化支持
3.1.4虚拟化的中间件支持
3.2虚拟化的结构/工具与机制
3.2.1hypervisor与Xen体系结构
3.2.2全虚拟化的二进制翻译
3.2.3编译器支持的半虚拟化技术
3.3CPU、内存和I/O设备的虚拟化
3.3.1虚拟化的硬件支持
3.3.2CPU虚拟化
3.3.3内存虚拟化
3.3.4I/O虚拟化
3.3.5多核处理器的虚拟化
3.4虚拟集群和资源管理
3.4.1物理集群与虚拟集群
3.4.2在线迁移虚拟机的步骤与性能影响
3.4.3内存、文件与网络资源的迁移
3.4.4虚拟集群的动态部署
3.5数据中心的自动化与虚拟化
3.5.1数据中心服务器合并
3.5.2虚拟存储管理
3.5.3虚拟化数据中心的云操作系统
3.5.4虚拟化数据中心的可信管理
3.6参考文献与习题
第二部分云平台、面向服务的体系结构和云编程
第4章构建在虚拟化数据中心上的云平台体系结构
4.1云计算和服务模型
4.1.1公有云、私有云和混合云
4.1.2云生态系统和关键技术
4.1.3基础设施即服务(IaaS)
4.1.4平台即服务 (PaaS) 和软件即服务(SaaS)
4.2数据中心设计与互连网络
4.2.1仓库规模的数据中心设计
4.2.2数据中心互连网络
4.2.3运送集装器的模块化数据中心
4.2.4模块化数据中心的互连
4.2.5数据中心管理问题
4.3计算与存储云的体系结构设计
4.3.1通用的云体系结构设计
4.3.2层次化的云体系结构开发
4.3.3虚拟化支持和灾难恢复
4.3.4体系结构设计挑战
4.4公有云平台:GAE、AWS和Azure
4.4.1公有云及其服务选项
4.4.2谷歌应用引擎(GAE)
4.4.3亚马逊的Web服务(AWS)
4.4.4微软的Windows Azure
4.5云间的资源管理
4.5.1扩展的云计算服务
4.5.2资源配置和平台部署
4.5.3虚拟机创建和管理
4.5.4云资源的全球交易
4.6云安全与信任管理
4.6.1云安全的防御策略
4.6.2分布式入侵/异常检测
4.6.3数据和软件保护技术
4.6.4数据中心的信誉指导保护
4.7参考文献与习题
第5章面向服务的分布式体系结构
5.1服务和面向服务的体系结构
5.1.1REST和系统的系统
5.1.2服务和Web服务
5.1.3企业多层体系结构
5.1.4网格服务和OGSA
5.1.5其他的面向服务的体系结构和系统
5.2面向消息的中间件
5.2.1企业总线
5.2.2发布-订阅模型和通知
5.2.3队列和消息传递系统
5.2.4云或网格中间件应用
5.3门户和科学网关
5.3.1科学网关样例
5.3.2科学协作的HUBzero平台
5.3.3开放网关计算环境(OGCE)
5.4发现、注册表、元数据和数据库
5.4.1UDDI和服务注册表
5.4.2数据库和订阅-发布
5.4.3元数据目录
5.4.4语义Web和网格
5.4.5作业执行环境和监控
5.5面向服务的体系结构中的工作流
5.5.1工作流的基本概念
5.5.2工作流标准
5.5.3工作流体系结构和规范
5.5.4工作流运行引擎
5.5.5脚本工作流系统Swift
5.6参考文献与习题
第6章云编程和软件环境
6.1云和网格平台的特性
6.1.1云的功能和平台的特性
6.1.2网格和云的公共传统特性
6.1.3数据特性和数据库
6.1.4编程和运行时支持
6.2并行和分布式编程范式
6.2.1并行计算和编程范式
6.2.2MapReduce、Twister和迭代MapReduce
6.2.3来自Apache的Hadoop软件库
6.2.4微软的Dryad和DryadLINQ
6.2.5Sawzall和Pig Latin高级语言
6.2.6并行和分布式系统的映射应用
6.3GAE的编程支持
6.3.1GAE编程
6.3.2谷歌文件系统(GFS)
6.3.3BigTable——谷歌的NOSQL系统
6.3.4Chubby——谷歌的分布式锁服务
6.4亚马逊AWS与微软Azure中的编程
6.4.1亚马逊EC2上的编程
6.4.2亚马逊简单存储服务(S3)
6.4.3亚马逊弹性数据块存储服务(EBS)和SimpleDB
6.4.4微软Azure编程支持
6.5新兴云软件环境
6.5.1开源的Eucalyptus和Nimbus
6.5.2OpenNebula、Sector/Sphere和Open Stack
6.5.3Manjrasoft Aneka云和工具机
6.6参考文献与习题
第三部分网格、P2P和未来互联网
第7章网格计算系统和资源管理
7.1网格体系结构和服务建模
7.1.1网格历史与服务类别
7.1.2CPU清除和虚拟超级计算机
7.1.3开放网格服务体系结构(OGSA)
7.1.4数据密集型网格服务模型
7.2网格项目和网格系统创建
7.2.1国家网格和国际项目
7.2.2美国的NSF TeraGrid
7.2.3欧盟的DataGrid
7.2.4ChinaGrid设计经验
7.3网格资源管理和资源中介
7.3.1资源管理和作业调度
7.3.2CGSP的网格资源监控
7.3.3服务记账和经济模型
7.3.4Gridbus的资源中介
7.4网格计算的软件与中间件
7.4.1开源网格中间件包
7.4.2Globus Tookit体系结构(GT4)
7.4.3集装器和资源/数据管理
7.4.4ChinaGrid支持平台(CGSP)
7.5网格应用趋势和安全措施
7.5.1网格应用技术融合
7.5.2网格负载与性能预测
7.5.3网格安全执行的信任模型
7.5.4认证与授权方法
7.5.5网格安全基础设施(GSI)
7.6参考文献与习题
第8章对等计算和覆盖网络
8.1P2P计算系统
8.1.1P2P计算系统的基本概念
8.1.2P2P计算面临的基础挑战
8.1.3P2P网络系统分类
8.2P2P覆盖网络及其性质
8.2.1无结构P2P覆盖网络
8.2.2分布式哈希表(DHT)
8.2.3结构化P2P覆盖网络
8.2.4混合式覆盖网络
8.3路由、邻近性和容错
8.3.1P2P覆盖网络的路由
8.3.2P2P覆盖网络中的网络邻近性
8.3.3容错和失效恢复
8.3.4抗扰动与失效
8.4信任、信誉和安全管理
8.4.1节点信任和信誉系统
8.4.2信任覆盖网络和DHT实现
8.4.3PowerTrust:可扩展的信誉系统
8.4.4加强覆盖网络安全,抵御DDoS攻击
8.5P2P文件共享和版权保护
8.5.1快速搜索、副本和一致性
8.5.2P2P内容分发网络
8.5.3版权保护问题和解决方案
8.5.4P2P网络中的共谋盗版预防
8.6参考文献与习题
第9章普适云计算、物联网与社会网络
9.1支持普适计算的云趋势
9.1.1云计算在HPC/HTC和普适计算中的应用
9.1.2NASA和CERN的大规模私有云
9.1.3灵活和可扩展的云混搭系统
9.1.4移动云计算平台Cloudlet
9.2分布式系统和云的性能
9.2.1科研云综述
9.2.2数据密集型扩展计算(DISC)
9.2.3HPC/HTC系统的性能指标
9.2.4云计算的服务质量
9.2.5MPI、Azure、EC2、MapReduce、Hadoop的基准测试
9.3物联网关键技术
9.3.1实现普适计算的物联网
9.3.2射频标识(RFID)
9.3.3传感器网络和ZigBee技术
9.3.4全球定位系统(GPS)
9.4物联网创新应用
9.4.1物联网应用
9.4.2零售和供应链管理
9.4.3智能电网和智能建筑
9.4.4信息物理系统(CPS)
9.5在线社会网络和专业网络
9.5.1在线社会网络特征
9.5.2基于图论的社会网络分析
9.5.3社会网络社区和应用
9.5.4Facebook:世界上最大的社会网络
9.5.5Twitter:微博、新闻和提醒服务平台
9.6参考文献与习题
索引
相关推荐
云计算与分布式系统:从并行处理到物联网 云计算与分布式系统是并行处理和物联网应用的重要支撑技术。云计算通过将大规模数据处理任务分解为多个子任务,并在多个计算节点上执行,实现了高效的数据处理能力。在...
**云计算与分布式系统详解** 云计算,作为信息技术领域的一项革命性技术,已经深深地影响了现代企业的运作方式和数据处理模式。它是一种通过网络提供按需计算服务的模型,包括服务器、存储、数据库、网络、软件、...
2-云计算与分布式系统 从并行处理到物联网.pdf
云计算环境下分布式数据挖掘的系统设计涉及多个组成部分,包括数据存储、数据通信传输以及程序加载等模块。在实现这样的系统时,通常会选择一个嵌入式Linux内核作为系统平台,利用其稳定的性能和广泛的资源支持。...
云计算与分布式系统的实践往往需要团队合作,因为它们需要多人共同设计和解决问题。在教学过程中,教师可以鼓励学生以小组为单位完成项目,通过这种方式,学生不仅可以在实践中学习分布式系统的相关知识,还可以学习...
分布式系统通过网络将物理位置分散的多个计算节点连接起来,协同工作,共同完成数据处理任务。 大数据智能融合算法是一种能够有效处理、分析和融合大量、多样和快速变化的数据,以获取有价值的信息和知识的技术和...
云计算和分布式系统是当今信息技术领域的重要发展趋势,它们在推动银行等金融机构数据中心转型方面发挥着关键作用。中国建设银行作为国内领先银行之一,其数据中心转型的过程和经验具有很好的参考价值。 云计算技术...
其次,云计算分布式存储安全保护技术的研究现状指出,尽管当前研究主要集中在数据的高效传输、存储和访问以及系统性能的提升上,但数据的密钥管理却往往被忽略。例如,虽然有研究提出了使用复制机制来构建文件存储...
总的来说,云计算与分布式计算共同推动了信息技术的进步,提供了强大的计算能力和数据处理能力。云计算通过虚拟化和服务化,使得计算资源的获取和使用更加便捷,而分布式计算则通过任务和数据的分布式处理,提升了...
【大数据、云计算与分布式系统详解】 在现代信息技术领域,大数据、云计算和分布式系统是三个至关重要的概念,它们共同推动了信息处理和存储能力的革命。本文将深入探讨这些概念及其在CS(计算机科学)中的应用。 ...
基于云计算的分布式存储系统的研究和应用。
### 滚动数组在云计算和分布式系统中的应用 #### 一、滚动数组在云计算中的分布式存储 **1.1 滚动数组通过数据分片实现分布式存储** 滚动数组在分布式存储中扮演着关键角色,它通过将数据划分成较小的块(分片)...
"机器学习系统-云计算-分布式系统.rar"这个压缩包文件集锦了这一领域的核心知识点,为深入理解和实践提供了宝贵的资源。以下是对这些主题的详细阐述: 1. **机器学习系统**:机器学习是一种数据驱动的方法,它使...
云计算和分布式系统的结合,可以使系统在资源调度、负载均衡、数据备份等方面表现出更高的灵活性和可扩展性。 在设计基于云计算的分布式校园视频监控系统时,需要考虑几个关键的技术点。首先是数据传输量问题,传统...
云计算与分布式技术紧密相连,分布式系统是构建云计算平台的基础架构。通过理解分布式系统、分布式计算、分布式数据库和分布式存储等技术,我们可以更好地设计和实现大规模、高可用性的云服务。在实际应用中,如电商...
用户层提供了用户接入的接口,用户可以通过各种终端设备访问分布式系统;服务层负责资源监控、负载管理、计费管理等,实现虚拟化逻辑资源的分配;数据层负责网络通信、应用服务器和数据存储的管理,确保数据的共享、...
云计算分布式机器学习任务调度算法研究的知识点分析: 云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。云计算平台具有强大的计算能力和存储能力,非常...
3. 云计算生态系统标准分析与未来工作峰会的相关内容: 会议邀请了来自各国的专家就云计算标准在政府策略的应用、云计算与大数据和物联网等相关技术的关系、云计算与分布式平台的核心标准、现有云计算标准的应用和...