(入门菜鸟请看)云计算之我思
本人日语专业,最近看着cpu等底层的东西,讲到兴头会联系自己对概念的理解,如有不妥,欢迎交流。
本文提到 thread、线程、内存等基本概念。
搞云计算的是用来做数据挖掘、大数据分析、机器学习之类的,然而并不知道这些有个什么卵用,因为我并没做过数据挖掘大数据分析和机器学习。
看的是google的三大论文,bigTable、MapReduce(并行处理)、文件系统GFS。
!!!!之后会对比一下 普通的执行流程和云计算的流程的差异,以此来了解云计算
(官方说明)一个具体流程如下:不感兴趣,没事,后头有精彩的
(1)输入文件分成M块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序
(2)M个Map任务和R个Reduce任务需要分派,Master选择空闲Worker来分配这些Map或Reduce任务
(3)Worker读取并处理相关输入块,Map函数产生的中间结果<key,value>对暂时缓冲到内存
(4)中间结果定时写到本地硬盘,分区函数将其分成R个区。中间结果在本地硬盘的位置信息将被发送回Master,然后Maste
(5)当Master通知执行Reduce的Worker关于中间<key,value>对的位置时,它调用远程过程,从MapWorker的本地硬盘上读取
缓冲的中间数据。当Reduce Worker读到所有的中间数据,它就使用中间key进行排序,这样可使相同key的值都在一起
(6)Reduce Worker根据每一个唯一中间key来遍历所有的排序后的中间数据,并且把key和相关的中间结果值集合传递给用户
定义的Reduce函数。Reduce函数的结果写到一个最终的输出文件
(图画表示)
我们由一个问题来导入云计算处理的思维::
模拟一个例子,有数组a[100] , b[100] ,c[100] ,a和b每个里头都有100个数据,c数组的对应位置存储着运算结果。
如果是普通的运算代码应该这么写哈:
for(int i = 0 ; i<a.length();i++){
c[i]=a[i]+b[i];
}
第一次跳跃--->线程并行处理及云计算的并行数据处理MapReduce
如果是用两个线程来做的话,是不是要面临数据有没有被处理的问题呢?
还是a[100] b[100] c[100]这三个数组,a,b两个数组全是数据,c是空的
这是后是不是要多加一个考虑就是这么多运算的任务不能重复执行不是?
class threadA{
public void run(){
for(int i = 0 ; i<a.length();i++)
{ //根据前面的代码可以看出,如果,判断一下,如果c数组对应位置的
if(c[i]==null)
{
c[i] = a[i]+b[i];
}
}
}
}
class threadB{
public void run(){
for(int i = 0 ; i<a.length();i++)
{ //同前面的
if(c[i]==null)
{
c[i] = a[i]+b[i];
}
}
}
}
第二次跳跃---->数据:------!Google Distributed File System,GFS
较上面不同的是:我们的数据是分散在不同的计算机上的,因为一台计算机的存储有限,加上其他的原因反正我们是 !接受了分布式存储!。。。。。
这个文件最终达到的目的是,一台电脑存放不了的数据,就给云计算集群里 其他的电脑;
这时候问题就来了,一是要知道都有哪些数据,二是知道这些数据都放在哪。
我感觉这个跟虚拟内存技术挺像的,这个是忽悠计算机搞的好像它有无数的内存一样,但其实是把原来内存里的数据暂存到硬盘里。
云计算跟它的相同之处在于同样是存储有限,区别是一个是内存不足、一个是硬盘不足,还有一个区别是:一个花时间来换取内存空间,另一个是扩展到别的计算机里。
第三次跳跃---->控制:------!分布式监控系统Dapper
我感觉就跟 操作系统 和 thread的关系一样类似
有一个个thread 和 他们的集合 threadGroup
threadGroup里面存放的是一个个thread,用于控制这些线程
class thread(){
String threadName;
void run();
}
class threadGroup{
thread[ ];
}
而云计算则是控制一台一台集群里的计算机。
相关推荐
2021-2022学年第一学期期中考试《云计算及应用》 1、 云计算有哪些部暑类型?并分别分析各类型的基本概念及特点。(15分) 2、 简述分析云计算的3种服务模式及其功能。(15分) 3、 简述云计算的基本概念和技术应用特点。...
云时代云计算 北京云计算及-北京云计算及其产业战略机会 公共服务平台中的云计算 - 中国云计算 基于云计算的智能交通系统云计算技术 农业云计算及云存储设计 虚拟化与云计算 迎接云计算时代 云分布与动态云计算 ...
云计算试题及答案全文共5页,当前为第1页。云计算试题及答案全文共5页,当前为第1页。云计算试题及答案 云计算试题及答案全文共5页,当前为第1页。 云计算试题及答案全文共5页,当前为第1页。 题 1、云计算的一大...
《职业技能大赛云计算赛项集训资料》是一份针对职业技能大赛中云计算赛项的专业训练资源,旨在帮助参赛者提升云计算技术的理论知识与实践能力。在当前数字化转型的大潮中,云计算作为信息技术的重要分支,其重要性日...
云计算架构师培训主要围绕着云计算的基础概念、技术特性、历史发展以及应用趋势展开。在此次培训中,学员将深入理解云计算与虚拟化技术,掌握云计算架构的设计与部署,以及了解云计算的典型应用场景。 首先,云计算...
1. 云概述模块:介绍云计算产业发展和云计算技术的基础知识,主要包括云计算产业发展概况、国家发展云计算相关政策、云计算产业链、云计算的内涵、云计算的特点等。 2. 云标准模块:介绍云计算相关标准及其进程,...
### 云计算核心概念与应用深度解析 #### 一、云计算概览 云计算,这一新兴的IT领域,近年来风靡全球,被广泛认为是继Web2.0之后的又一大技术革命。亚马逊、谷歌和IBM等科技巨头率先引领潮流,将云计算推向大众视野...
云计算是近年来信息技术领域备受瞩目的概念,它以其独特的商业模式和计算模式改变了传统的IT服务交付方式。作为2007年才出现的新词汇,云计算迅速超越了网格计算的热度,成为IT巨头们竞相发展的核心领域。尽管对于...
云计算期末考试试卷及答案知识分享是关于云计算和虚拟化的考试试卷,涵盖了云计算的概念、虚拟化技术、云计算服务模型、云计算架构等方面的知识点。 云计算的概念 1. 云计算是指把计算资源都放到因特网上,以提供...
精品云计算第三版全套课程PPT学习课件,非常适合大学生和职场人士学习,也适合老鸟复习回顾,完全可用于自学入门,很经典好用的PPT课件哦~ 第1章 大数据与云计算第三版 第2章 Google云计算第三版原理与应用(一) 第...
"刘鹏云计算第三版习题答案" 刘鹏云计算第三版习题答案是一本关于云计算的习题答案集,涵盖了云计算的基础知识、架构设计、应用场景等多方面内容。下面我们将对该书籍进行详细的知识点解析。 云计算基础知识 ...
云计算认证考试 1. 以下哪个云服务属于SaaS层服务? A. 弹性云服务器ECS B. 云桌面服务Workspace C. 云监控服务Cloud Eye[正确] D. 云容器引擎CCE 答案解析:无 2. 以下哪个服务可以使伸缩组中每一个实例均可...
云计算实验 云计算概述1 云计算概述2 云计算概述3 云计算概述4 云计算管理2 云计算管理3 云计算管理4 云资源管理1 存储虚拟化1 存储虚拟化2 存储虚拟化3 存储虚拟化4 服务器虚拟化1 服务器虚拟化2 ...
"云计算平台及发展趋势" 云计算平台是指通过互联网提供的、按需获取的计算资源和存储资源的集合,包括服务器、存储、数据库、软件、应用程序等。云计算平台的发展趋势是指云计算技术的发展方向和云计算市场的发展...
云计算是一种基于互联网的计算方式,它通过网络将庞大的计算处理任务分布到大量的计算机上,将数据处理程序分解成无数小程序,由多台服务器协同完成计算和分析,再将结果反馈给用户。这种技术的核心在于其分布式计算...
云计算导论 云计算,作为当前信息技术领域的重要概念,它的出现改变了传统的IT服务模式。它不再仅仅是理论上的镜中花,而是实实在在地影响着企业和个人的信息化进程。云计算的核心在于通过网络提供灵活、可扩展的...
云计算综合标准化体系建设指南 云计算是战略性新兴产业重要组成部分,推进云计算健康快速发展,对加速产业转型升级、促进信息消费、建设创新型国家具有重要意义。本指南旨在指导云计算综合标准化体系建设,推动...
云计算产业生态图谱2018年显示,云计算产业正在蓬勃发展,IaaS厂商是云计算产业的主力军,云安全、云存储、视频云、性能APM、云数据中心等是云计算产业的重要组成部分,人工智能和大数据的落地为云计算产业的发展...
本指南介绍了云计算的定义、特征、服务模式以及部署模式,明确了云计算面临的传统 安全威胁以及新特性带来的新的安全威胁,规定了云计算安全防护技术体系架构,并从物理 安全、主机安全、虚拟化安全、网络安全、数据...
第二章大数据环境下的云计算架构,介绍大数据环境的技术特征、云计算的架构及标准化、国内外的云计算架构和云计算应用,旨在让学生掌握云计算的架构及标准化和大数据环境的技术特征。 第三章大数据关键技术与应用,...