(入门菜鸟请看)云计算之我思
本人日语专业,最近看着cpu等底层的东西,讲到兴头会联系自己对概念的理解,如有不妥,欢迎交流。
本文提到 thread、线程、内存等基本概念。
搞云计算的是用来做数据挖掘、大数据分析、机器学习之类的,然而并不知道这些有个什么卵用,因为我并没做过数据挖掘大数据分析和机器学习。
看的是google的三大论文,bigTable、MapReduce(并行处理)、文件系统GFS。
!!!!之后会对比一下 普通的执行流程和云计算的流程的差异,以此来了解云计算
(官方说明)一个具体流程如下:不感兴趣,没事,后头有精彩的
(1)输入文件分成M块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序
(2)M个Map任务和R个Reduce任务需要分派,Master选择空闲Worker来分配这些Map或Reduce任务
(3)Worker读取并处理相关输入块,Map函数产生的中间结果<key,value>对暂时缓冲到内存
(4)中间结果定时写到本地硬盘,分区函数将其分成R个区。中间结果在本地硬盘的位置信息将被发送回Master,然后Maste
(5)当Master通知执行Reduce的Worker关于中间<key,value>对的位置时,它调用远程过程,从MapWorker的本地硬盘上读取
缓冲的中间数据。当Reduce Worker读到所有的中间数据,它就使用中间key进行排序,这样可使相同key的值都在一起
(6)Reduce Worker根据每一个唯一中间key来遍历所有的排序后的中间数据,并且把key和相关的中间结果值集合传递给用户
定义的Reduce函数。Reduce函数的结果写到一个最终的输出文件
(图画表示)
我们由一个问题来导入云计算处理的思维::
模拟一个例子,有数组a[100] , b[100] ,c[100] ,a和b每个里头都有100个数据,c数组的对应位置存储着运算结果。
如果是普通的运算代码应该这么写哈:
for(int i = 0 ; i<a.length();i++){
c[i]=a[i]+b[i];
}
第一次跳跃--->线程并行处理及云计算的并行数据处理MapReduce
如果是用两个线程来做的话,是不是要面临数据有没有被处理的问题呢?
还是a[100] b[100] c[100]这三个数组,a,b两个数组全是数据,c是空的
这是后是不是要多加一个考虑就是这么多运算的任务不能重复执行不是?
class threadA{
public void run(){
for(int i = 0 ; i<a.length();i++)
{ //根据前面的代码可以看出,如果,判断一下,如果c数组对应位置的
if(c[i]==null)
{
c[i] = a[i]+b[i];
}
}
}
}
class threadB{
public void run(){
for(int i = 0 ; i<a.length();i++)
{ //同前面的
if(c[i]==null)
{
c[i] = a[i]+b[i];
}
}
}
}
第二次跳跃---->数据:------!Google Distributed File System,GFS
较上面不同的是:我们的数据是分散在不同的计算机上的,因为一台计算机的存储有限,加上其他的原因反正我们是 !接受了分布式存储!。。。。。
这个文件最终达到的目的是,一台电脑存放不了的数据,就给云计算集群里 其他的电脑;
这时候问题就来了,一是要知道都有哪些数据,二是知道这些数据都放在哪。
我感觉这个跟虚拟内存技术挺像的,这个是忽悠计算机搞的好像它有无数的内存一样,但其实是把原来内存里的数据暂存到硬盘里。
云计算跟它的相同之处在于同样是存储有限,区别是一个是内存不足、一个是硬盘不足,还有一个区别是:一个花时间来换取内存空间,另一个是扩展到别的计算机里。
第三次跳跃---->控制:------!分布式监控系统Dapper
我感觉就跟 操作系统 和 thread的关系一样类似
有一个个thread 和 他们的集合 threadGroup
threadGroup里面存放的是一个个thread,用于控制这些线程
class thread(){
String threadName;
void run();
}
class threadGroup{
thread[ ];
}
而云计算则是控制一台一台集群里的计算机。
相关推荐
2021-2022学年第一学期期中考试《云计算及应用》 1、 云计算有哪些部暑类型?并分别分析各类型的基本概念及特点。(15分) 2、 简述分析云计算的3种服务模式及其功能。(15分) 3、 简述云计算的基本概念和技术应用特点。...
云计算试题及答案全文共5页,当前为第1页。云计算试题及答案全文共5页,当前为第1页。云计算试题及答案 云计算试题及答案全文共5页,当前为第1页。 云计算试题及答案全文共5页,当前为第1页。 题 1、云计算的一大...
云计算架构师培训主要围绕着云计算的基础概念、技术特性、历史发展以及应用趋势展开。在此次培训中,学员将深入理解云计算与虚拟化技术,掌握云计算架构的设计与部署,以及了解云计算的典型应用场景。 首先,云计算...
1. 云概述模块:介绍云计算产业发展和云计算技术的基础知识,主要包括云计算产业发展概况、国家发展云计算相关政策、云计算产业链、云计算的内涵、云计算的特点等。 2. 云标准模块:介绍云计算相关标准及其进程,...
【云计算调研报告】 本报告旨在深入探讨云计算这一新兴技术的起源、发展动力、现状以及未来趋势,以便对这一领域的理解有全面而深入的认识。报告共分为四大部分:概述、云计算的产生、云计算的现状和云计算的发展...
《云计算架构-解决方案设计手册》是一本深入探讨云计算技术与实践的专业著作,由华为公司的云计算首席架构师顾炯炯编著。这本书详细阐述了云计算的发展历程、核心技术、商业实践以及行业应用,旨在帮助读者从概念到...
### 云计算核心概念与应用深度解析 #### 一、云计算概览 云计算,这一新兴的IT领域,近年来风靡全球,被广泛认为是继Web2.0之后的又一大技术革命。亚马逊、谷歌和IBM等科技巨头率先引领潮流,将云计算推向大众视野...
《云计算技术》课程标准 本课程标准详细阐述了学习云计算技术的目标、内容、评估方式以及参考文献,旨在帮助学生深入理解和掌握云计算领域的核心知识。云计算技术是信息技术领域的一个重要分支,随着科技的发展,其...
云计算是近年来信息技术领域备受瞩目的概念,它以其独特的商业模式和计算模式改变了传统的IT服务交付方式。作为2007年才出现的新词汇,云计算迅速超越了网格计算的热度,成为IT巨头们竞相发展的核心领域。尽管对于...
云计算期末考试试卷及答案知识分享是关于云计算和虚拟化的考试试卷,涵盖了云计算的概念、虚拟化技术、云计算服务模型、云计算架构等方面的知识点。 云计算的概念 1. 云计算是指把计算资源都放到因特网上,以提供...
精品云计算第三版全套课程PPT学习课件,非常适合大学生和职场人士学习,也适合老鸟复习回顾,完全可用于自学入门,很经典好用的PPT课件哦~ 第1章 大数据与云计算第三版 第2章 Google云计算第三版原理与应用(一) 第...
"刘鹏云计算第三版习题答案" 刘鹏云计算第三版习题答案是一本关于云计算的习题答案集,涵盖了云计算的基础知识、架构设计、应用场景等多方面内容。下面我们将对该书籍进行详细的知识点解析。 云计算基础知识 ...
云计算实验 云计算概述1 云计算概述2 云计算概述3 云计算概述4 云计算管理2 云计算管理3 云计算管理4 云资源管理1 存储虚拟化1 存储虚拟化2 存储虚拟化3 存储虚拟化4 服务器虚拟化1 服务器虚拟化2 ...
云计算是一种基于互联网的计算方式,它通过网络将庞大的计算处理任务分布到大量的计算机上,将数据处理程序分解成无数小程序,由多台服务器协同完成计算和分析,再将结果反馈给用户。这种技术的核心在于其分布式计算...
"云计算平台及发展趋势" 云计算平台是指通过互联网提供的、按需获取的计算资源和存储资源的集合,包括服务器、存储、数据库、软件、应用程序等。云计算平台的发展趋势是指云计算技术的发展方向和云计算市场的发展...
云计算是一种通过互联网提供动态可扩展且通常是虚拟化的资源的计算方式,它使得用户能够通过网络随时随地以各种形式获取服务。云计算作为现代信息技术领域的一个重要分支,其发展水平已成为衡量一个国家信息能力的...
云计算导论 云计算,作为当前信息技术领域的重要概念,它的出现改变了传统的IT服务模式。它不再仅仅是理论上的镜中花,而是实实在在地影响着企业和个人的信息化进程。云计算的核心在于通过网络提供灵活、可扩展的...
云计算面试题之ELK面试题,运维工程师必备云计算面试题之ELK面试题,运维工程师必备云计算面试题之ELK面试题,运维工程师必备云计算面试题之ELK面试题,运维工程师必备云计算面试题之ELK面试题,运维工程师必备...
云计算工程技术人员是指专门从事云计算技术研究、云系统构建、部署、运维的技术人员。他们通常负责云平台的规划、开发、服务和维护,同时也涉及云计算技术的开发与应用。云计算工程技术人员的工作包括但不限于云资源...