最近看到亚马逊第一次单独公布AWS财报,一年营收57亿美元,市场份额占比第一。混合云市场,2014年,IBM以综合的IT能力,收入70亿夺魁。云计算喊了这么多年,不知不觉已经变成了几十亿美元的大生意。云计算时代真的来了!
AWS的财报可以看看下面的图解:
<!--[endif]-->
今天不是来说AWS的,说说大数据怎么上云的一些思考:
1、首先说说,大数据和云的关系,云是一种网络形态的概念,是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。云计算(Cloud Computing)是分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)、热备份冗余(High Available)等传统计算机和网络技术发展融合的产物。除了技术上的融合形态,更重要的体现了一种服务模式的一种融合和改变,对于云来说,大数据只是上面的一种服务,和其他的web服务,数据库服务没有区别。
2、I层(云的基础设施)现在业界最火的方案是OpenStack,OpenStack是一个由NASA(美国国家航空航天局)和Rackspace合作研发并发起的,以Apache许可证授权的自由软件和开放源代码项目。
OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,每个服务提供API以进行集成。
OpenStack云计算平台,帮助服务商和企业内部实现类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service, IaaS)。OpenStack 包含两个主要模块:Nova 和 Swift,前者是 NASA 开发的虚拟服务器部署和业务计算模块;后者是 Rackspace开发的分布式云存储模块,两者可以一起用,也可以分开单独用。OpenStack除了有 Rackspace 和 NASA 的大力支持外,还有包括 Dell、Citrix、 Cisco、 Canonical等重量级公司的贡献和支持,发展速度非常快。
在云环境中,Openstack解决了I层的问题,所有物理资源的管理和分配由I层来负责。
3、正是因为I层将资源和存储进行了虚拟化然后对上提供,大数据上云最大的两个问题是资源管理和数据存储。同时大数据又是重载的业务,对资源的需求非常高,因此需要大数据和openstack充分配合,大数据上云才能运行的好。
4、传统数据中心,大数据集群的资源管理和分配目前主要的方案是mesos/YARN。
<!--[endif]-->
从上图大家可以看出,Mesos/YARN来对物理资源直接进行管理,然后分配给上层的组件使用。 资源隔离方面,docker方案发展很快,所以又有YARN和kubernets结合的方案。PaaS作为一个服务直接架在YARN上。在没有直接I层能力的情况下,应该是非常合适的一种的过渡方案,但是如果YARN管理的不是直接的物理资源,而是I层虚拟出来的VM/docker之类,mesos/YARN和I层的能力就出现了一定的重合和冲突,这个时候mesos/YARN应该把VM/Docker级资源管理和分配的能力释放给I层,聚焦于job级资源的分配和调度。此时PaaS在架构在YARN/MESOS上就非常多余。
5、对于存储存在同样的问题,HDFS是对物理硬盘的直接抽象成对象存储,并提供3份冗余来保障数据的可靠性。云上的I层对存储通常也会抽象,并且进行一定的冗余,来动态分配给上层应用。HDFS直接架在I层上,就存在反复冗余的问题。同时大数据的核心是对数据的处理,数据存储的位置对性能起到非常关键的作用,多层反复虚拟化之后,数据存储的不确定性,性能损耗非常大。因此I层最好将物理硬盘直接提供出来给大数据服务可见,让用数据的人直接管理数据效率最高。
相关推荐
人工智能算法应用驱动的AI计算服务设计实践和思考 AI在顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 实时计算在银行的实践 智能风控在银行的实践 Impala在金融大数据场景中的应用 工业智能的“流”与“融...
AI计算服务设计实践和思考 AI在顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 实时计算在银行的实践 智能风控在银行的实践 金融大数据场景中的应用 工业智能的“流”与“融” 开源大数据平台TDengine在工业...
人工智能算法应用驱动的AI计算服务设计实践和思考 AI在HL顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 智能风控在银行的实践 工业智能的“流”与“融” 开源大数据平台TDengine在工业物联网领域的应用 ...
这一合作将涉及多个方面,包括智慧城市解决方案、企业上云、大数据云计算培训等。阿里云作为业界领先的技术提供者,将为浙数文化提供其核心的云计算技术能力;浙数文化则以自身的优势资源和业务经验,为行业云的建设...
综上所述,运营商网络建设的思考集中于如何通过云网融合,提供差异化、网络随选、弹性扩展和自助服务能力,以满足不同企业的共性化和个性化需求。这不仅需要技术的融合和创新,还需要运营商在市场策略上做出相应调整...
会议强调了企业服务的重要性,特别是随着云计算、大数据、人工智能、物联网和5G等新兴技术的崛起,企业服务正经历着深刻的变革。 一、中国企业服务的现状与挑战 1. 人力成本上涨:过去十年间,中国企业的人力成本...
代码即服务-让开发者快速上云 如何保证移动应用的稳定性 应用开发的云基础设施优化论坛: 海量订单系统优化实践 无影办公新体验与实现揭秘 云化时代的海量算力成本优化利器 云上资源自动化部署新模式 云网络端到端...
* 千万级用户直播 APP——服务端结构设计和思考 热门讲义 本资源文件收录了多篇热门讲义,涵盖了云计算、大数据、人工智能等领域的技术前沿和发展趋势,包括: * 飞天进化三部曲:阿里巴巴集团 CTO 张建锋的讲义...
云安全2.0,疫情之后的思考 在数字化转型和云计算的浪潮下,企业IT系统的重心逐渐转向云平台,而云计算环境所特有的弹性、敏捷性等优势使得企业能够更高效地应对市场变化,加速创新。然而,随着企业业务的“上云”...
全面上云要求企业内部IT团队从传统的运维角色转变为服务中心,从而更好地支撑企业数字化转型。 3. 云上新运维:随着全面上云战略的实施,运维工作也需要从传统的IT运维转向云上新基础设施运维。这意味着运维团队...
在行业咨询的层面,报告通过对过去三年的行业前瞻分析报告、在线课程和数字化转型案例的研究,与国内外的商学院、咨询公司和行业协会等机构深入合作,共同探讨产业数字化转型的方法论,并为企业高管提供思考和启发。...
企业数字化转型的四个转型方向是指企业数字化转型的四个转型方向,包括提升产品与服务策划、实施和优化过程数字化水平、打造差异化、场景化、智能化的数字产品和服务、推动跨企业集成互联与智能运营、建设大智能现场...
大数据海量任务调度和智能运维实践 虎牙直播AIOps探索与实践 华泰证券智能运维体系探索与实践 基于 AIOps 的大规模微服务轨迹数据分析 基于机器学习的数据库智能化运维 基于时序数据的AIOps实践 基于智能运维算法的...
在【企业云战略的三点思考】中,企业应同时考虑IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)三层架构。SaaS提供集成的ERP、HCM、CRM和社交管理系统;PaaS支持兼容和可移动的数据库与中间件;...
Microsoft 365 重塑企业智能办公体系.pdf', '知识产业流程自动化的技术跃迁.pdf', '行业上云实践和云上运维体系.pdf', '让数据产生价值,基于数据湖的大数据平台建设.pdf', '谈转型 - 微软数据与人工智能服务赋能...
实现从软件上云到硬件上云、从隐性数据显性化到隐性知识显性化、从数据流量红利到知识算法红利、从基于产品的分工到基于知识的分工、从单平台资源聚合到多平台立体化协作,是时代思考的重大命题。 过去一年是中国...
例如,云计算市场在2020年经历了爆发式增长,企业上云步伐加快,推动了AWS、阿里云、Azure等云服务提供商的业绩。网络安全领域同样受益,因为远程办公的安全需求推动了相关解决方案的需求。而在5G、人工智能等新兴...
文章最后提出了在推动工业APP产业应用与技术体系建设过程中所遇到的问题和思考,如工业互联网与传统工业体系的融合、工业APP如何实现商业价值开发等。这些是未来工业APP发展过程中需要重点关注和解决的问题。 总之...
展望未来,智慧城市将不断深化“联接+平台+数据+运营”的模式,利用大数据、人工智能、物联网、云计算等技术,推动经济结构和服务模式的创新,实现城市资源的优化配置。软件和算法的革新将重新定义生产方式,为城市...