`
jiezhu2007
  • 浏览: 245472 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
博客专栏
Cfa1f850-3fc3-3a36-9cd8-c3415c9610c6
hadoop技术学习
浏览量:144164
Group-logo
大数据产业分析
浏览量:2980
社区版块
存档分类
最新评论

大数据服务上云的思考

阅读更多

最近看到亚马逊第一次单独公布AWS财报,一年营收57亿美元,市场份额占比第一。混合云市场,2014年,IBM以综合的IT能力,收入70亿夺魁。云计算喊了这么多年,不知不觉已经变成了几十亿美元的大生意。云计算时代真的来了!

AWS的财报可以看看下面的图解:



<!--[endif]-->

今天不是来说AWS的,说说大数据怎么上云的一些思考:

1、首先说说,大数据和云的关系,云是一种网络形态的概念,是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。云计算Cloud Computing)是分布式计算Distributed Computing)、并行计算Parallel Computing)、效用计算Utility Computing)、网络存储Network Storage Technologies)、虚拟化Virtualization)、负载均衡Load Balance)、热备份冗余High Available)等传统计算机网络技术发展融合的产物。除了技术上的融合形态,更重要的体现了一种服务模式的一种融合和改变,对于云来说,大数据只是上面的一种服务,和其他的web服务,数据库服务没有区别。

2I层(云的基础设施)现在业界最火的方案是OpenStackOpenStack是一个由NASA美国国家航空航天局)和Rackspace合作研发并发起的,以Apache许可证授权的自由软件开放源代码项目。

OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,每个服务提供API以进行集成。

OpenStack云计算平台,帮助服务商和企业内部实现类似于 Amazon EC2 S3 的云基础架构服务(Infrastructure as a Service, IaaS)OpenStack 包含两个主要模块:Nova Swift,前者是 NASA 开发的虚拟服务器部署和业务计算模块;后者是 Rackspace开发的分布式云存储模块,两者可以一起用,也可以分开单独用。OpenStack除了有 Rackspace NASA 的大力支持外,还有包括 DellCitrix Cisco Canonical等重量级公司的贡献和支持,发展速度非常快。

在云环境中,Openstack解决了I层的问题,所有物理资源的管理和分配由I层来负责。

3正是因为I层将资源和存储进行了虚拟化然后对上提供,大数据上云最大的两个问题是资源管理和数据存储。同时大数据又是重载的业务,对资源的需求非常高,因此需要大数据和openstack充分配合,大数据上云才能运行的好。

4、传统数据中心,大数据集群的资源管理和分配目前主要的方案是mesos/YARN



 
<!--[endif]-->

从上图大家可以看出,Mesos/YARN来对物理资源直接进行管理,然后分配给上层的组件使用。 资源隔离方面,docker方案发展很快,所以又有YARNkubernets结合的方案。PaaS作为一个服务直接架在YARN上。在没有直接I层能力的情况下,应该是非常合适的一种的过渡方案,但是如果YARN管理的不是直接的物理资源,而是I层虚拟出来的VM/docker之类,mesos/YARNI层的能力就出现了一定的重合和冲突,这个时候mesos/YARN应该把VM/Docker级资源管理和分配的能力释放给I层,聚焦于job级资源的分配和调度。此时PaaS在架构在YARN/MESOS上就非常多余。

5、对于存储存在同样的问题,HDFS是对物理硬盘的直接抽象成对象存储,并提供3份冗余来保障数据的可靠性。云上的I层对存储通常也会抽象,并且进行一定的冗余,来动态分配给上层应用。HDFS直接架在I层上,就存在反复冗余的问题。同时大数据的核心是对数据的处理,数据存储的位置对性能起到非常关键的作用,多层反复虚拟化之后,数据存储的不确定性,性能损耗非常大。因此I层最好将物理硬盘直接提供出来给大数据服务可见,让用数据的人直接管理数据效率最高。

 

 

  • 大小: 813.7 KB
  • 大小: 108.6 KB
0
0
分享到:
评论

相关推荐

    DataFunSummit 2021大数据计算架构峰会PPT合集(33份).zip

    人工智能算法应用驱动的AI计算服务设计实践和思考 AI在顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 实时计算在银行的实践 智能风控在银行的实践 Impala在金融大数据场景中的应用 工业智能的“流”与“融...

    2021大数据计算(边缘计算+实时计算+计算架构等)资料合集-共34份.zip

    AI计算服务设计实践和思考 AI在顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 实时计算在银行的实践 智能风控在银行的实践 金融大数据场景中的应用 工业智能的“流”与“融” 开源大数据平台TDengine在工业...

    DataFunSummit:2021年大数据计算架构峰会PPT合集(34份).zip

    人工智能算法应用驱动的AI计算服务设计实践和思考 AI在HL顺风车场景的应用实践 KPU计算架构在券商场景的应用实践 智能风控在银行的实践 工业智能的“流”与“融” 开源大数据平台TDengine在工业物联网领域的应用 ...

    浙数文化携手阿里云拓展云计算服务.pdf

    这一合作将涉及多个方面,包括智慧城市解决方案、企业上云、大数据云计算培训等。阿里云作为业界领先的技术提供者,将为浙数文化提供其核心的云计算技术能力;浙数文化则以自身的优势资源和业务经验,为行业云的建设...

    T12_面向云网融合业务的运营商网络建设思考_.pdf

    综上所述,运营商网络建设的思考集中于如何通过云网融合,提供差异化、网络随选、弹性扩展和自助服务能力,以满足不同企业的共性化和个性化需求。这不仅需要技术的融合和创新,还需要运营商在市场策略上做出相应调整...

    2019云栖大会关于中国企业的一些思考.pdf

    会议强调了企业服务的重要性,特别是随着云计算、大数据、人工智能、物联网和5G等新兴技术的崛起,企业服务正经历着深刻的变革。 一、中国企业服务的现状与挑战 1. 人力成本上涨:过去十年间,中国企业的人力成本...

    2021阿里云开发者大会演讲PPT汇总.zip

    代码即服务-让开发者快速上云 如何保证移动应用的稳定性 应用开发的云基础设施优化论坛: 海量订单系统优化实践 无影办公新体验与实现揭秘 云化时代的海量算力成本优化利器 云上资源自动化部署新模式 云网络端到端...

    藏经阁-8月云栖精选.pdf

    * 千万级用户直播 APP——服务端结构设计和思考 热门讲义 本资源文件收录了多篇热门讲义,涵盖了云计算、大数据、人工智能等领域的技术前沿和发展趋势,包括: * 飞天进化三部曲:阿里巴巴集团 CTO 张建锋的讲义...

    瑞和云图周东:云安全2.0,疫情之后的思考.pdf

    云安全2.0,疫情之后的思考 在数字化转型和云计算的浪潮下,企业IT系统的重心逐渐转向云平台,而云计算环境所特有的弹性、敏捷性等优势使得企业能够更高效地应对市场变化,加速创新。然而,随着企业业务的“上云”...

    云上加速,迎接中国互联网新周期精品报告2020.pdf

    全面上云要求企业内部IT团队从传统的运维角色转变为服务中心,从而更好地支撑企业数字化转型。 3. 云上新运维:随着全面上云战略的实施,运维工作也需要从传统的IT运维转向云上新基础设施运维。这意味着运维团队...

    阿里云&intel-《云上加速,解读中国互联网新周期》-2020.10-44页精品报告2020.pdf

    在行业咨询的层面,报告通过对过去三年的行业前瞻分析报告、在线课程和数字化转型案例的研究,与国内外的商学院、咨询公司和行业协会等机构深入合作,共同探讨产业数字化转型的方法论,并为企业高管提供思考和启发。...

    企业数字化转型架构设计、建设路径与应用场景解决方案(PPT).pptx

    企业数字化转型的四个转型方向是指企业数字化转型的四个转型方向,包括提升产品与服务策划、实施和优化过程数字化水平、打造差异化、场景化、智能化的数字产品和服务、推动跨企业集成互联与智能运营、建设大智能现场...

    【重磅】最新AIOps智能运维实践方案资料大合集(62份).zip

    大数据海量任务调度和智能运维实践 虎牙直播AIOps探索与实践 华泰证券智能运维体系探索与实践 基于 AIOps 的大规模微服务轨迹数据分析 基于机器学习的数据库智能化运维 基于时序数据的AIOps实践 基于智能运维算法的...

    企业数字化云转型必由之路 V2.pptx

    在【企业云战略的三点思考】中,企业应同时考虑IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)三层架构。SaaS提供集成的ERP、HCM、CRM和社交管理系统;PaaS支持兼容和可移动的数据库与中间件;...

    2020微软在线技术峰会PPT汇总(48份).zip

    Microsoft 365 重塑企业智能办公体系.pdf', '知识产业流程自动化的技术跃迁.pdf', '行业上云实践和云上运维体系.pdf', '让数据产生价值,基于数据湖的大数据平台建设.pdf', '谈转型 - 微软数据与人工智能服务赋能...

    新一代工业互联网发展模式与成功实践:数据驱动的新价值网络.pdf

    实现从软件上云到硬件上云、从隐性数据显性化到隐性知识显性化、从数据流量红利到知识算法红利、从基于产品的分工到基于知识的分工、从单平台资源聚合到多平台立体化协作,是时代思考的重大命题。 过去一年是中国...

    计算机行业周报-2020年报&2021年一季报总结:业绩逐步修复,强者恒强趋势凸显.zip

    例如,云计算市场在2020年经历了爆发式增长,企业上云步伐加快,推动了AWS、阿里云、Azure等云服务提供商的业绩。网络安全领域同样受益,因为远程办公的安全需求推动了相关解决方案的需求。而在5G、人工智能等新兴...

    工业 APP产业应用与技术体系.pdf

    文章最后提出了在推动工业APP产业应用与技术体系建设过程中所遇到的问题和思考,如工业互联网与传统工业体系的融合、工业APP如何实现商业价值开发等。这些是未来工业APP发展过程中需要重点关注和解决的问题。 总之...

    --信息中心-全光智慧城市白皮书(2020)-2020.11-29页精品报告2020.pdf

    展望未来,智慧城市将不断深化“联接+平台+数据+运营”的模式,利用大数据、人工智能、物联网、云计算等技术,推动经济结构和服务模式的创新,实现城市资源的优化配置。软件和算法的革新将重新定义生产方式,为城市...

    信息安全_数据安全_Automating Cloud Security Monitoring at Scale.pdf

    随着大数据时代的到来,数据安全问题变得尤为突出,因为大数据环境下数据量巨大、种类繁多、增长迅速,给安全防护带来了前所未有的挑战。 工业网络的安全性也是本文件关注的重点之一。工业网络通常是指在工业控制...

Global site tag (gtag.js) - Google Analytics