下图是近来学习和用到的大数据方面的技术,现在做一个总结。并且在总结的过程中,也进行更加进一步的学习和了解。
以上为个人所接触到的大数据相关的一些技术,后续的章节将围绕这些技术展开,具体的介绍方式是从应用和原理两个方面进行。
1、大数据实时流架构
(1) 消息队列
消息队列是在不同的应用间做数据传递的,现在常用的主要包括Kafka,redis 队列,RabbitMQ,ZeroMQ,ActiveMQ 等。
(2)流式处理框架
流式处理框架主要是提供了一实时处理消息的计算框架,具体的实现是由业务方自己来写代码完成的。常见的有Storm、Spark Streaming、以及Flink。
(3) 存储
对于数据的存储,常规的关系型数据库(比如mysql、Oracle)也可以实现,但是对于大数据的存储,现在比较流行的比如是NoSql数据库,比如 Redis、MongoDB、HBase 这三种是最常用的。尤其对于Redis,很多大型公司都谁针对自己的业务场景对其进行封装,提供监控、报警和自动扩容等功能。
2、大数据离线流架构
(1)数据存储
目前大数据技术最常用的存储方式为:HDFS、Hive(基于HDFS)
(2)数据分析和处理工具
目前的数据分析处理工具主要是两个方向,MapReduce和Spark 。
MapReduce:常用的工具有原生Hadoop MapReduce,Hive SQL和Pig。其中Hadoop MapReduce是最基础的,HIve Sql和 pig都是对其进行的上层封装,就好像汇编语言是比较基础的编程语言,而C和Java是对其进行的上层封装,最终还要转成汇编一样的道理;
Spark 是目前最火的数据处理工具,没有之一。其与Hadoop相比,更大程度上利用了内存。
相关推荐
"大数据平台数据治理体系和大数据架构技术方案" 大数据平台数据治理体系是指在大数据平台中,对数据的管理、存储、处理和分析的总体架构和策略。它涵盖了数据的整个生命周期,从数据的采集、存储、处理到分析和应用...
7. **未来趋势**:展望大数据技术的未来发展方向,如云计算、人工智能与大数据的融合,以及边缘计算在大数据架构中的角色。 8. **技能提升**:提供学习路径和资源,帮助读者提升大数据相关的编程语言(如Java、...
本课程“2022最新版 大数据架构师课程”旨在深入探讨大数据技术栈中的关键组件,帮助学员提升到架构师的层次。以下是课程中涵盖的一些核心知识点: 1. **Kafka源码分析**:Kafka是一款高吞吐量、分布式的实时消息...
本书《大数据技术及架构图解实战派》是一本全面介绍大数据技术及架构的书籍,旨在帮助读者深入理解大数据技术的内涵、应用场景和实际应用。以下是本书的主要知识点: 一、 大数据技术的基本概念 * 大数据技术的...
综上所述,成为一位优秀的大数据架构师不仅需要掌握扎实的技术基础,还需要具备良好的问题解决能力和创新思维。通过不断学习最新的技术和工具,结合实际项目经验,才能在这个快速发展的领域中保持竞争力。
《大数据架构商业之路》这本书深入探讨了如何将大数据技术与商业实践相结合,为读者揭示了从业务需求出发,构建高效、可靠的大数据架构的过程。在大数据的领域中,Hadoop和流处理、批处理等技术扮演着至关重要的角色...
总的来说,重庆工业互联网行业中的大数据架构师是连接数据和技术、业务和分析的关键人物,他们的工作直接影响到企业的数据驱动战略和业务发展。具备扎实的技术基础、丰富的实践经验以及出色的沟通协作能力,将有助于...
在探讨《深入大数据架构师之路,问鼎40万年薪教学视频》这一资源时,我们可以从中提炼出几个关键的知识点,这些知识点对于想要进入或深耕大数据领域的技术人员来说至关重要。 ### 大数据概述 大数据是指无法用传统...
大数据架构面试题的知识点涉及了数据治理、数据仓库、数据架构和数据分析等领域,涵盖了数据处理技术、大数据架构设计方法论、大数据存储及并行处理、大数据资源及安全管理等多个方面。接下来,我们将对每个部分的...
《大数据架构商业之路从业务需求到技术方案》
【大数据架构和模式】是IBM资深架构师对大数据领域深入探讨的主题,主要涵盖了大数据的分类、架构设计以及数据服务模式的解析。大数据架构是处理海量数据的关键,它涉及到数据的存储、获取、处理和分析等多个环节。...
《美团点评技术团队-餐饮生态大数据架构实践》的文件揭示了美团在餐饮行业中如何利用大数据技术来提升业务效率和决策质量。在这个过程中,美团构建了一套高效、灵活的大数据架构,旨在解决业务问题,最大化数据的...
决策与控制应用是大数据架构的最终目标,即根据数据分析的结果来指导实际生产活动。这一过程通常涉及到预测分析、实时控制以及自动化决策等技术的应用,它要求数据能够快速准确地反馈到控制系统,从而实现对生产过程...
**大数据架构**是指为了处理大量数据而设计的一系列技术和框架的集合。随着互联网的发展,每天产生的数据量呈指数级增长,传统的数据处理方法已无法满足现代企业的需求。因此,构建高效、可扩展的大数据平台成为了...
大数据参考架构围绕代表大数据价值链的信息价值链(水平轴)和IT价值链(垂直轴)两个维度组织展开。信息价值链表示大数据的应用理论作为一种数据科学方法,从数据到知识的处理过程中所实现的信息价值,其核心价值...
总的来说,京东的大数据架构构建是一个需求驱动、技术支撑的过程,涉及到业务理解、架构设计、ETL流程、技术选型等多个方面。通过不断迭代和优化,京东成功地利用大数据提升了运营效率,实现了智能化决策,为我们...
1、云时代大数据的特点 2、大数据带来哪些技术变革 3、华为大数据架构和具体实践
地理影像大数据技术架构及实践.ppt地理影像大数据技术架构及实践.ppt地理影像大数据技术架构及实践.ppt地理影像大数据技术架构及实践.ppt地理影像大数据技术架构及实践.ppt
大数据架构规划课件是为帮助学员了解大数据架构规划的基础知识,掌握大数据架构设计的基本概念和方法,为从事大数据相关领域的工作打下坚实的基础。本课程涵盖了大数据架构的基本概念、特点和设计原则,大数据架构的...
菜鸟物流大数据技术架构 在本资源中,我们将深入讨论菜鸟物流大数据技术架构的技术创新和演进,包括从离线计算到实时计算、物流大数据案例:物流订单全链路追踪、双十一物流大数据计算的挑战和应对等。 随着数据和...