1 SQL娴熟,这体现在ETL的hive阶段,自定义函数,分析函数,SQL各种关联写 (类dba倾向)
2 hive SQL优化要懂
3 mr流程要很熟悉, MR 优化,配置要知道,这在hive sql优化上有帮助,甚至有的hive写法很消耗效率,
启动多个mr的时候,
能自定义mr 来替代
4 大数据的ETL流程架构结合(mr hive hbase)
大数据的流处理结构结合(flume kafka storm hbase)
5 spark 替代方案
6 数据完整性, 这里是指 从关系库oracle等到 hadoop系统后,
你处理的数据个数要两者保证一致, 比如前者5000W 到后者 4900W
你在大数据业务下处理后的数据结果要和业务要求匹配对,比如前者期待结果为 15元 后者结果为14元
7 Linux运维能力,这里为啥提这一点,在配合运维同事测试的时候,对问题的定位,这种对hadoop的熟悉
linux的熟悉程度,决定了你处理问题的速率, 也间接决定了你的威信,价值。
这个过程需要很多硬功的积累,注定要很多压力,纠结, 且行且努力吧。
相关推荐
大数据,作为一种技术进步的产物,已经深深地改变了我们的生活和工作方式。这个概念指的是那些超过传统数据库处理能力的海量数据,其规模、复杂性和生成速度都远超以往。大数据的崛起与互联网、移动互联网、传感器、...
大数据审计心得体会范文.doc
电信行业数据挖掘与大数据心得体会.pptx
"大数据心得体会" 大数据心得体会是指在大数据时代背景下,对信息和数据的理解和应用。信息是指高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称。数据是指描述事物的符号记录,是可定义为...
读大数据时代心得体会.pdf
"大数据心得体会.pdf" 大数据是指那些超过传统数据库系统处理能力的数据。它的数据规模和传输速度要求很高,或者其结构不适合原来的数据库系统。为获得大数据中的价值,我们必须选择另一种方式来处理它。数据中隐藏...
【dbe财务大数据课程心得】 大数据,作为现代信息技术的焦点,已经在各行各业中发挥着越来越重要的作用,特别是在财务领域。秦永彬博士的讲座深入浅出地揭示了大数据的概念及其对现代社会的影响。大数据,顾名思义...
在参加完大数据培训后,我对这个领域有了更深入的理解和一些个人的心得体会。 首先,大数据的核心在于其定义:巨量资料。这不仅仅是数据量的增加,而是数据的爆炸式增长,使得传统的数据处理方式无法应对。这些数据...
夏明武电信行业数据挖掘与大数据心得体会39.pptx
【标题】:“dbe财务大数据课程心得.pdf” 【主要内容解析】: 本文主要围绕“dbe财务大数据课程”的学习心得展开,探讨了大数据在当前信息化社会中的重要性及其对企业决策、商业模式和生活方式产生的深远影响。...
在阅读《大数据》一书后,我们可以从中提炼出一些关于大数据技术应用和商务智能流程的深刻体会。首先,大数据体量的庞大和实时采集的特点,对于数据采集器而言,它们不断从新闻、论坛、博客、微博等各类网络平台实时...
【大数据技术概述】 大数据是指那些在传统数据处理技术下难以有效捕获、存储、管理和分析的海量、高增长速度和多样化的信息资产。随着互联网、移动设备和物联网的快速发展,数据量呈现指数级增长,大数据技术...
【大数据的概述】 大数据,作为一个概念,指的是那些超出传统数据库管理系统处理能力的大量、高速、多样化的信息资产。这些数据的规模、复杂性和增长速度都远超以往,且往往具有非结构化的特性。大数据的核心挑战...
### 大数据心得知识点概述 #### 一、大数据时代的背景与意义 - **时代背景**:随着信息技术的迅速发展,互联网、移动通信等技术的进步,数据量呈现出爆炸性增长的趋势。这种现象不仅体现在日常生活中的社交媒体、...
【大数据技术概述】 大数据,作为一个新兴的技术领域,指的是那些数据量巨大、增长速度快、结构复杂,超出传统数据库处理能力的数据集合。随着互联网、移动互联网、传感器网络、社交媒体、物联网和云计算的发展,...