前几天和一朋友A聊天,一个在我看来完全可以在大部分行业领域公司独当一面的数据分析师,目前仍谦虚的以“数据猿”自称。从事数据分析的他,半路出家,起初虽然懂一些数据库的知识,但仍然和很多人一样,艰难地上了路。于是我们就索性一起讨讨经,“一本正经”地聊起工作来,留下点感悟。
数据分析如何起步?
说入门很简单一定是骗你的,A说自己是从记数据开始的,记数据一方面是为了应付领导的提问,另一方面也是在培养数据的敏感度。确实,分析的源头一般是某些指标有了明显的变动,熟悉每天的交易数据或用户数据能让你一眼就看出问题在哪里,哪些数据有关联,然后再做分析。而我是从Excel做起的,大部分时间都是在取数,做“表哥”,还要抵挡来自业务的需求攻击。后来,他去做了数据挖掘,我从BI再从数据平台转做了技术。
万事开头难,但一旦数据分析有了动力,就要开始完善自己的知识体系,这也是真正入门的开端。那如何完善数据分析的知识体系?
1、基本的计算机知识和统计知识
数据库+SQL语言
一些常用的数据库如Oracle、SQL Sever、DB2、MySQL,这些数据库或者说日常接触的数据库都要有所了解,懂最常用的就好,最重要的还是要会写SQL。
数学/统计学知识
一些基本的数学统计方法如描述性统计、多元统计分析、回归分析等,重要性不言而喻。
数据挖掘知识:方差分析、回归分析、因子分析、聚类分析等等。这些东西作为入门多多少少都要会一些,虽然有可能不会全用到,但一旦用时方恨少。
数据分析可视工具
数据分析可视化工具很宽泛。首推Excel,中小公司很依赖,熟练使用数据透视表,这是必备技能。中大型公司都是用报表工具或者BI来做报表,但有了SQL+Excel的基础,这些工具上手都很快。
2、业务知识
数据分析师要与公司的各业务打交道,所以对于各部门的业务知识要有深入的了解。某业务领导需要知道某个指标,你需要知道这个指标由哪些数据构成?数据统计的口径是什么?数据怎么取出来?这个指标对于行业的意义是什么,处于什么范围分别对应什么样的情况,是好还是坏。然后慢慢摸索这个指标层面多维度的规律,如何设定最合理。
明确自己的位置,快速成长
附上网上的一张数据分析师能力体系图,用于参考。
数据分析是一向比较专业的工作,要时刻警惕自己能力是否有提升,目前是什么样的水平,习惯反思自己:
这里引用知乎上@任明远的回答
1、你了解你所整理的数据的来源吗?是自己公司的业务数据,还是与合作伙伴交换的数据?是自己公司相关部门采集的,还是从第三方获取的?获取过程中,具体的指标和逻辑是什么?
2、这些数据是真实的吗?采集和整理过程中会不会出现什么问题?技术上的逻辑和业务上的逻辑是不同的概念,有没有技术上没有瑕疵,但并不符合业务逻辑的数据流程?
3、到你手里的数据经过了什么处理?你又做了什么处理?为什么他们和你要做这些处理?
4、谁需要你的数据?你处理后的数据流向哪里?他们用数据做什么?这些数据最终又拿去做了什么?比如,为客户做了什么服务,公司发布了什么内容,或向管理层证明了什么KPI,或支持了哪个部门的评估?
5、你做整理的周期是什么?为什么是这样的周期?
6、公司有其他的部门在处理其他的数据吗?是什么样的数据?和你有什么关系?为什么这些数据要分开处理?
7、近一年,你自己的电脑上应该已经积累了不少数据,试试做个分析,从一段较长的时间来看,你负责的这一块数据发生了什么变化?为什么会有这个变化?和公司的产品、经营、业务有关,还是和行业有关?具体怎么有关?
如何进一步提升?
业务上
1.业务为核心,数据为王
-
了解整个产业链的结构
-
制定好业务的发展规划
-
了解衡量的核心指标
-
有了数据必须和业务结合才有效果
需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。
2.思考指标现状,发现多维规律
-
熟悉产品框架,全面定义每个指标的运营现状对
-
比同行业指标,挖掘隐藏的提升空间
-
拆解关键指标,合理设置运营方法来观察效果
-
争对核心用户,单独进行产品用研与需求挖掘
业务的分析大多是定性的,需要培养一种客观的感觉意识。定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。
3.规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。
技能上
1.Excel是否精钻?
除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你需要更懂数据库
常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。
3.掌握数据整理、可视化和报表制作
数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
相关推荐
数据分析师的进阶之路是一个循序渐进的学习过程,涵盖了从基础工具的熟练掌握到高级分析技巧的探索。以下是对这个过程的详细说明...通过持续学习和实践,数据分析师能够不断提升自己的专业素养,逐步成长为业界的专家。
总的来说,这个资源包为你提供了一个全面的进阶学习路径,通过系统的训练和实践,你将能够更高效地处理和分析数据,进行复杂的数据可视化,从而在大数据时代更好地应对挑战,成为一名专业的数据分析师。无论你是初学...
本篇将深入探讨数据分析师如何通过Python来提升自己的技能,并以爱数圈的Python数据挖掘学习小组为例,阐述学习路径和关键知识点。 首先,Python的数据预处理能力是其在数据科学领域广泛应用的一大原因。预处理包括...
此外,持续的实践和项目经验对于数据分析师的成长至关重要,课程可能提供一些实战项目,让学习者亲手操练,巩固所学。 总之,《数据分析师视频教程2020大数据挖掘R语言python3人工智能课程》是一份全面的学习资料,...
数据分析是现代商业决策的重要组成部分,尤其对于新手来说,理解并掌握基础和进阶的数据分析技巧是至关重要的。本篇将深入探讨“数据分析”的定义、流程...通过不断学习和实践,可以从菜鸟逐步成长为熟练的数据分析师。
《开发进阶(软件架构师)》是一本旨在引导程序员逐步成长为软件架构师的专业书籍。它深入探讨了软件开发过程中的关键概念和技术,为读者提供了一个全面的学习路径,以提升其在软件工程领域的专业素养。 面向对象的...
② 对于已经具有一定经验的数据分析师,则可以通过实践练习来提升自身的项目管理和解决实际问题的能力。 阅读建议:建议将文档提供的链接和书籍逐一浏览并实操,同时积极参与Kaggle项目和社区讨论,以加速个人技能的...
《Pandas数据分析实战案例》是针对初学者的一份宝贵资源,旨在通过实例教学,帮助学习者掌握Pandas库在实际数据分析中的...在实战中遇到问题不要怕,多查阅文档,多思考解决方案,你将快速成长为一名出色的数据分析师。
课程中的案例分析和实战演练将帮助学员更好地将所学应用于实际工作场景,从而逐步成长为一名优秀的架构师。课程中包含的"架构师进阶训练营课程.jpg"可能是一个课程大纲或者部分课程内容的概览,用于辅助教学和学习。
《架构师从入门到精通》是一本面向那些渴望在IT领域深入理解架构设计与实践的初学者和进阶者的书籍。这本书旨在帮助读者系统性地掌握架构设计的基本概念、原则和方法,从而能够应对复杂软件系统的挑战。通过阅读本书...
在大数据的学习过程中,掌握有效的数据来源至关重要。"多个大数据学习模拟数据集地址"这个主题提供了丰富的资源,旨在帮助个人在不涉及...记得结合理论知识与实际操作,逐步成长为一名熟练的数据分析师或数据科学家。
总之,SQL是现代数据工作中的必备技能,无论你是数据分析、开发人员还是业务分析师,都能从中受益。通过这份学习资料,你将能够系统地掌握SQL基础,从而在数据世界中游刃有余。不断练习,逐步提高,相信你很快就能从...
### Java高级架构进阶学习知识点概述 #### 一、思维导图 ...综上所述,本套资料不仅涵盖了Java高级架构师必备的知识体系,还提供了丰富的实战经验和案例分析,对于想要成长为资深架构师的学习者来说极具价值。
总的来说,"datacamp-data-analyst-with-python"课程旨在提供一个全面的学习路径,帮助你从Python新手成长为能够运用Python进行数据处理、分析和可视化的专业数据分析师。虽然这个资源可能不是最新的,但它包含的...
这份名为"Android工程师成长之路:JAVA算法的实现,数据结构 和 Android源码笔记等 分享.zip"的压缩包资源,很显然是为帮助开发者提升技能而准备的。 首先,让我们深入探讨Java算法的实现。算法是编程的灵魂,Java...
R语言是一种用于统计分析、图形表示和报告的编程语言和软件环境,其基于S语言发展而来。R语言广泛用于数据分析和统计领域,尤其受到数据...通过学习R语言的基础知识和进阶技能,初学者可以逐步成长为熟练的数据分析师。
数据科学涉及多个领域,包括数据工程、数据分析以及数据科学本身。在这些领域中,不同角色扮演着不同的职责: 1. 数据科学家(主厨):负责关键的实验设计,深入理解数据,并构建核心模型。他们需要具备创新思维,...
在【描述】中提到的“架构师成长规划”是指架构师的职业生涯路径,这通常包括从初级程序员开始,逐步发展为系统分析师、技术主管,直至架构师。在这个过程中,不仅需要扎实的编程基础,还需要对业务需求的理解、技术...