数据分析是一个被广泛使用的技能标签。在真实工作环境下,至少有三个类型的职位可以算作和数据分析师相关,分别是:BI (Business Intelligence), QA (Quantitative Analyst / Data Scientist), 以及BA (Business Analyst)。
a) BA首先定义业务的度量方式,比如付费用户还是活跃用户,1天日活重要还是30天日活重要。然后收集数据进行各维度的分析,比如地域、渠道、用户行为等等。
b) 基于QA在BA分析的基础上,搭建分析模型,里面可能用到各种统计、优化、机器学习方法。模型经过A/B测试、稳定性等评估,预计带来的影响。
c) BI负责将BA和QA定义的所有用户度量,市场趋势,模型表现等通过数据库和SQL完成自动计算、定期自动更新及可视化展现,成为部门每天都会关注的核心数据。
由此大家可以看出,BA/ QA/ BI之间是各有侧重的: Business Analyst 定义问题,分析数据,提出并部分实现解决方案; Quantitative Analyst 定义模型和架构,实现完整的解决方案; Business Intelligence 对数据和度量进行可视化展示、自动化计算和更新。
各自需要什么能力?
回到基础,无论是BI、QA、BA都需要基本的数据分析技能,不同的是后续的技术和业务侧重略有不同,下面提供一份数据分析的进阶路线。
数据分析学习路线
1、Excel
Excel一般人都有接触过,重点是了解各种函数,如sum,count,sumif, countif,find,if,left/right,时间转换等;但函数不需要学全,掌握一些最常用的的,其它在用到的时候随搜随用就行。另外vlookup和数据透视表是两个性价比很高的技巧,这两个搞定后,一般10万条以内的数据统计基本没什么难度了。
2、数据可视化
数据分析界有一句经典名言,字不如表,表不如图。数据分析的最终都是要兜售自己的观点和结论的,兜售的最好方式就是做出观点清晰数据详实的PPT给老板看。
虽然Excel也可以完成很多的数据可视化功能,但是如果想要得到更专业的可视化效果,还是建议学些编程方面的知识。
这里推荐微软的Power BI(商业智能)和帆软的FineBI。BI和图表的区别在于BI擅长交互和报表,适合解释已经发生和正在发生的数据。Power BI适合个人学习,FineBI适合企业级的应用。
3、数据库
Excel对十万条以内的数据处理起来没有问题,但是互联网行业就是不缺数据。但凡产品有一点规模,数据都是百万起,这时候就需要学习数据库。SQL是数据分析的核心技能之一,从Excel到SQL绝对是数据处理效率的一大进步。
除了最基本的增删改查、索引、约束外,主要了解where,group by,order by,having, like,count,sum, min,max, distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。如果想要跟进一步,可以学习row_number,substr,convert,contact等。再有点追求,就去了解Explain优化,了解SQL的工作原理,了解数据类型和IO。
4、R/Python语言
是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘,爬虫,可视化报表都需要用到编程能力。而数据分析领域推荐使用的两种语言绝对是R和Python了,二者在数据分析领域的地位可以说是旗鼓相当,各有优势。
R的优点是统计学家编写的,如果是各类统计函数的调用,绘图,分析的前验性论证,R无疑有优势。学习R,需要了解数据结构(matrix,array,data.frame,list等)、数据读取,图形绘制(ggplot2)、数据操作、统计函数(mean,median,sd,var,scale等);开发环境建议使用Rstudio。
Python则是万能的胶水语言,适用性强,有很多分支,我们专注数据分析这块。需要了解调用包、函数、数据类型(list,tuple,dict),条件判断,迭代等;开发环境建议Anaconda。
5、统计知识
统计学是数据分析的基础。需要花一些时间掌握描述性统计知识,包括:均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念。
6、分析思维
好的数据分析首先要有结构化的思维,也就是我们俗称的金字塔思维。思维导图是必备的工具;之后再了解SMART、5W2H、SWOT、4P理论、六顶思考帽等框架。分析也是有框架和方法论的,主要围绕三个要点展开:
1)一个业务没有指标,则不能增长和分析;
2)好的指标应该是比率或比例;
3)好的分析应该对比或关联。
7、业务知识(用户行为、产品、运营)
对于数据分析师来说,业务其实比了解数据方法论更重要。但很遗憾,业务学习没有捷径,必须靠在某个行业一点点积累。
相关推荐
在分析给定文件的内容时,我们可以提取出几个关键知识点,包括数据科学、数据工程和数据分析的知识体系构建以及相关的培训实践。 首先,文档中提到的三个领域:数据科学、数据工程和数据分析,它们在现代信息技术和...
* 运营人员、产品经理想转数据分析获得更高薪资和发展空间 * 在校生或者毕业不久的本科生/研究生,未来想要从事数据分析工作 * 非科班出身,如机械、土木、生物等专业学生,想转行到数据分析行业 * 数据分析从业者,...
数据科学涉及多个领域,包括数据工程、数据分析以及数据科学本身。在这些领域中,不同角色扮演着不同的职责: 1. 数据科学家(主厨):负责关键的实验设计,深入理解数据,并构建核心模型。他们需要具备创新思维,...
数据科学知识体系构建和培训实践是现代企业中至关重要的任务,尤其在科技领域。BitTiger,一家成立于2015年的在线教育平台,致力于提供科技领域的终身学习服务,已经为数十万学员提供了高效的学习路径,并建立了北美...
- 跨学科技能,如数据分析、机器学习等将成为新的增长点。 #### 第二章:软件开发流程与方法论 - **敏捷开发**: - 核心理念:强调个体互动、可工作的软件高于详尽文档。 - 实践方法:SCRUM、XP、Kanban等。 -...
Python中的数据分析库如Pandas和NumPy,以及科学计算库SciPy和Matplotlib,对于处理和可视化数据至关重要。此外,机器学习库如Scikit-Learn和深度学习库TensorFlow、Keras将帮助你实践各种AI模型。 数学是理解并...
- **学习JavaScript数据结构与算法**:通过JavaScript学习数据结构(如数组、链表、栈、队列、树等)和算法(排序、搜索等),提升编程思维和解决问题的能力。 - **Head First JavaScript程序设计**:以轻松易懂的...
首先,汽车行业整体分析中提到了行业的分化加剧,整车行业分化严重,而零部件行业则有四条进阶路线。这些信息提示了汽车行业内部竞争的激烈程度以及零部件行业多元化的发展路径。 接着,报告着重分析了汽车行业盈利...
Java是一种广泛使用的高级编程语言,尤其在企业级应用、Web开发和大数据处理领域有着重要的地位。本学习路线针对想要深入Java...通过系统的学习和实践,你将能够熟练掌握Java编程,具备从事Web开发或大数据分析的能力。
5. 零部件市场分析:报告提到零部件市场有四条进阶路线。这些路线可能包括技术创新、供应链优化、成本控制、以及与整车厂商的协同合作。零部件市场的分析需要关注材料成本变化、产能周期、价格波动以及宏观政策和...
9. **Hadoop 生态体系**:深入学习 Hadoop 生态中的 Hive、HBase、Zookeeper 和 Elasticsearch 等组件,以及大数据分析引擎 Impala。推荐《Hadoop 权威指南:大数据的存储与分析(第 4 版)》、《Hive 编程指南》、...
其次,构建阶梯式的实验体系,确保各个实验项目之间具有连贯性和进阶性。实验项目应从基础操作开始,逐步过渡到高级的实验设计,使学生在不断挑战中提升实验技能。同时,减少验证性实验的比例,增加设计性、探索性...
通过实施这一教学改革,并进行成绩分析,作者证明了逆向教学设计能够有效提升学生实践创新能力和工程教育人才培养质量。 《基于工程认证的数据结构实践逆向教学设计》一文深入探讨了数据结构课程的培养目标,指出该...
Oracle课程讲解资源包含了一系列关于Oracle数据库管理系统的详细教学内容,非常适合初学者和进阶学习者。...无论你是软件开发者、DBA还是数据分析人员,这门课程都将为你提供坚实的Oracle技能基础。
第六阶段是成为一个全面的开发者,关注领域包括但不限于数据分析、机器学习和人工智能。Python的库如Numpy、Pandas、Scikit-learn和TensorFlow等在这些领域有着强大的支持。学习并应用这些工具,可以使你在数据驱动...
"java程序员等级图"具体列出了Java开发者从入门到精通的技能进阶路线,包括基本语法、面向对象编程、异常处理、多线程、集合框架、I/O流、网络编程、JVM原理、Spring框架等。随着等级的提高,开发者需要掌握更复杂的...
- **Hive SQL查询**:掌握使用HQL(Hive Query Language)进行复杂的数据查询和分析的能力。 #### 八、分布式存储系统HBase - **HBase表结构设计**:学习如何合理设计HBase中的表结构以满足不同的业务需求。 - **...
### 嵌入式学习路线图详解 #### 一、为何选择嵌入式? 嵌入式系统被视为IT领域的前沿技术之一,它具有广阔的应用前景和发展潜力。随着物联网、智能设备等新兴技术的发展,嵌入式系统的需求持续增长,使得该领域...