请关注
微信公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要:
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。这是比较技术的定义,更偏向于分析本身。但数据分析更应该作为一种解决问题的方法论,指导和影响我们的工作,更有甚者,它可以引领未来。
正文:
作者:王鹏(沙咖)
数据分析大家很容易想到数理统计、图表、分析报告,但这只是分析的手段和结果的展现形式。数据分析其实是发现问题、分析问题和解决问题的过程。数据分析引领未来的这一面,本文不再赘述,这是数据分析人员修养能力,不是数据本身的问题。
在整个公司业务的各个环节,问题无处不在,如何发现问题,理解问题需要很深的商业头脑、业务理解。懂业务,了解商业是数据分析的核心,各种分析的方法论、分析技能只是解决商业问题的手段,所以数据分析能否做好,发现问题是最重要的,也通常是一些数据分析师忽略的。
发现问题首先要明确是哪个业务环节产生了问题,问题对整个业务有哪些影响,解决这些问题对整个业务的意义;其次,对这些问题进行归类和拆分,把问题拆分得越细,对问题理解也就越深,分析的效果也就越好,问题拆分的过程能够提供分析解决问题的方向;最后,根据拆分后的问题,列出数据需求清单(数据来源、数据口径、调研报告等等),作为发现问题和分析问题承上启下的重要一环,数据准备越充分,分析效果也自然越好。
分析问题可以粗略分为几步:1.数据收集;2.数据处理;3.数据分析。首先,根据数据需求清单,收集和整理相关的数据,日志、业务数据、调研报告等等,现在数据过载的时代,找到数据相对比较容易;其次,对这些数据进行加工处理,数据仓库是比较完美的数据处理方案,但也是成本最高的,有可借助的数据仓库最好,没有的话自己处理也不是很困难,这个过程其实就是数据到信息的过程,验证数据的可行性、数据清洗、数据的结构化、数据的口径归一;最后,利用处理好的数据,结合拆分的问题,确定分析的维度、指标和采用的分析技术和方法论,一层一层的分析问题即可。这几步结束后,基本上针对问题也会产生几个解决方案。
那么解决问题就是通过一些手段把这些解决方案输出,要么是图标报告,要么是决策支持,要么是一些数据分析的应用或产品。目的要么是解决现有问题,要么是找到未来的问题。
罗列一些数据分析的方法,结合上面说的和下面的方法,希望帮你引出自己的数据分析方法论。
发现问题的五种方法:
问题树:通过把一个核心问题拆分成一个个可操作的小问题。1.提供一个解决问题的整体框架,反应解决问题的完整度;2.小问题更具可操作性,优先级也便于识别,进而找到相应的责任人;3.各个问题之间的关系更明晰,上下游的影响比较可控,在团队合作方面便于达成共识。
鱼骨图:又称因果图。鱼头为核心问题,鱼刺是问题的关键要素。把影响问题的各个要素以鱼骨图的形式呈现,可以1.从整体上审视各个局部因素,直观识别问题和原因的关系;2.从各个侧面研究问题,确定优先级,保留关键要素、剔除非关键要素。
关键路径:对具有流程性的问题特别适合。找到问题的各个流程中的关键路径,这些路径的哪些点使问题扩大化、哪些点对问题的影响极小、哪些点是必不可少,但没有问题解决的空间。识别路径的现状,找到解决问题的突破口。
价值树:对可量化的问题特别适合。找到问题对应的关键指标,然后找到影响这个指标的业务点或者子问题和其对应的指标,反复迭代,最后找到叶子指标对应的问题,从这些问题去解决问题,一层一层往上解决就是了。
多因素评分法:对不可量化的问题特别适合。找到问题的几个主要因素,每个因素按标准评出一个相应的分数,然后根据待评工作总分确定相应的等级。
分析的方法
趋势+分布+对比分析:首先,从时间序列分析随时间的变化趋势,找出其规律;其次,通过集中趋势分析或离散趋势分析,看看数据的整体分布,了解业务数据是否稳定以及数据的集中度;最后,通过对比分析,看看数据的分布和稳定性在同期是否有变化,相关关系有多大。
异常分析:又称孤立点分析,孤立点可能是脏数据,也可能是与实际对应有意义的事件。从大量历史数据中找出太高、太低、变化幅度过大等异常情况数据,支持预警显示、预警提醒;并可进一步进行相关影响原因的数据挖掘
排名分析:从大量数据中找出按某种分类方法的Top N数据,这些数据代表了需要特别关注的程度
相关分析:研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度,分为单相关、复相关、偏相关
结构分析:在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构变化规律的分析方法
预测分析:利用决策树、回归分析、神经网络、时间序列等数据挖掘算法对客户响应、流失预警、收入预测、业务量预测等进行预测分析
还有很多发现问题、分析问题的方法与其对应的数理统计、数据挖掘等技能,这里不再赘述。本文只是想起到抛砖引玉的作用,大家一起探讨数据分析如何解决业务问题。
接下来结合领域和行业,看看怎么玩数据分析。
相关推荐
数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法论.md数据分析方法...
1. 理顺分析思路:数据分析方法论帮助数据分析师理顺分析思路,确保数据分析结构体系化,把问题分解成相关联的部分,并显示它们之间的关系。 2. 确保分析结果的有效性及正确性:数据分析方法论确保分析结果的有效性...
### 数据仓库方法论详解 #### 一、数据仓库建设的目标与意义 数据仓库的主要目标是从海量数据中提取有价值的信息,并将其转化为知识,为企业决策提供强有力的支持。数据仓库不仅仅是存储数据的地方,更是处理、...
- **数据分析方法论**:CRISP-DM(Cross Industry Standard Process for Data Mining)是广泛使用的数据挖掘项目生命周期方法论,分为六个阶段:业务理解、数据理解、数据准备、建模、模型评估和模型发布。...
《用户画像-方法论与工程化解决方案》是一本深度探讨用户画像系统构建的书籍,它从技术、产品和运营三个维度全面阐述了从无到有建立用户画像系统的关键技术和策略。书中涵盖了用户画像的理论体系、实操步骤、场景...
【企业大数据分析方法论】 大数据分析是现代企业决策制定的关键组成部分,它涉及到从海量数据中提取有价值信息,进而转化为知识,帮助企业制定战略和优化运营。本文主要探讨的是数据分析的框架、方法以及支撑工具,...
数据分析方法论.pdf 数据分析方法论是指通过对数据的收集、分析和解释,得出有价值的结论和建议,以帮助企业或组织更好地决策和发展。该方法论涵盖了多种理论和模型,以下是对其中一些重要知识点的解释: 1. STP ...
【大数据分析方法论介绍】 大数据分析是现代商业环境中不可或缺的一部分,它通过收集、处理和解析海量数据,帮助企业理解和优化业务运营。在这个过程中,数据分析的主要目的是用量化的方式解决业务问题,以便得出可...
1. 数据分析方法论的重要性:方法论决定了分析的路径和深度,若不正确或不合理,分析结果可能失去其指导意义。它应与实际业务紧密结合,确保分析维度的完整性和结果的准确性。 2. 数据分析的三大作用: - 现状分析...
总的来说,大数据分析方法论是数据分析的指导框架,它为实际的数据分析工作提供方向,确保分析过程的系统性和有效性。而数据分析法则如对比分析、交叉分析等则是具体的操作步骤和技巧,它们结合在一起,为企业提供...
数据分析方法论解析 数据分析是指通过对数据的收集、整理、分析和解释,获取有价值的信息和知识的过程。数据分析方法论是指对数据分析的一些基本方法和技术的总称,它是数据分析的基础和核心。 本文将对数据分析...
从理论到深度案例分析,成为数据分析师你只需要三步!
1. **验证的目的**:验证的目的是证明分析方法适合其预定用途,即能准确地检测和定量药物物质或产品的关键参数。这包括了对方法的准确度、精密度、线性范围、灵敏度、耐用性等多个方面的评估。 2. **验证特性**: ...
1. **验证的特性**:在验证分析方法时,需考虑多个特性,包括准确性(Accuracy)、精密度(Precision)、灵敏度(Sensitivity, Limit of Detection and Limit of Quantitation)、特异性(Specificity)、线性...
埃森哲大数据分析方法论及工具 一、大数据分析概述 大数据分析是指从数据、信息到知识的过程,需要数学理论、行业经验以及计算机工具三者结合。数据分析方法论是指通过数据挖掘、机器学习、统计学知识等手段来发现...
数据仓库支持从历史数据分析(“发生了什么问题?”)、原因分析(“为什么会发生?”)到预测分析(“下一步会发生什么?”),并最终通过决策模拟和执行分析结果来跟踪企业运行状况,形成一个完整的决策支持循环。 #...
### 数据仓库方法论详解 #### 一、数据仓库方法论概览 数据仓库方法论是一种指导数据仓库系统设计、建设和使用的系统化方法。其核心在于将原始业务数据转化为有价值的知识,进而支持企业的决策制定。本篇文章将从...
1. 数据分析方法论: 数据分析方法论是进行数据研究的总体框架,它指导分析师如何从海量数据中提取有价值的信息。一个有效的方法论应该包括以下几个步骤: - 明确目的:首先,确定分析的目标,例如现状分析、原因...