很多企业在实施CMMI 的MA过程域时,积累了大量的数据,但是不知道如何分析,没有充分发挥出这些数据的作用,花费了大量的人力收集来的数据没有给决策提供应有的帮助,很是可惜。究其根源,是不了解数据分析的方法。在咨询过程中,我总结了进行数据分析的3个层次:
1 简单观察分析
通过对数据进行整理(如排序、分类等),绘制成各种图形,通过这些图形观察出直观的结论,可以绘制的图形如:饼图、条形图、直方图、折线图、散点图、帕累托图等。对于不同类型的图形适用的场景也是不同的,并非简单画个图就可以。在实践中最常见的错误就是:选择的图形无法能让读者直观地得出结论。
观察分析很大程度上需要分析者具有比较丰富的工程经验,能够对数据比较敏感,善于从不同的视角发现问题。
2 稳定性分析
基于过程稳定性的原理,通过对比较多的数据进行过程稳定性的判断分析,以发现特殊偏差,排除异常点。
统计过程控制是比较成熟的质量管理手段了,应用于软件领域的最大问题在于:(1)软件开发过程可重复的子过程的数据采样点太少,(2)2个项目组之间是否真正具有可比性不好判断。
控制图也有多种多样,应该选择哪种控制图也需要训练。
3 相关性分析
基于稳定的数据判断2或多个变量之间的相关性。最常用的相关性分析是工作量与规模、人员技能、技术新颖程度等之间的相关性。规模越大,工作量越大,这是大家的常识,二者之间是线性的关系呢,还是非线性关系呢?除了规模之外是否还存在其他对工作量影响比较大的因素呢?这些问题的解答都需要对数据进行相关性分析。
COCOMO II 模型就是最著名的分析工作量与规模之间相关性的模型。但COCOMO II 模型并非适合于每个公司,并非适合于每个项目,在你的公司里究竟应该建立什么样的模型呢?那就必须基于历史数据进行分析。
三种不同类型的分析层次,也代表了组织的不同的成熟度。在CMMI 的2-3级是停留在简单观察分析的水平,4级开始达到稳定性分析与相关性分析水平。
分享到:
相关推荐
要想通过软件度量做出正确的决策,就必须构造决策目标和量化的软件属性,即度量数据间的关系模型。介绍了当前软件度量领域内用于构造这种关系模型的有代表性的方法。对每种方法的基本原理、一般步骤,以及在软件度量...
分析是对度量数据的深入理解和解释,旨在发现模式、趋势和关联性。常见的分析方法有趋势分析(观察数据随时间的变化)、对比分析(比较不同项目或阶段的性能)和基准比较(将自身表现与行业标准或竞争对手相比较)...
总之,“触手可及的大数据分析工具:Tableau案例集(数据集)”是一个宝贵的资源,它将理论知识与实践操作相结合,帮助用户提升在Tableau中的数据分析能力。通过学习和实践这些案例,你不仅能掌握Tableau的基本操作...
2. 多维数据模型:允许用户定义和组织数据的维度和度量,以便进行有效的数据分析。 3. 数据聚合:自动进行数据汇总,根据用户的维度选择提供快速响应。 4. 视图定制:提供多种图表类型(如柱状图、饼图、线图等)和...
6. **客户端工具连接**:最后,通过Excel、SSRS(SQL Server Reporting Services)或其他第三方工具,用户可以连接到OLAP服务器,进行数据浏览、钻取、切片和切块等操作,实现多维数据分析。 SQL Server 2005 ...
拓扑数据分析是一种处理和理解复杂数据结构的方法,它不依赖于欧几里得空间的距离度量,而是关注数据的形状、连通性和孔洞等几何特性。在TDA中,我们使用诸如“持续同调”等工具来捕获数据的拓扑特征,这些特征可以...
数据分析是数据挖掘过程中的重要环节,它涉及到一系列专业名词的准确理解和运用,这些名词包括但不限于数据仓库、数据源视图、多维数据集、度量值组、维度表、事实表、维度、度量值、层次结构、属性、键列值、细粒度...
#### 三、Excel在地理数据分析中的应用 1. **回归分析** - **线性回归**:利用Excel的函数或工具包(如Data Analysis工具包)进行简单或多元线性回归分析,以确定变量之间的关系强度。 - **逐步回归**:自动选择...
《RapidMiner数据分析与挖掘实战》是一本深入讲解如何使用RapidMiner进行数据分析和挖掘的实战指南。RapidMiner是一款强大的开源数据科学平台,它提供了丰富的工具和算法,使得非编程背景的用户也能轻松进行数据...
度量数据的共享和分析促进了跨部门的协作和透明度,有助于整个组织的学习和成长。 总的来说,软件过程和项目的度量是软件工程不可或缺的一部分,它们为管理和改进提供了定量依据,促进了更明智的决策,推动了软件...
层次聚类分析是一种广泛应用的数据分析方法,主要用于将数据集中的观测或对象按照相似性或差异性进行分组,形成一个有层次的结构。在标题中提到的“层次聚类分析热图解读,matlab”,意味着我们将探讨如何使用MATLAB...
在软件开发过程中,度量是评估和改进代码质量、项目进度和团队效率的重要手段。"自动化软件度量工具"正是为了实现这一目标而设计...在实际应用中,这些度量数据也可以用于软件项目管理和质量保证,为决策提供数据支持。
层次聚类分析是一种广泛应用的数据分析方法,主要用于将数据集中的对象根据它们的相似性或相异性进行分组,形成一个有层次的结构,也就是我们常说的“树状图”。这种方法可以直观地展示数据间的相似性关系,对于理解...
它专注于多维数据分析,使得用户能够快速、高效地查询大规模数据集,从而获取深入的业务洞察。在本实例中,我们将深入探讨如何利用SSAS进行多维数据集的创建、定义和部署。 首先,我们要理解什么是多维数据集。多维...
### 数据挖掘与数据分析应用案例:基于C++的层次聚类算法及实现 #### 一、层次聚类算法简介 层次聚类(Hierarchical Clustering)作为一种重要的无监督学习方法,被广泛应用于各种领域,如生物信息学、图像分析、...
在深层次数据分析方面,问题分析可以分为初步问题分析和深层次问题分析。初步问题分析针对的是问题的直接原因,而深层次问题分析则涉及问题的根本原因。逻辑树是一种将复杂问题分解成若干个简单部分的方法,它帮助...
### 数据挖掘与数据分析应用案例:基于Java的层次聚类算法基本研究 #### 一、引言 随着大数据时代的到来,如何有效地从海量数据中提取有价值的信息成为了一个重要的研究课题。聚类分析作为数据挖掘领域的一项关键...
数据源视图则是一个定制化的视角,仅包含数据分析所需的特定数据,避免了不必要的数据处理,同时保护了原始数据的安全性。 多维数据集是数据仓库中数据的进一步抽象和组织,它由一个或多个度量值组及其关联的维度...
6. **项目度量结果分析**:提供的文档“项目度量结果分析1.doc”到“项目度量结果分析3.doc”很可能是对度量结果的详细解读,可能包含了度量数据的可视化图表,以及根据这些数据得出的结论和改进建议。 7. **...