`

数据挖掘导论学习笔记(3)----- 汇总统计

 
阅读更多

1.频率和众数  (是一组数据中出现次数最多的数值,叫众数)

2.百分位数

3.位置度量:均值(mean)和中位数(median)

   均值:统计学术语,与“平均”(Average)意义相同。例如: l、3、6,10、20这5个数的均值是8。也同期望

   截断均值(trimmed mean):截断均值是去掉高、低极端值得到的均值。应当避免在两端截断的比例太大,因为这可能导致损失有价值的信息

   中位数(Medians)统计学名词,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数,用Me表示。当变量值的项数N为奇数时,处于中间位置的变量值即为中位数;当N为偶数时,中位数则为处于中间位置的2个变量值的平均数。(注意:中位数和众数不同,中位数不一定在这组数据中。而众数必定在该组数据)

4.散步度量:极差(range)和方差

   极差(range): 给定属性x,它具有m个值{x1,x2......Xm}

                           range(x) = max(x)-min(x)= Xm-X1

    方差,标准差。

    同样方差对离群值敏感,常常使用下路度量定义:

    绝对平均偏差(absolute average deviation,ADD)

    中位数绝对偏差(median absolute deviation,MAD)

     四分位偏差(interquartile range,IQR)

5.多元汇总统计

    协方差矩阵(covariance matrix)

    相关矩阵(correlation matrix)

 

分享到:
评论

相关推荐

    数据挖掘导论 习题答案 (Pang-Ning Tan)

    《数据挖掘导论》是Pang-Ning Tan(陈封能)撰写的一本经典教材,主要涵盖了数据挖掘领域的基础知识和核心概念。这本书的习题答案是学习者深入理解和掌握书中知识的重要参考资料。以下是对该书及其习题答案的详细...

    数据挖掘导论(笔记)

    数据挖掘导论 (英文PPT)(Pang-Ning Tan, Michael Steinbach, Vipin Kumar) 原书第四章(Introduction to Data Mining CH4)高清:http://download.csdn.net/detail/flyingpoops/9406233 原书第六章...

    数据挖掘导论(完整版)

    《数据挖掘导论(完整版)》全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外...

    数据挖掘导论-ch8-分类与预测-神经网络(3)1

    【数据挖掘导论-ch8-分类与预测-神经网络(3)1】 在数据挖掘领域,分类和预测是重要的任务,而神经网络作为一种强大的工具,被广泛应用于这两方面。本章我们将深入探讨神经网络的基本原理及其在数据挖掘中的应用。 ...

    数据挖掘导论(完整版)PPT.

    《数据挖掘导论》全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题...

    数据挖掘导论-ch2-Python数据分析工具.pdf

    数据挖掘导论 学习课件 ch2 非常好的资源 欢迎大家下载 Numpy。  Python并没有提供数组功能。虽然列表可以完成基本的数组功能 ,但它不是真正的数组,而且在数据量较大时,使用列表的速度 就会慢得难以接受。  ...

    数据挖掘导论第二版答案,Pang-Ning Tan.pdf

    《数据挖掘导论第二版》由Pang-Ning Tan等人编著,提供了深入的数据挖掘理论和实践知识。本教材的教师解决方案手册旨在帮助读者理解和解决书中提出的问题。 1. 数据挖掘任务的识别: 在讨论是否属于数据挖掘任务时...

    数据挖掘导论-ch6-分类与预测-回归1

    回归分析是数据挖掘和机器学习领域中的核心方法之一,它主要关注于研究变量间的关系以及进行预测。在标题“数据挖掘导论-ch6-分类与预测-回归1”中,回归分析被作为分类与预测的一个关键子话题进行讨论。描述中提到...

    数据挖掘导论 完整版

    数据挖掘是信息技术领域中一个关键的研究方向,它涉及到从海量...通过学习这个完整版的数据挖掘导论,读者不仅能了解数据挖掘的基本原理,还能掌握在大数据环境中应用这些方法的技巧,为成为数据挖掘专家打下坚实基础。

    数据挖掘导论 范明 范宏建等译

    《数据挖掘导论》是由范明、范宏建等人翻译的一本...通过阅读《数据挖掘导论》并结合“数据挖掘导论课件”,读者可以系统地学习到数据挖掘的基本概念、技术和实践,为进一步深入研究或应用数据挖掘技术奠定坚实基础。

    数据挖掘导论(完整版) 习题答案.xdf

    Introduction to data mining

    完整版数据挖掘导论 课后习题答案(中文版)

    本资源“完整版数据挖掘导论 课后习题答案(中文版)”是针对学习数据挖掘课程的学生或爱好者的重要参考资料,它包含了对《数据挖掘导论》一书中的所有课后习题的详尽解答,有助于深入理解和掌握数据挖掘的基本概念...

    数据挖掘导论(完整版)_数据挖掘_异常检测_

    数据挖掘是一种从海量数据中提取有价值知识的过程,它结合了计算机科学、统计学和机器学习等领域的技术。在“数据挖掘导论(完整版)”中,五个关键主题被深入探讨,分别是数据、分类、关联分析、聚类以及异常检测。...

    中科大-机器学习-课程ppt-课后习题答案-往年考试试卷-数据挖掘导论

    中科大-机器学习-课程ppt-课后习题答案-往年考试试卷-数据挖掘导论-推荐系统ppt-陈恩红

    数据挖掘导论 完整版_数据挖掘_

    本资料《数据挖掘导论 完整版》深入浅出地介绍了数据挖掘的核心概念、基本算法和实际应用,是学习数据挖掘领域的入门经典。 首先,数据挖掘的目标可分为五类:描述、预测、关联规则、分类和聚类。描述性挖掘旨在...

    《数据挖掘概念与技术》-思维导图学习笔记,第一章。

    3. 数据挖掘过程:通常包括业务理解、数据理解、数据准备、建模、评估和部署六个阶段。业务理解是理解项目目标和背景;数据理解涉及数据探索和初步分析;数据准备包括数据清洗、集成和转换;建模阶段选择合适的算法...

    数据挖掘导论(完整版)中英文资料包

    "数据挖掘导论(完整版)中英文资料包"是一个全面的学习资源,涵盖了这一领域的基础知识到高级技巧。这个资料包包含以下几个核心组成部分: 1. **中文版课本**:这本中文版的教材提供了数据挖掘的基本概念、方法和...

    数据挖掘导论-ch5-分类与预测-背景及决策树(1)1

    数据挖掘是一种从大量数据中提取有价值信息的技术,用于支持决策制定和发现隐藏的模式。在本章中,我们将重点讨论分类与预测这两种重要的数据挖掘任务。分类是将数据分配到预定义类别中的过程,而预测则涉及建立模型...

Global site tag (gtag.js) - Google Analytics