`
m635674608
  • 浏览: 5052197 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

数据归一化和两种常用的归一化方法

 
阅读更多

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和 量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准 化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:

一、min-max标准化(Min-Max Normalization)

也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:

clip_image002

其中max为样本数据的最大值,min为样本数据的最小值。这种方法有个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

二、Z-score标准化方法

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:

clip_image004

其中clip_image006为所有样本数据的均值,clip_image008为所有样本数据的标准差。

 

一、 归一化的作用是:将数据去掉量纲的影响。简单的讲,由于数据单位不一致,故需将不同的数据进行格式化,使之在指定的范围内  (比如在0~1之间)。

二、归一化方法:

1、线性函数转换:y=(x-MinValue)/(MaxValue-MinValue)
说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。
2、对数函数转换:y=lg(x)
说明:以10为底的对数函数转换。
3、反余切函数转换:y=atan(x)*2/pi
 
_score * (1d / (1d + exp(-log(doc['saleCount'].value+1d)/10)))

参考文献:

http://webdataanalysis.net/data-analysis-method/data-normalization/

 

http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html

分享到:
评论

相关推荐

    数据归一化matlab代码

    其中,数据归一化是一种常见的技术手段,它能够将数据集中的数值调整到一个特定的范围内(通常为0到1之间),从而提高模型训练的速度和准确性。本文将详细介绍一个简单的Matlab实现数据归一化的程序,并对该程序进行...

    归一化和反归一化matlab程序

    归一化和反归一化是数学处理和数据分析中常用的技术,特别是在计算机科学,机器学习,图像处理等领域。MATLAB是一种强大的编程环境,适合进行这些计算。以下将详细解释这两个概念以及它们在MATLAB中的实现。 归一化...

    归一化算法代码,用于图像归一化

    在图像处理领域,归一化是一种重要的预处理技术,它旨在调整图像数据的范围或分布,使其具有统一的标准,从而提高后续分析或算法的效率和准确性。本压缩包中的“归一化算法代码”显然是针对图像归一化的实现,下面...

    guiyihua.rar_c++ 数据归一化_数据归一化

    数据归一化的常见方法有以下几种: 1. **最小-最大缩放**(Min-Max Scaling):这是最简单的归一化方式,通过将数据线性地映射到0-1区间(或者任何其他自定义的区间)内。公式为:(x - min(x)) / (max(x) - min(x))...

    normalization.zip_MATLAB归一化_Normalization_matlab 归一化_数据处理_数据归一化

    数据归一化是一种重要的预处理技术,在数据分析、机器学习和深度学习等领域中广泛应用。它能够将不同尺度或范围的数据调整到同一尺度上,使得算法在处理这些数据时能更好地进行比较和分析。MATLAB作为一款强大的数值...

    统计数据归一化和标准化

    在数据分析和机器学习领域,数据预处理是一个至关重要的步骤,其中归一化和标准化是两种常见的数据转换技术,用于优化模型性能和提高算法的效率。本文将深入探讨这两种方法,提供相关实例,以便更好地理解它们的应用...

    NormalizeFea.zip_MATLAB归一化_normalizeFea_归一化_特征归一化_行归一或者列归一

    2. `NormalizeFea.m`:这是归一化功能的核心文件,根据标题和标签,它应该包含了两种归一化的实现,即行归一化和列归一化。在MATLAB中,可以使用`norm`函数计算向量的范数,然后用每个元素除以其所在行或列的范数来...

    SVM数据标准化_libsvm标准格式_svm数据标准化_归一化_warm15o_数据归一化_

    在SVM中,min-max缩放和z-score标准化较为常见,前者将数据缩放到[0, 1]区间,后者使数据具有零均值和单位方差,这两种方法都可以将数据映射到(-1, 1)区间。 5. **warm15o**:这可能是某种特定的数据预处理策略或者...

    欧式距离+归一化

    **归一化**:在处理数据时,归一化是一种常用的数据预处理方法,其目的是将不同尺度或范围的数据调整到一个统一的标准,通常是在0到1之间。归一化有多种方法,如最小-最大规范化(Min-Max Scaling)、Z-Score标准化...

    datanorm.zip_matlab列归一化_反归一化_归一化_归一化matlab

    本资源是一个关于MATLAB实现列归一化和反归一化的代码集合,名为“datanorm.zip”,它包含了对矩阵数据进行这两种操作的函数。 首先,我们来理解什么是归一化。归一化是指将数据缩放到一个特定的区间,如[0,1]或[-1...

    数据标准化归一化.docx

    常见的数据归一化方法有多种,最常用的是 min-max 标准化 和 z-score 标准化。min-max 标准化是将数据映射到[0,1]区间上,z-score 标准化是将数据映射到均值为0,标准差为1的范围内。两种方法都可以实现数据的标准化...

    特征向量的归一化比较性研究

    在描述中提到,特征提取和分类器参数优化是提升分类准确性的两种关键方法,而文章正是基于公共数据库UCI(University of California Irvine Machine Learning Repository)使用归一化方法对特征进行变换,并使用KNN...

    python 实现SVM,Logistics,以及训练数据归一化处理

    常见的归一化方法有最小-最大缩放(Min-Max Scaling)和Z-Score标准化(StandardScaler)。在Scikit-learn中,可以使用`preprocessing.MinMaxScaler()`进行最小-最大缩放,将数据转换到[0, 1]区间;使用`...

    tf.keras_分类模块数据归一化.ipynb_quietlyxoc_keras_归一化_lateory_tf.keras_源

    在机器学习领域,数据预处理是至关重要的一步,其中数据归一化是一个常见的技术,能够显著提高模型的训练效果和收敛速度。本篇主要探讨的是如何在`tf.keras`框架中进行数据归一化,以及它对模型训练的理论基础。 ...

    DWRR.rar_动态加权方法_数据归一化_综合评价数据_综合评价模型_评价模型

    常见的数据归一化方法有最小-最大归一化、Z-score标准化等。通过数据归一化,可以将不同尺度的数据转换到同一尺度上,便于后续的计算和比较。 在本案例中,描述提到了偏大型正态分布函数作为动态加权函数。正态分布...

    svm.rar_SVM归一化公式_battleett_clawshis_svm数据格式_矩阵归一化

    矩阵归一化通常有两种常见方法: 1. 最小-最大规范化(Min-Max Scaling):公式为 `X' = (X - min(X)) / (max(X) - min(X))`,其中X'是归一化后的值,X是原始值,min(X)和max(X)分别是该特征列的最小值和最大值。...

    dtw.zip_difficultyxza_dtw_wasteixc_反归一化_归一化

    在IT领域,尤其是在数据分析和信号处理中,"dtw.zip_difficultyxza_dtw_wasteixc_反归一化_归一化"这个标题暗示了一些关键的技术概念,包括DTW(动态时间规整)、数据归一化和反归一化。让我们详细探讨这些知识点。 ...

Global site tag (gtag.js) - Google Analytics