`
m635674608
  • 浏览: 5052291 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

数据归一化,标准化的几种方法

 
阅读更多

归一化方法(Normalization Method)
1。 把数变为(0,1)之间的小数
主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。
2 。把有量纲表达式变为无量纲表达式
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
比如,复数阻抗可以归一化书写:Z = R + jωL = R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。
另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。
标准化方法(Normalization Method)
数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。一般常用的有以下几种方法。
(1) 最小-最大规范化对原始数据进行线性变换。假定MaxA与MinA分别表示属性A的最大与最小值。最小最大规范化通过计算将属性A的值映射到区间[a, b]上的v。一般来说,将最小-最大规范化在用于信用指标数据上,常用的有以下两种函数形式:
a) 效益型指标(越大越好型)的隶属函数:
b) 成本型指标(越小越好型)的隶属函数:
(2) z-score规范化也称零-均值规范化。属性A的值是基于A的平均值与标准差规范化。
(3) 小数定标规范化是通过移动属性A的小数点位置来实现的。小数点的移动位数依赖于A的最大绝对值。

///////////////////////////////////////////////////////////////////////////////////////////////////
关于神经网络归一化方法的整理
由于采集的各数据单位不一致,因而须对数据进行[-1,1]归一化处理,归一化方法主要有如下几种,供大家参考:(by james)
1、线性函数转换,表达式如下:
y=(x-MinValue)/(MaxValue-MinValue)
说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。
2、对数函数转换,表达式如下:
y=log10(x)
说明:以10为底的对数函数转换。
3、反余切函数转换,表达式如下:
y=atan(x)*2/PI
归一化是为了加快训练网络的收敛性,可以不进行归一化处理
归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1–+1之间是统计的坐标分布。归一化有同一、 统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一 化是同一在0-1之间的统计概率分布;
当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。为了避免出现这种情况,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。
归一化是因为sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用[0.9 0.1 0.1]就要比用[1 0 0]要好。
但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。
关于用premnmx语句进行归一化:
premnmx语句的语法格式是:[Pn,minp,maxp,Tn,mint,maxt]=premnmx(P,T)
其中P,T分别为原始输入和输出数据,minp和maxp分别为P中的最小值和最大值。mint和maxt分别为T的最小值和最大值。
premnmx函数用于将网络的输入数据或输出数据进行归一化,归一化后的数据将分布在[-1,1]区间内。
我们在训练网络时如果所用的是经过归一化的样本数据,那么以后使用网络时所用的新数据也应该和样本数据接受相同的预处理,这就要用到tramnmx。
下面介绍tramnmx函数:
[Pn]=tramnmx(P,minp,maxp)
其中P和Pn分别为变换前、后的输入数据,maxp和minp分别为premnmx函数找到的最大值和最小值。
(by terry2008)
matlab中的归一化处理有三种方法
1. premnmx、postmnmx、tramnmx
2. restd、poststd、trastd
3. 自己编程
具体用那种方法就和你的具体问题有关了
(by happy)
pm=max(abs(p(i,:))); p(i,:)=p(i,:)/pm;

for i=1:27
p(i,:)=(p(i,:)-min(p(i,:)))/(max(p(i,:))-min(p(i,:)));
end 可以归一到0 1 之间
0.1+(x-min)/(max-min)*(0.9-0.1)其中max和min分别表示样本最大值和最小值。
这个可以归一到0.1-0.9
=============
数据类型相互转换
这种转换可能发生在算术表达式、赋值表达式和输出时。转换的方式有两种:自动转换和强制转换。
========
自动转换
自动转换由编译系统自动完成,可以将一种数据类型的数据转换为另外一种数据类型的数据。
1)算术运算中的数据转换
如果一个运算符有两个不同类型的运算分量,C语言在计算该表达式时会自动转换为同一种数据类型以便进行运算。先将较低类型的数据提升为较高的类型,从而使 两者的数据类型一致(但数值不变),然后再进行计算,其结果是较高类型的数据。 自动转换遵循原则——“类型提升”:转换按数据类型提升(由低向高)的方向进行,以保证不降低精度。 数据类型的高低是根据其类型所占空间的大小来判定,占用空间越大,类型越高。反之越低。 例如:算术运算x+y,如果x和y的类型都是int型变量,则x+y的结果自然是int型。如果x是short型而y是int型,则需要首先将x转换为 int型,然后再与y进行加法计算,表达式的结果为int型。
2)赋值运算的类型转换
在执行赋值运算时,如果赋值运算符两侧的数据类型不同,赋值号右侧表达式类型的数据将转换为赋值号左侧变量的类型。转换原则是:当赋值运算符“=”右侧表达式的值被计算出来后,不论是什么类型都一律转换为“=”左侧的变量的类型,然后再赋值给左侧的变量。
例如:float a;
a=10;? /*结果为a=10.0(数据填充)*/
int a;
a=15.5 /* 结果为a=15(数据截取)*/
在赋值类型转换时要注意数值的范围不能溢出。既要在该数据类型允许的范围内。如如果右侧变量数据类型长度比左侧的长时,将丢失一部分数据,从而造成数据精度的降低。
3)数据输出时的类型转换
在输出时,数据将转换为格式控制符所要求的类型。同样可能发生数据丢失或溢出。类型转换的实际情况是:字符型到整型是取字符的ASCII码值;整型到字符 型只是取其低8位;实型到整型要去掉小数部分;整型到实型数值不变,但以实数形式存放;双精度到实型是四舍五入的。
========
强制转换
一般情况下,数据类型的转换通常是由编译系统自动进行的,不需要程序员人工编写程序干预,所以又被称为隐式类型转换。但如果程序要求一定将某一类型的数据 从该种类型强制地转换为另外一种类型,则需要人工编程进行强制类型转换,也称为显式转换。强制类型转换的目地是使数据类型发生改变,从而使不同类型的数据 之间的运算能够进行下去。
语法格式如下:
(类型说明符)表达式
功能是强行地将表达式的类型转换为括号内要求的类型。
例如:(int)4.2的结果是4;
又如:int x;
(float)x;x的值被强制转换为实型,但是并不改变的x类型是整型。只是在参与运算处理时按照实型处理。

======

线性函数转转讲一系列数据映射到相应区间,例如将所有数据映射到 1~100

可用下列函数

y=((x-min)/(max-min))*(100-1)+1

1-100 范围内

min是数据集中最小值,max是最大值

 

http://www.codeweblog.com/%E6%95%B0%E6%8D%AE%E5%BD%92%E4%B8%80%E5%8C%96-%E6%A0%87%E5%87%86%E5%8C%96%E7%9A%84%E5%87%A0%E7%A7%8D%E6%96%B9%E6%B3%95/

分享到:
评论

相关推荐

    guiyihua.rar_c++ 数据归一化_guiyihua_归一化_归一化处理_数据 归一 处理

    数据归一化通常有几种常见的方法,包括最小-最大规范化、z-score标准化、分位数规范化以及最大绝对值规范化等。 1. **最小-最大规范化**(Min-Max Scaling):也称为线性缩放,通过将每个特征的值映射到0到1之间...

    python数据预处理之数据标准化的几种处理方式

    接下来,我们来看几种常见的数据标准化方法: 1. **归一化**(Max-Min或min-max标准化):这是一种线性变换方法,将数据映射到[0, 1]的范围内。公式为`新数据 = (原数据 - 最小值) / (最大值 - 最小值)`。这种方法...

    Matlab数据归一化代码

    在提供的压缩包文件"dataNormal"中,可能包含了以上各种归一化方法的代码实例和数据,通过阅读和运行这些代码,可以更深入地理解并掌握Matlab中的数据归一化操作。对于机器学习初学者和数据科学家来说,理解和熟练...

    归一化算法代码,用于图像归一化

    压缩包中的“归一化算法代码”可能包含了上述几种归一化方法的实现,开发者可以根据实际需求选择合适的方法。在使用这些代码时,需要注意输入图像的格式,以及代码中设定的参数,如截尾百分位数、归一化目标区间等,...

    guiyihua.rar_c++ 数据归一化_数据归一化

    数据归一化的常见方法有以下几种: 1. **最小-最大缩放**(Min-Max Scaling):这是最简单的归一化方式,通过将数据线性地映射到0-1区间(或者任何其他自定义的区间)内。公式为:(x - min(x)) / (max(x) - min(x))...

    KDD99数据集的归一化

    KDD99数据集中定义了几种主要的攻击类型,包括: - `dos_type`:拒绝服务攻击 - `probe_type`:探测攻击 - `r2l_type`:远程到本地攻击 - `u2r_type`:用户到根权限攻击 正常行为被标记为1,不同的攻击类型分别被...

    归一化方法

    每种归一化方法都有其适用场景,选择哪种方法取决于具体的数据特性和应用场景。例如,当数据分布在不同的范围内且需要比较时,最小-最大归一化是个好选择;如果希望消除数据的尺度影响并保留原始数据的分布形态,...

    matlab-data-normalization.zip_数据归一化_数据预处理

    MATLAB提供了多种数据归一化的方法,主要包括以下几种: 1. **最小-最大规范化**(Min-Max Scaling):也称为区间缩放,将数据映射到0-1之间。公式为:`X_normalized = (X - X_min) / (X_max - X_min)`。这种方法...

    guiyihua.rar_c++ 数据归一化

    在MATLAB中,有几种常见的数据归一化方法: 1. 最小-最大归一化(Min-Max Scaling): 这是最简单的归一化方法,通过以下公式进行: \[ x_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}} \] 其中,\( x \)是...

    guiyihua.rar_guiyihua_guiyihua.rar_matlab 归一化_归一化 matlab_数据归一化

    在提供的源代码`guiyihua.m`中,我们可能会看到以下几种常见的归一化技术: 1. 最小-最大归一化(Min-Max Normalization):这种方法通过将每个特征的值减去最小值,然后除以最大值与最小值的差来实现。公式为:`X'...

    归一化汇总

    在MATLAB中,常用的归一化方法主要有以下几种: 1. **premnmx、postmnmx、tramnmx**:这组函数用于将数据缩放到[-1, 1]范围内。`premnmx`用于数据的预处理,`postmnmx`用于将处理后的数据恢复到原始范围,而`...

    批量归一化代码_归一化_gis_python_批量_

    在GIS(地理信息系统)领域,数据预处理是至关重要的步骤之一,其中归一化是一种常见的数据处理技术。归一化可以调整数据的范围,使其在0到1之间,或者某个特定范围内,使得不同尺度或单位的数据能更好地进行比较和...

    数据归一化matlab代码

    数据归一化是一种在数据分析和机器学习中常用的数据预处理技术,目的是将不同尺度或分布的数据转换到同一尺度上,以便更好地进行比较和分析。在MATLAB中,我们可以编写简单的脚本来实现这一过程。MATLAB代码实现数据...

    BP神经网络Matlab程序例子_反归一化_BP神经网络_

    Matlab中常见的归一化方法有最小-最大归一化(MinMax Scaling)和Z-score标准化。 - **最小-最大归一化**:\( x_{norm} = \frac{x - min(x)}{max(x) - min(x)} \) - **Z-score标准化**:\( x_{norm} = \frac{x - \...

    cuda 环境下的归一化程序

    在CUDA环境下进行归一化程序开发,是一种利用NVIDIA GPU的并行计算能力来优化数据处理的方法。CUDA(Compute Unified Device Architecture)是NVIDIA推出的一种编程模型,它允许程序员直接利用GPU的强大运算能力来...

    Data Normalization and Standardization:数据的归一化和标准化-matlab开发

    MATLAB中可以使用`normalize`函数进行数据归一化,该函数支持多种归一化方法,包括最小-最大缩放和Z-score标准化。 标准化,也称为Z-score标准化,是一种更为普遍的数据转换方法。它将数据转换为均值为0,标准差为1...

    matlab 图像 归一化系数

    归一化通常分为几种类型:最小-最大归一化、Z-score归一化(也称为标准差归一化)和范数归一化等。在MATLAB中,可以使用`imadjust`函数进行简单的线性归一化,或者通过自定义脚本实现更复杂的归一化操作。 1. 最小-...

    Classical_神经网络_数据归一化_bp神经网络matlab_主成分分析_

    常见的数据归一化方法有最小-最大归一化、Z-score标准化等。在MATLAB中,`minmax`函数可用于最小-最大归一化,`zscore`函数则可实现Z-score标准化。 接下来,我们谈谈主成分分析。PCA是一种无监督的降维技术,通过...

    BP神经网络训练归一化.pdf

    描述部分没有提供具体信息,但从标签和内容来看,主要讨论了神经网络训练中的数据归一化以及它对训练效果的影响。 内容中提到了几个关键点: 1. 数据归一化后是否需要反归一化:在某些情况下,归一化的数据经过...

    2. 归一化1

    接下来,我们讨论几种常见的归一化方法: 2.1 线性归一化是最简单的归一化形式,将数据映射到[0,1]区间。这种方法适用于数据分布相对集中的情况。但是,如果最大值和最小值不稳定,这种方法可能会导致归一化的结果...

Global site tag (gtag.js) - Google Analytics