`
weitao1026
  • 浏览: 1052848 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

数据标准化处理方法

 
阅读更多

数据标准化处理方法
    在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。
  一、Min-max 标准化
    min-max标准化方法是对原始数据进行线性变换。设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x',其公式为:     新数据=(原数据-极小值)/(极大值-极小值)     二、z-score 标准化

 


               

 

 

 

    这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到x'。
    z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。     新数据=(原数据-均值)/标准差
    spss默认的标准化方法就是z-score标准化。
    用Excel进行z-score标准化的方法:在Excel中没有现成的函数,需要自己分步计算,其实标准化的公式很简单。 步骤如下:
    1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ;     2.进行标准化处理:       zij=(xij-xi)/si
      其中:zij为标准化后的变量值;xij为实际变量值。     3.将逆指标前的正负号对调。
    标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。
    三、Decimal scaling小数定标标准化

 

 

 

 

 


    这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性A的取值中的最大绝对值。将属性A的原始值x使用decimal scaling标准化到x'的计算方法是:     x'=x/(10*j)
    其中,j是满足条件的最小整数。
    例如 假定A的值由-986到917,A的最大绝对值为986,为使用小数定标标准化,我们用1000(即,j=3)除以每个值,这样,-986被规范化为-0.986。
    注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数,以便对后续的数据进行统一的标准化。
    除了上面提到的数据标准化外还有对数Logistic模式、模糊量化模式等等:
    对数Logistic模式:新数据=1/(1+e^(-原数据)) 
    模糊量化模式:新数据=1/2+1/2sin[派3.1415/(极大值-极小值)*(X-(极大值-极小值)/2) ]       X为原数据

 

数据标准化

编辑 锁定

 
数据标准化企业或组织对数据的定义、组织、监督和保护进行标准化的过程。数据标准化分为开发(D)、候选(C)、批准(A)驳回(R)、归档(X)几个过程。
数据标准化的分类有Min-max 标准化和z-score 标准化。
 
中文名
数据标准化
外文名
normalization
过    程
D、C、A、R、X
方    法
常用3种
释    义
企业对数据进行标准化的过程
别    名
统计数据的指数化

目录

数据标准化简介

编辑
评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单一指标对事物进行评价往往不尽合理,必须全面地从整体的角度考虑问题,多指标综合评价方法应运而生。所谓多指标综合评价方法,就是把描述评价对象不同方面的多个指标的信息综合起来,并得到一个综合指标,由此对评价对象做一个整体上的评判,并进行横向或纵向比较。
而在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。
数据标准化数据标准化
目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法,对系统的评价结果会产生不同的影响,然而不幸的是,在数据标准化方法的选择上,还没有通用的法则可以遵循。

数据标准化方法

编辑
在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。
一、Min-max 标准化
min-max标准化方法是对原始数据进行线性变换。设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x',其公式为:
新数据=(原数据-最小值)/(最大值-最小值)
二、z-score 标准化
这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到x'。
z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
新数据=(原数据-均值)/标准差
spss默认的标准化方法就是z-score标准化。
用Excel进行z-score标准化的方法:在Excel中没有现成的函数,需要自己分步计算,其实标准化的公式很简单。
  步骤如下:
  1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ;
  2.进行标准化处理:
  zij=(xij-xi)/si
  其中:zij为标准化后的变量值;xij为实际变量值。
  3.将逆指标前的正负号对调。
  标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。
三、Decimal scaling小数定标标准化
这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性A的取值中的最大绝对值。将属性A的原始值x使用decimal scaling标准化到x'的计算方法是:
x'=x/(10^j)
其中,j是满足条件的最小整数。
例如 假定A的值由-986到917,A的最大绝对值为986,为使用小数定标标准化,我们用每个值除以1000(即,j=3),这样,-986被规范化为-0.986。
注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数,以便对后续的数据进行统一的标准化。
除了上面提到的数据标准化外还有对数Logistic模式、模糊量化模式等等:
对数Logistic模式:新数据=1/(1+e^(-原数据))
模糊量化模式:新数据=1/2+1/2sin[派3.1415/(极大值-极小值)*(X-(极大值-极小值)/2) ] X为原数据
分享到:
评论

相关推荐

    数据标准化处理方法.pdf

    数据标准化处理方法.pdf 数据标准化处理方法是数据分析前的必要步骤,它通过将原始数据转换为无量纲化指标,实现数据的同质化和可比性,以便进行综合测评分析。在数据标准化处理方法中,主要包括数据同质化处理和...

    Python手写代码实现6种数据标准化处理方法.ipynb

    数据标准化(Normalization)是指:将数据按照一定的比例进行缩放,使其落入一个特定的小区间。为什么要进行数据标准化呢?去除数据的单位限制,将其转化为无量纲的纯数值,便于不同量级、不同单位或不同范围的数据...

    python数据预处理之数据标准化的几种处理方式

    在Python中,有多种方法可以实现数据标准化。 首先,让我们了解什么是标准化。在数据分析中,标准化指的是将数据调整到一个统一的标准,通常是为了消除量纲影响、改善数据的可比性或减少异常值的影响。数据标准化...

    arcgis数据处理归一化和标准化.tbx

    ARCGIS数据处理标准化和归一化的处理工具箱

    SVM数据标准化_libsvm标准格式_svm数据标准化_归一化_warm15o_数据归一化_

    数据标准化是解决这个问题的方法之一,它通过调整特征的数值范围,使得所有特征都在相同的尺度上,通常将数据映射到(-1, 1)之间,或者更常见的做法是z-score标准化,使数据具有零均值和单位方差。 2. **libsvm标准...

    高产高效煤矿生产数据标准化方法研究

    本文将以“高产高效煤矿生产数据标准化方法研究”为题,探讨在神东公司煤炭生产数据标准化实施过程中摸索出的一套适用于煤炭行业的数据标准化流程方法。 首先,我们需要了解数据标准化的概念。数据标准化是指在收集...

    2021数据治理标准化白皮书.pdf

    数据治理标准化白皮书(2021)由中国通信标准化协会发布,旨在搭建数据治理标准化体系框架,支撑各项法规政策落实、指导行业发展、引导技术进步、满足全新需求,以数据标准推动建立全新的规则秩序。 白皮书系统介绍...

    中国银监会银行业金融机构监管数据标准化规范

    本规范涵盖了银行业金融机构监管数据的采集、存储、处理和分析等方面,旨在确保银行业金融机构的监管数据标准化、规范化和一致化。 一、标准引用 本规范引用了相关的国家标准、行业标准和国际标准,确保银行业金融...

    云计算网络中高维数据标准化处理优化仿真.pdf

    数据标准化处理是数据分析中的一项基础工作,主要是指将数据按比例缩放,使之落入一个特定的范围,如0到1之间或均值为0和标准差为1的范围。标准化处理可以消除不同特征量纲带来的影响,保证数据在处理过程中具有可比...

    《数据标准化规范》共2页.pdf.zip

    此外,数据标准化还涉及元数据的管理,即关于数据的数据,如数据的来源、采集时间、处理方法等。元数据可以帮助理解数据的背景,增强数据的可解释性。 在实际应用中,数据标准化可能会结合ETL(提取、转换、加载)...

    信息技术 数据元的规范与标准化 第1部分数据元的规范与标准化框架

    本标准适用于所有需要进行数据元规范化处理的情况,包括但不限于政府机构、企业以及各类信息系统的设计、开发、维护过程中涉及的数据元素标准化工作。它为数据元的定义、分类、属性、命名、标识以及注册等方面提供了...

    数据标准化系统,数据标准化系统

    数据标准化系统是信息技术领域中一个重要的概念,它主要涉及到如何将来自不同源头、格式各异的数据进行规范化处理,以便于统一管理和分析。数据标准化系统的主要目标是确保数据的一致性、准确性和可比性,这对于大...

    stadardlize_数据标准化_

    数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评...

    29.数据预处理之字符型转换数值型、标准化、归一化处理1

    数据预处理是数据分析和机器学习中的关键步骤,它包括字符型转换为数值型、数据标准化和归一化等过程。本文将重点讨论这些概念,并通过Python实现这些技术。 首先,字符型特征转换为数值型是必要的,因为大多数机器...

    统计数据标准化.pdf

    数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质的数据进行同趋化处理,使所有指标对测评方案的作用力同趋化,接着再加总才能得到正确的结果。...

    现场数据采集领域的标准化数据接口技术及相关数据处理技术的研究与应用.pdf

    文章主要探讨了现场数据采集领域中标准化数据接口技术及相关的数据处理技术在石油化工行业的应用。随着油田开发进入中后期,精细化管理的需求日益增加,依赖数据分析的决策支持变得至关重要。现场数据采集,如机采井...

Global site tag (gtag.js) - Google Analytics