`
deepfuture
  • 浏览: 4410272 次
  • 性别: Icon_minigender_1
  • 来自: 湛江
博客专栏
073ec2a9-85b7-3ebf-a3bb-c6361e6c6f64
SQLite源码剖析
浏览量:80115
1591c4b8-62f1-3d3e-9551-25c77465da96
WIN32汇编语言学习应用...
浏览量:70284
F5390db6-59dd-338f-ba18-4e93943ff06a
神奇的perl
浏览量:103553
Dac44363-8a80-3836-99aa-f7b7780fa6e2
lucene等搜索引擎解析...
浏览量:286478
Ec49a563-4109-3c69-9c83-8f6d068ba113
深入lucene3.5源码...
浏览量:15037
9b99bfc2-19c2-3346-9100-7f8879c731ce
VB.NET并行与分布式编...
浏览量:67759
B1db2af3-06b3-35bb-ac08-59ff2d1324b4
silverlight 5...
浏览量:32276
4a56b548-ab3d-35af-a984-e0781d142c23
算法下午茶系列
浏览量:46065
社区版块
存档分类
最新评论

理解连续数据的离散化

 
阅读更多

在进行多属性的决策问题研究时,人工神经网络、模糊集、粗糙集、概念格、统计决策分析等算法经常出现,但是这些算法在处理问题时都会对现实作出这样或者那样的假设,比如:属性之间相互独立、服从某种分布规律,或者要求属性要尽可能的少,以便简化处理算法和计算过程,可是实际情况往往不是能够满足这些假设,粗集理论的出现为解决这一类的问题提供拉很好的方案,但是粗集又是基于集合理论,处理的对象是离散变量,不是实际中经常遇到的连续变量,于是如何将连续变量科学、合理的转变称为符合实际数据分布特征的离散量,就成为粗集开发技术的入门瓶颈,最近对于数据离散化处理技术进行了大量的资料搜集和分析,数据的离散化处理实际上就是根据某种相似性或者相异性来对数据进行分类,关键是相似性或者相异性如何定义,这是问题的难点,很多算法的不同本质上讲,其实就是在这一点上有所区别而已。分别利用K-均值和SOM网络实验了连续数据的离散化处理,发现原来SOM仅仅是受了很多约束条件的K-均值算法,并无吓人之处,不过SOM网络试验结果相当的令人满意,以下是实际效果:

**************对于数据库信息进行离散化处理******************

                                      原始数据10e6d4a1ce9.jpg

                                      离散化结果10e6d4a6c79.jpg

**********对于状态监测连续数据进行离散化处理****************

                                   原始数据10e6d4aeea0.jpg

                                      离散化处理结果10e6d4bd2ae.jpg

^_^,这个时候就可以开始神奇的粗集之旅了!

分享到:
评论

相关推荐

    一种基于熵的连续属性离散化算法1

    连续属性离散化可以理解为将连续的数据分布转化为有限数量的离散区间,这一过程对于简化数据结构、降低计算复杂度、提升学习效率及增强分类结果的可解释性均具有至关重要的作用。而在这项任务中,最为关键的是合理地...

    论文研究-连续属性离散化的MaxDiff方法.pdf

    1. 数据离散化的重要性:连续属性需要转换为离散属性,以便应用粗糙集理论等数据挖掘方法。 2. 粗糙集理论在数据挖掘中的应用:粗糙集理论通过定义等价关系,用上、下近似来描述数据集的边界,从而提取出数据中的...

    论文研究-基于对象分布的连续属性离散化方法.pdf

    连续属性离散化是将连续属性值转换为有限个区间或者离散值的过程,它是数据预处理的重要步骤。本文研究的离散化方法是基于对象分布的连续属性离散化方法,这种方法利用了信息系统中对象的分布特性,并结合了模糊聚类...

    连续型变量的离散化-监督与无监督原理

    本文主要探讨了在数据预处理阶段对连续型变量进行离散化的两种方法:监督离散化与无监督离散化,并基于斯坦福大学的一篇英文原版论文进行了深入分析。 #### 监督离散化 监督离散化是指在离散化过程中利用目标变量...

    数据预处理——连续变量离散化.rar

    在这个“数据预处理——连续变量离散化.rar”压缩包中,我们聚焦于一个关键环节:如何将连续变量转化为离散变量。这个过程在统计学和机器学习领域称为“离散化”或“分箱”。 离散化的主要目的是减少数据的复杂性,...

    bp.rar_数据离散化_粗糙集 BP

    首先,数据离散化是将连续数据转换为离散数据的过程,通常用于减少数据的复杂性、消除噪声、简化数据结构以及更好地揭示数据的内在规律。离散化方法主要包括等宽分箱、等频分箱、基于规则的离散化、聚类后的离散化等...

    案例数据集《机器学习-特征工程-数据离散化-会员数据2》

    数据离散化,又称分箱或binning,是指将连续数值型数据转化为离散的、定性的类别,这样可以减少噪声,降低数据复杂性,并有助于发现数据中的模式。离散化有多种方法,包括等宽分箱、等频分箱、基于规则的分箱(如...

    CACC.rar_CACC_Discretization_J2L_数据离散化

    数据离散化是数据预处理中的重要步骤,它将连续型数值数据转化为离散的类别数据,便于后续的数据分析和挖掘。"CACC.rar_CACC_Discretization_J2L_数据离散化"是一个关于数据离散化算法的资源包,主要包含CACC算法的...

    关于布尔逻辑用于粗糙集数据离散化理论的几篇好的论文

    在数据离散化过程中,粗糙集理论能够帮助我们将连续变量转换为离散类别,以便更好地进行分析和决策。 布尔逻辑在粗糙集数据离散化中的应用主要体现在以下几个方面: 1. 条件属性构造:在粗糙集模型中,条件属性...

    直方图进行数据离散化实验.docx

    数据离散化是数据分析中的重要步骤,目的是将连续或大范围的数据转化为有限的、互斥的类别,以简化数据处理,提高计算效率,同时也便于人类理解和解释。直方图是一种常用的数据离散化工具,它通过分箱技术将数据划分...

    Quantification.zip_image transform_数据离散化_离散面_面元_面成像

    2. **数据离散化**:在图像处理中,数据离散化是指将连续的像素值转化为离散的数值,通常是为了适应计算机处理。例如,将连续的灰度级映射到有限的灰度级集合,这被称为量化。在MATLAB中,可以使用round、fix或ceil...

    Pandas数据离散化原理及实例解析

    首先,我们来理解一下为什么需要进行数据离散化。在机器学习和统计分析中,连续属性往往包含大量的具体数值,这可能导致模型过于复杂,难以理解和解释。离散化通过将连续数据转换为有限数量的类别,可以降低模型的...

    电信设备-基于信息熵的连续属性数据无监督离散化方法.zip

    离散化,简单来说,就是将连续型的数据转换成离散的类别,以便更好地理解和分析数据。在电信设备数据中,连续属性如信号强度、通信频率等,可能具有复杂的分布,直接进行分析可能难度较大。无监督离散化方法则不依赖...

    网络游戏-基于BP网络和基尼系数定权重的用水数据离散化方法.zip

    数据离散化是将连续型数据转换为离散型数据的过程,通常用于降低数据复杂性、提高数据分析效率。在网络游戏的背景下,离散化可能用于将玩家的用水量转换为不同的等级或区间,便于统计分析和制定策略。例如,将用水...

    离散化(C++).pptx

    离散化是编程竞赛和算法设计中的一种常见技术,它主要应用于处理大量数据时,将无限或较大的数据空间转换为有限且更易于处理的范围。通过离散化,可以显著降低算法的时间复杂度,提高效率。离散化的概念可以从两个...

    离散化采样

    **离散化采样**是一种将连续信号转换为离散信号的过程,它在信号处理、数据分析等领域有着广泛的应用。对于初学者而言,理解离散化采样的基本原理和实现方法是非常重要的。 #### 二、离散化采样原理 1. **采样定理...

    数据源-数据可视化(七):Pandas香港酒店数据高级分析,涉及相关系数,协方差,数据离散化,透视表等精美可视化展示

    在本篇内容中,我们将深入探讨如何利用Python的Pandas库对香港酒店数据进行高级分析,包括计算相关系数、协方差,执行数据离散化以及创建透视表,这些都是数据分析中的核心技能。Pandas作为Python的数据处理库,以其...

    stefan_传质matlab_stefan_方程离散化_

    本资源提供了基于Matlab编程的Stefan问题求解程序,其核心在于应用多尺度(Multi-Scale)方法(MS方程)对连续方程进行离散化。多尺度方法是一种处理具有不同时间或空间尺度问题的有效工具,能够兼顾全局和局部特性...

Global site tag (gtag.js) - Google Analytics