`

数据挖掘能做什么

阅读更多

数据挖掘不仅能对过去的数据进行查询和遍历,并且能够对将来的趋势和行为进行预测,并自动探测以前未发现的模式,从而很好地支持人们的决策。被挖掘出来的信息,能够用于信息管理、查询处理、决策支持、过程控制以及许多其它应用。数据挖掘按其功能划分主要包括以下几类:
    (1) 分类

    分类是数据挖掘中应用的最多的方法。分类是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。一个类的内涵描述分为特征性描述和区别性描述。特征性描述是对类中对象的共同特征的描述,区别性描述是对两个或多个类之间区别的描述。

    (2) 关联分析

    若两个或多个数据项的取值重复出现且概率很高时,它就存在着某种关联,可以建立起这些数据项的关联规则。关联分析的目的是找出数据库中隐藏的关联网。在大型数据库中,这种关联规则是很多的,一般用“支持度”,“可信度”两个阈值来淘汰那些无用的关联规则。

    (3) 聚类

    数据库中的数据可分为一系列有意义的子集或称为类。在同一类别中,个体之间的距离较小,而不同类别的个体之间的距离偏大。聚类增强了人们对客观现实的认识,即通过聚类建立宏观概念。

    (4)序列模式

    通过时间序列搜索出重复发生概率较高的模式,这里强调时间序列对挖掘结果的影响。

    (5)偏差检验

    数据库中的数据常有一些异常记录,从数据库中检测出这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照之间的差别。

    (6) 预测

    预测是利用历史数据找出变化规律,即建立模型,并用此模型来预测未来数据的种类、特征等。

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/chl033/archive/2008/10/19/3102702.aspx

分享到:
评论

相关推荐

    MATLAB技术论坛数据挖掘公开课 01.MATLAB数据挖掘概论 共12页.pdf

    2.3 数据挖掘能做什么? 4 3 分类 5 3.1 什么是分类? 5 3.2 应用实例有哪些? 5 4 估计(回归) 5 4.1 何为回归估计? 5 4.2 应用实例 6 5 组合和关联法则 6 6 聚类 7 6.1 定义 7 6.2 聚类与分类的区别? 7 6.3 ...

    简单的数据挖掘简明教程

    #### 三、数据挖掘能做什么? 数据挖掘能做的主要包括六种不同的分析方法: 1. **分类(Classification)**:通过对已知类别的训练数据进行学习,建立分类模型,用于对新数据进行分类。 - 示例:根据客户资料将...

    XML在Web数据挖掘中的应用.pdf

    1. 了解数据挖掘能做什么,即数据挖掘是从大量的数据中发现和提取潜在信息,并对数据仓库进行自动分析。 2. 定义数据挖掘,即数据挖掘是从数据库、数据仓库或其他信息库中提取有效、新颖、潜在有用的模式的过程。 3....

    数据仓库与数据挖掘课程实验

    ### 数据仓库与数据挖掘课程实验知识点解析 ...此外,还能熟悉并掌握至少一种专用数据挖掘软件,从而具备处理和分析大规模数据集的能力。这对于学习数据仓库和数据挖掘的学生来说是非常宝贵的实践经验。

    使用weka做数据挖掘开发

    《使用Weka做数据挖掘开发》 在数据挖掘领域,Weka是一款广泛使用的开源工具,它提供了丰富的数据预处理、分类、聚类、关联规则等算法,并且支持通过API进行二次开发。本文主要聚焦于如何利用Weka进行数据挖掘开发...

    数据挖掘聚类分析大作业

    数据挖掘的代码是用C++写的,包含了三个算法 k-means ,CURE,DBSCAN,分别对三个数据集做处理,分别为小麦种子,股票数据,糖尿病患者。另外还有其他两个算法,代码在cplusplus文件里面,但是没有用于数据分析,有...

    鸢尾花数据挖掘

    这个“鸢尾花数据挖掘”案例虽然简单,但对于初学者来说,它提供了很好的实践平台,能帮助理解和掌握数据挖掘的基本流程和分类算法的运用。同时,它也可以作为检验新算法或技术的有效性的小型实验场。

    Web日志数据挖掘模型研究

    【Web日志数据挖掘模型研究】是针对海量的Web日志数据进行分析和挖掘的科研领域,旨在通过解析用户访问模式来提升服务质量。在信息爆炸的时代,了解用户需求成为企业竞争的关键,而Web日志正是获取用户行为的重要...

    alibaba数据挖掘150道试题

    - **问题**:预测模型是用来做什么的? - **答案**: - A:探索性数据分析 - B:模型 - C:预测模型 - D:寻找模式 - **解析**:预测模型是基于已知数据来预测未知数据的一种方法。它通过学习输入变量与输出变量...

    数据挖掘讲义

    PPT可以帮助我们清晰地呈现数据挖掘的结果,使非技术人员也能理解复杂的分析过程和发现。因此,讲义中可能包含使用PPT设计数据挖掘项目报告的技巧和最佳实践。 总而言之,东北大学的这份“数据挖掘讲义”是一份宝贵...

    数据挖掘与分析的“炒菜”类比法教学.pdf

    这种教学方式不仅能够提高学生的学习兴趣,还能帮助他们更好地记忆和理解数据挖掘与分析中的各个步骤及其相互之间的联系,从而达到良好的教学效果。 类比教学法在许多教学领域已经取得了积极的成效,它的核心在于...

    面向程序员的数据挖掘指南 文字版+配套代码+data

    这是一本用于学习基本数据挖掘知识的书籍。大部分关于数据挖掘的书籍都着重于讲解理论知识,难以理解,让人望而却步。...书中有一系列展示数据挖掘技术的实例,因此在阅读完本书后,你就能掌握这些技术了。

    数据仓库与数据挖掘课后答案(陈志泊著)清华大学出版社[归类].pdf

    数据仓库与数据挖掘 数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。数据仓库技术的发展包括数据抽取、存储管理、数据表现和方法论等方面。 数据仓库的概念与体系结构: 1. 数据仓库...

    数据仓库的数据挖掘作业.zip

    在这个“数据仓库的数据挖掘作业.zip”压缩包中,我们可以推测它包含了一个关于使用数据仓库进行数据挖掘的项目。这个项目可能涉及了从UCI(University of California, Irvine)机器学习仓库获取的UNS(the ...

    数据仓库与数据挖掘2018-2019年题目,复习资料.zip

    数据仓库与数据挖掘是计算机科学领域中的重要学科,它们在现代商业智能和决策支持系统中发挥着关键作用。本资料集包含了山东大学软件学院在2018年至2019年间的数据仓库与数据挖掘课程的相关题目和复习资料,旨在帮助...

    基于数据挖掘的学生成绩分析系统

    【基于数据挖掘的学生成绩分析系统】 在教育领域,数据挖掘技术正逐渐成为一种强大的工具,用于深入了解学生的学习行为和成就。本项目名为“基于数据挖掘的学生成绩分析系统”,其主要目的是利用C4.5决策树算法来...

    基于数据挖掘技术的专利分析及实证研究.pdf

    在专利数据挖掘过程中,需要关注的几个核心问题是:数据挖掘要解决什么问题,如何准备数据,以及应该使用哪些分析算法。专利数据挖掘的一般流程可以简化为三个阶段:数据准备、数据挖掘和结果解释与评价。在本文中,...

    韩佳炜数据挖掘课件1-7章

    数据挖掘是一种从海量数据中提取有价值知识的过程,它结合了计算机科学、统计学和机器学习等多学科技术。韩佳炜的数据挖掘课件是针对这一主题的深入学习资源,涵盖了从基础理论到实际应用的广泛内容。以下是根据课件...

    快速数据挖掘数据分析实战RapidMiner工具应用第7章 数据预处理V1.1.pdf

    在数据挖掘领域,数据预处理是至关重要的步骤,其目的是提高数据的质量,确保数据能够更好地适应后续的挖掘技术或...熟练掌握这些工具和方法,不仅能提高数据准备工作的效率,还能显著提升数据挖掘项目的准确性和效果。

    基于多目标决策的数据挖掘方法评估与应用.pdf

    综合以上内容,多目标决策在数据挖掘方法中的应用为解决问题提供了更为复杂和深入的分析工具,尤其是当涉及到需要从大量数据中提取有用信息和做决策时。通过多目标决策,数据挖掘可以在多个目标间权衡,找出最佳的...

Global site tag (gtag.js) - Google Analytics