`
tanzek
  • 浏览: 52944 次
  • 性别: Icon_minigender_1
  • 来自: 湖南
社区版块
存档分类
最新评论

数据挖掘相关

阅读更多

什么是规则?就是一个条件和一个结果的和:If condition then result。实际中有用的往往是结果中只有一个元素的情况。

关联规则(association rule)挖掘技术用于发现数据库中属性之间的有趣联系。和传统的产生式规则不同,关联规则可以有一个或多个输出,同时一个规则的输出属性可以是另一个规则的输入属性。关联规则分析有时也叫购物篮分析,是因为它可以找寻出潜在的令人感兴趣的所有的产品组合。由此,有限数目的属性可能生成上百条规则。

关联规则的置信度、支持度和兴趣度:

元组

出现频率

A

45%

B

42.5%

C

40%

A和B

25%

A和C

20%

B和C

15%

A和B和C

5%


支持度:就是一个元组在整个数据库中出现的概率。如上面的例子中S(A)=0.45

置信度:它是针对规则而言的。对于一般的规则,它的可信度=p(condition and result)/p(condition)。例如有如下规则:If B and C then A。则它的置信度是:p(B and C and A)/p(B and C)=5%/15%=0.33

提高率(或者叫兴趣度):对于上面的一个规则,我们可以发现,当我们从从数据库中直接取A的时候,概率是45%;可在我们的规则中,取到A的概率却只有33.3%。显然,这种情况是我们不愿意见到的,我们应该略去这样的一些规则。所以我们引入了兴趣度的概念,具体的公式如下:兴趣度=p(condition and result)/p(condition)*p(result)。当兴趣度大于1的时候,这条规则就是比较好的;当兴趣度小于1的时候,这条规则就是没有很大意义的。兴趣度越大,规则的实际意义就越好。

克服实际应用中数据量暴大的问题。当数据量增大时,要考虑的元素组就增长的很快了。

关联规则的优缺点:
优点:
·它可以产生清晰有用的结果。
·它支持间接数据挖掘。
·可以处理变长的数据。
·它的计算的消耗量是可以预见的。

缺点:
·当问题变大时,计算量增长得厉害。
·难以决定正确的数据。
·容易忽略稀有的数据。

分享到:
评论

相关推荐

    数据挖掘 相关理论解释

    数据挖掘相关理论 以及案例 等相关情况的介绍

    搜索引擎及网络数据挖掘相关技术研究.pdf

    搜索引擎和网络数据挖掘技术是当前信息技术研究领域的热点和重点。随着互联网的迅速发展,大数据和数据挖掘技术对于搜索引擎功能的改进起着至关重要的作用。本文将从数据挖掘技术的基础概念、应用范围、发展以及在...

    数据挖掘相关资料数据挖掘相关资料

    数据挖掘是一种从海量数据中抽取有价值知识的技术,它在当今信息化社会中扮演着至关重要的角色。随着信息技术的进步,大量的数据被收集并存储在数据库中,形成了所谓的“数据海洋”。然而,这些数据本身并不能直接...

    数据挖掘相关材料

    总的来说,这份"数据挖掘相关材料"不仅涵盖了数据挖掘的基础理论,还可能提供实践经验,是初学者和进阶者提升技能的理想资源。通过深入学习和实践,你可以更好地掌握数据挖掘技术,从而在大数据时代中发掘出有价值的...

    数据挖掘相关图书

    在这个压缩包中,我们有四本关于数据挖掘和相关领域的图书,这些书籍将帮助读者深入理解这个领域。 首先,"统计学习方法"是李航教授的著作,这本书是数据挖掘和机器学习领域的经典教材。书中详细介绍了统计学习的...

    数据挖掘相关论文收藏合集

    多媒体数据集中的数据挖掘:系统框架和方法 基于数据挖掘的模块评估法 基于数据挖掘技术的高校管理决策支持系统 空间数据挖掘技术 空间数据挖掘与发展趋势研究 数据挖掘及其应用研究回顾 数据挖掘技术及其应用简介 ...

    数据挖掘相关课件

    总的来说,这个数据挖掘相关课件系列提供了从基础到高级的全面教程,适合对生物统计学和数据挖掘感兴趣的学者。通过学习这些内容,不仅可以掌握数据挖掘的技术,还能深入了解如何将它们应用于解决实际的生物学问题。

    web数据挖掘相关论文

    web数据挖掘相关论文,以及他在社交网络中的社交研究

    中医信息化与数据挖掘相关文献的计量分析.pdf

    这份文献《中医信息化与数据挖掘相关文献的计量分析》对2000年至2017年期间发表的关于中医信息化和数据挖掘的文献进行了系统的计量分析,其目的是为了分析中医信息化与数据挖掘研究的状况,并为后续的研究提供参考。...

    数据挖掘 数据集

    在这个特定的上下文中,我们关注的是与数据挖掘相关的一系列数据集。 数据挖掘数据集通常是精心挑选和准备的,它们可能来自各种来源,如公开的数据库、研究项目、商业交易或社交媒体。这些数据集可以帮助研究人员和...

    WEB数据挖掘相关术语整理

    Web数据挖掘是指通过应用数据挖掘技术对互联网上的海量数据进行分析,提取有价值信息的过程。它不仅仅局限于传统的数据挖掘算法,还涉及到计算机网络、数据库与数据仓库、人工智能、信息检索、可视化和自然语言理解...

    数据挖掘相关资料.pptx

    数据挖掘相关资料.pptx

    2017数据挖掘相关论文

    数据挖掘是信息技术领域的一个关键分支,它涉及到从大型数据集中发现有价值信息的过程。2017年的数据挖掘研究尤其关注了两个主要方面:数据清洗和实践分析。这些论文集为理解这一时期的最新技术和方法提供了宝贵的...

    数据挖掘相关的信息入门资料

    数据挖掘相关的信息入门资料

    r语言数据挖掘相关书籍整理

    r语言数据挖掘相关书籍整理,包括的书籍有: 统计建模与R软件.pdf R语言实战(中文完整版).pdf R-导论中文版.pdf R语言颜色表.pdf shiny-chinese.pdf ggplot2-cheatsheet.pdf 可以用来学习概率统计及数据挖掘相关...

    数据挖掘:概念与技术 第二版 PDF

    7. **数据库和XML查询**:简要介绍与数据挖掘相关的数据库管理系统,以及XML查询语言XQuery和XPath,它们在处理结构化和半结构化数据时起到关键作用。 8. **多维和度量数据结构**:讨论多维数据模型,如星型和雪花...

Global site tag (gtag.js) - Google Analytics