- 浏览: 52589 次
- 性别:
- 来自: 湖南
最新评论
什么是规则?就是一个条件和一个结果的和:If condition then result。实际中有用的往往是结果中只有一个元素的情况。
关联规则(association rule)挖掘技术用于发现数据库中属性之间的有趣联系。和传统的产生式规则不同,关联规则可以有一个或多个输出,同时一个规则的输出属性可以是另一个规则的输入属性。关联规则分析有时也叫购物篮分析,是因为它可以找寻出潜在的令人感兴趣的所有的产品组合。由此,有限数目的属性可能生成上百条规则。
关联规则的置信度、支持度和兴趣度:
元组 |
出现频率 |
A |
45% |
B |
42.5% |
C |
40% |
A和B |
25% |
A和C |
20% |
B和C |
15% |
A和B和C |
5% |
支持度:就是一个元组在整个数据库中出现的概率。如上面的例子中S(A)=0.45。
置信度:它是针对规则而言的。对于一般的规则,它的可信度=p(condition and result)/p(condition)。例如有如下规则:If B and C then A。则它的置信度是:p(B and C and A)/p(B and C)=5%/15%=0.33。
提高率(或者叫兴趣度):对于上面的一个规则,我们可以发现,当我们从从数据库中直接取A的时候,概率是45%;可在我们的规则中,取到A的概率却只有33.3%。显然,这种情况是我们不愿意见到的,我们应该略去这样的一些规则。所以我们引入了兴趣度的概念,具体的公式如下:兴趣度=p(condition and result)/p(condition)*p(result)。当兴趣度大于1的时候,这条规则就是比较好的;当兴趣度小于1的时候,这条规则就是没有很大意义的。兴趣度越大,规则的实际意义就越好。
克服实际应用中数据量暴大的问题。当数据量增大时,要考虑的元素组就增长的很快了。
关联规则的优缺点:
优点:
·它可以产生清晰有用的结果。
·它支持间接数据挖掘。
·可以处理变长的数据。
·它的计算的消耗量是可以预见的。
缺点:
·当问题变大时,计算量增长得厉害。
·难以决定正确的数据。
·容易忽略稀有的数据。
发表评论
-
项目开发日志杂记
2009-05-04 13:05 966开发日志 0:32 2008-9-18 1、中文 ... -
笔记本维护故障一则
2007-03-18 23:40 706唉呀,今天真的是羞死 ... -
多Web服务器的80端口访问
2007-03-23 11:42 1467写这篇文章,源自于自己的一个需求。这几天一校园WEB站点因为域 ... -
[转]Windows系统文件详细解说
2007-04-02 23:38 621详细的介绍了WINDOWS系统文件的用途,我想各位保存一份以后 ... -
关于Windows文件共享服务的一些问题
2007-04-02 23:44 2514[问题引出]:我刚安装windows2003时,Compute ... -
MS Project 2003的一个问题
2007-04-03 18:04 1048[问题引出]:刚装完MS Project 2003,一运行就出 ... -
IBM xSeries服务器安装内存一则
2007-04-04 00:55 818部门进购IBM xSeries 225服务器已经达三年之久了, ... -
JAVA与蓝牙起步(Getting Started with Java and Bluetooth)
2007-04-26 00:39 1507栈初始化在你做任何事之前,你需要初始化你的栈。记住,栈是一个用 ... -
Windows 2000下的远程桌面工具
2007-04-28 18:10 1032在Windows XP之后的系统中都会在“系统”属性中可以设置 ... -
最近在看的书
2007-06-25 03:17 6531、JSP网络开发技术与整合应用 ... -
想看的书---<<开发自己的搜索引擎---Lucene 2.0 + Heritrix>>
2007-06-26 21:47 1729开发自己的搜索引擎---Lucene 2.0 + Heritr ... -
不要用浏览器来测试
2007-07-03 11:02 918进行B/S系统编程,大概浏览器就是最直接的测试程序是否正确的方 ... -
Big-Endian And Little-Endian
2007-07-07 11:32 876今天老师给我们复习单片机,出了一个题目,就这个字节存储顺序搞得 ... -
MySQL的中文问题
2007-07-08 21:12 721唉,看到网上这么多的关于MySQL中文编码的问题。今天自己碰到 ... -
[转]RAW FileSystem Recovery
2007-07-11 09:09 993To know ho ... -
关于人工神经网络中的M-P模型的一点疑问
2007-08-08 22:31 932人工神经网络M-P模型构成一个逻辑非模型,从书中抄下来的,如下 ... -
JOONE(Java Object-Oriented Network Engine)使用初探
2007-09-30 16:03 12701 /**/ ... -
OpenGL in VC++
2008-01-19 00:30 1003首先看一个简单的例子: 1 #include <wind ... -
VC++中的ON_COMMAND_RANGE宏
2008-01-26 13:51 1777VC++中的ON_COMMAND_RANGE宏 ... -
[转] 软件企业以人为本的16项措施
2008-05-25 09:19 726软件企业以人为本的16项措施 ...
相关推荐
数据挖掘相关理论 以及案例 等相关情况的介绍
搜索引擎和网络数据挖掘技术是当前信息技术研究领域的热点和重点。随着互联网的迅速发展,大数据和数据挖掘技术对于搜索引擎功能的改进起着至关重要的作用。本文将从数据挖掘技术的基础概念、应用范围、发展以及在...
数据挖掘是一种从海量数据中抽取有价值知识的技术,它在当今信息化社会中扮演着至关重要的角色。随着信息技术的进步,大量的数据被收集并存储在数据库中,形成了所谓的“数据海洋”。然而,这些数据本身并不能直接...
总的来说,这份"数据挖掘相关材料"不仅涵盖了数据挖掘的基础理论,还可能提供实践经验,是初学者和进阶者提升技能的理想资源。通过深入学习和实践,你可以更好地掌握数据挖掘技术,从而在大数据时代中发掘出有价值的...
在这个压缩包中,我们有四本关于数据挖掘和相关领域的图书,这些书籍将帮助读者深入理解这个领域。 首先,"统计学习方法"是李航教授的著作,这本书是数据挖掘和机器学习领域的经典教材。书中详细介绍了统计学习的...
多媒体数据集中的数据挖掘:系统框架和方法 基于数据挖掘的模块评估法 基于数据挖掘技术的高校管理决策支持系统 空间数据挖掘技术 空间数据挖掘与发展趋势研究 数据挖掘及其应用研究回顾 数据挖掘技术及其应用简介 ...
总的来说,这个数据挖掘相关课件系列提供了从基础到高级的全面教程,适合对生物统计学和数据挖掘感兴趣的学者。通过学习这些内容,不仅可以掌握数据挖掘的技术,还能深入了解如何将它们应用于解决实际的生物学问题。
web数据挖掘相关论文,以及他在社交网络中的社交研究
这份文献《中医信息化与数据挖掘相关文献的计量分析》对2000年至2017年期间发表的关于中医信息化和数据挖掘的文献进行了系统的计量分析,其目的是为了分析中医信息化与数据挖掘研究的状况,并为后续的研究提供参考。...
在这个特定的上下文中,我们关注的是与数据挖掘相关的一系列数据集。 数据挖掘数据集通常是精心挑选和准备的,它们可能来自各种来源,如公开的数据库、研究项目、商业交易或社交媒体。这些数据集可以帮助研究人员和...
Web数据挖掘是指通过应用数据挖掘技术对互联网上的海量数据进行分析,提取有价值信息的过程。它不仅仅局限于传统的数据挖掘算法,还涉及到计算机网络、数据库与数据仓库、人工智能、信息检索、可视化和自然语言理解...
数据挖掘相关资料.pptx
数据挖掘是信息技术领域的一个关键分支,它涉及到从大型数据集中发现有价值信息的过程。2017年的数据挖掘研究尤其关注了两个主要方面:数据清洗和实践分析。这些论文集为理解这一时期的最新技术和方法提供了宝贵的...
数据挖掘相关的信息入门资料
r语言数据挖掘相关书籍整理,包括的书籍有: 统计建模与R软件.pdf R语言实战(中文完整版).pdf R-导论中文版.pdf R语言颜色表.pdf shiny-chinese.pdf ggplot2-cheatsheet.pdf 可以用来学习概率统计及数据挖掘相关...
7. **数据库和XML查询**:简要介绍与数据挖掘相关的数据库管理系统,以及XML查询语言XQuery和XPath,它们在处理结构化和半结构化数据时起到关键作用。 8. **多维和度量数据结构**:讨论多维数据模型,如星型和雪花...