`
wsql
  • 浏览: 11887329 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

Apriori算法

 
阅读更多
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
  该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
  (1) L1 = find_frequent_1-itemsets(D);
  (2) for (k=2;Lk-1 ≠Φ ;k++) {
  (3) Ck = apriori_gen(Lk-1 ,min_sup);
  (4) for each transaction t ∈D{//scan D for counts
  (5) Ct = subset(Ck,t);//get the subsets of t that are candidates
  (6) for each candidate c ∈ Ct
  (7) c.count++;
  (8)}
  (9) Lk ={c ∈ Ck|c.count≥min_sup}
  (10)}
  (11) return L= ∪ k Lk;
  可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点。
  流程图如下:
  
Apriori流程图(bytrue制作)

Apriori流程图(bytrue制作)


Apriori算法的应用

  经典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。
  Apriori算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快的求出各种产品之间的价格关系和它们之间的影响。通过数据挖掘,市场商人可以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一些老字型大小的零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。
  Apriori算法应用于网络安全领域,比如时候入侵检测技术中。早期中大型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性能测试或计费,因此对攻击检测提供的有用信息比较少。它通过模式的学习和训练可以发现网络用户的一场行为模式。采用作用度的Apriori算法削弱了Apriori算法的挖掘结果规则,是网络入侵检测系统可以快速的发现用户的行为模式,能够快速的锁定攻击者,提高了基于关联规则的入侵检测系统的检测性。
  Apriori算法应用于高校管理中。随着高校贫困生人数的不断增加,学校管理部门资助工作难度也越加增大。针对这一现象,提出一种基于数据挖掘算法的解决方法。将关联规则的Apriori算法应用到贫困助学体系中,并且针对经典Apriori挖掘算法存在的不足进行改进,先将事务数据库映射为一个布尔矩阵,用一种逐层递增的思想来动态的分配内存进行存储,再利用向量求"与"运算,寻找频繁项集。实验结果表明,改进后的Apriori算法在运行效率上有了很大的提升,挖掘出的规则也可以有效地辅助学校管理部门有针对性的开展贫困助学工作。
  Apriori算法被广泛应用于移动通信领域。移动增值业务逐渐成为移动通信市场上最有活力、最具潜力、最受瞩目的业务。随着产业的复苏,越来越多的增值业务表现出强劲的发展势头,呈现出应用多元化、营销品牌化、管理集中化、合作纵深化的特点。针对这种趋势,在关联规则数据挖掘中广泛应用的Apriori算法被很多公司应用。依托某电信运营商正在建设的增值业务Web数据仓库平台,对来自移动增值业务方面的调查数据进行了相关的挖掘处理,从而获得了关于用户行为特征和需求的间接反映市场动态的有用信息,这些信息在指导运营商的业务运营和辅助业务提供商的决策制定等方面具有十分重要的参考价值。
分享到:
评论

相关推荐

    Apriori算法及其改进算法

    Apriori算法及其改进算法 Apriori算法是一种基本的频繁项目集算法,广泛应用于数据挖掘和机器学习领域。其基本原理是逐层搜索的迭代,通过不断地筛选和组合项sets来发现频繁项集。 Apriori算法的核心思想是基于...

    python apriori算法实例

    Apriori算法是关联规则学习中最经典的算法之一,它由R. Agrawal和R. Srikant于1994年提出。本实例将探讨如何在Python中实现Apriori算法,以发现给定数据集中频繁项集。 **Apriori算法的核心思想:** Apriori算法...

    数据挖掘apriori算法-java语言源码AR.zip

    Apriori算法是关联规则挖掘的代表性算法,十大数据挖掘算法之一,可见其重要性。它的主要作用是发现事物之间的内在联系。 Apriori算法的基本思想是通过对数据的多次扫描来计算项集的支持度,发现所有的频繁项集从而...

    关联规则挖掘算法apriori算法的实现

    Apriori算法是关联规则挖掘中最经典、最广泛使用的算法之一,由Rakesh Agrawal和Ramakrishnan Srikant在1994年提出。这个算法主要目标是从交易数据库中找出频繁项集和强关联规则。 首先,我们来理解“关联规则”。...

    Apriori算法matlab代码实现,带数据集和使用说明

    Apriori算法是一种经典的挖掘频繁项集和发现关联规则的数据挖掘方法,由R. Agrawal和R. Srikant于1994年提出。它主要用于从大规模交易数据库中找出有趣的、有意义的关联关系,如“购买尿布的顾客往往也会购买啤酒”...

    Apriori算法python实现含数据集

    在数据分析和数据挖掘领域,Apriori算法是一个经典且重要的概念。它主要用于发现数据库中物品集之间的关联规则,这些规则可以揭示项目之间的隐藏关系。在本篇内容中,我们将深入探讨Apriori算法的原理、Python实现...

    Apriori算法对购物篮进行关联分析-Apriori算法进行购物篮关联分析.rar

    Apriori算法对购物篮进行关联分析-Apriori算法进行购物篮关联分析.rar 大家好,出来乍到,看到好多高手分享自己的程序,我也想分享一下,做出自己的贡献。 虽然学MATLAB已经一年有余,但是一直忙着数学建模,对...

    APRIORI算法带数据集.rar_Apriori_Apriori算法_amountaps_matlab

    利用APRIORI算法找出频繁集,计算置信度与支持度,支持多种格式的数据

    Apriori算法优化策略[

    Apriori 算法 优化策略

    Apriori算法 java实现

    Apriori算法是一种经典的关联规则学习算法,最初由R Agrawal和R Srikant在1994年提出,用于发现数据库中的频繁项集和强关联规则。它基于一个核心理念:如果一个项集是频繁的,那么它的所有子集也必须是频繁的。这个...

    Apriori算法及其实现

    经典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程... 本文通过对Apriori算法的基本思想,挖掘出内含的数据关系,并实现Apriori算法。

    Apriori算法实现及实验报告

    Apriori算法是一种经典的关联规则学习算法,广泛应用于数据挖掘中的频繁项集发现。该算法由R. Agrawal和R. Srikant在1994年提出,主要用于找出数据库中项集之间的有趣关系,如购物篮分析,即发现哪些商品经常一起被...

    使用Apriori算法进行关联规则挖掘的实验报告与代码实现

    本实验报告主要聚焦于使用Apriori算法进行关联规则挖掘,这是由Rakesh Agrawal和Ramakrishnan Srikant在1994年提出的经典算法。此算法主要应用于零售数据分析,例如发现顾客购买商品之间的关联性。 Apriori算法的...

    Apriori算法参数含义

    Apriori算法参数含义 Apriori算法是一种常用的关联规则挖掘算法,它的参数设置对挖掘结果有着至关重要的影响。了解Apriori算法参数的含义对于提高关联规则挖掘的效果非常重要。 1. car参数:如果设为真,则...

    基于Apriori算法的关联规则挖掘系统的设计与实现_大数据apriori_关联规则_#大数据论文_Apriori算法_

    标题中的“基于Apriori算法的关联规则挖掘系统的设计与实现”揭示了本文的核心主题,主要探讨了如何利用Apriori算法在大数据环境下构建关联规则挖掘系统。关联规则挖掘是数据挖掘领域的一个重要方法,其目标是从大...

    Apriori 算法 实例

    Apriori算法是一种经典的关联规则学习算法,广泛应用于数据挖掘领域,特别是在市场篮子分析中。这个实例将向我们展示如何使用Apriori算法来发现数据中的频繁项集。在这个过程中,数据通常以文本文件的形式存储,每行...

    apriori算法vc++实现

    《Apriori算法在VC++中的实现及其在数据挖掘中的应用》 Apriori算法是一种经典的数据挖掘算法,主要用于关联规则学习,它由R. Agrawal和R. Srikant于1994年提出。该算法的核心思想是通过频繁项集的生成和剪枝过程来...

    c++实现关联规则Apriori算法

    Apriori算法是这一领域的经典算法,由Rakesh Agrawal和Ramyakrishnan Srikant于1994年提出,它的核心思想是基于频繁项集的性质来剪枝搜索空间,减少计算复杂性。 C++是一种广泛应用于系统编程、应用编程、游戏开发...

    Apriori算法实验报告

    Apriori算法实验报告 Apriori算法的Java代码实现和运行结果

    apriori算法求频繁项集和关联规则 mvc架构 java版

    标题"apriori算法求频繁项集和关联规则 mvc架构 java版"提及了两个主要概念:Apriori算法和MVC架构,并指明这是使用Java语言实现的。Apriori是一种经典的挖掘频繁项集和生成关联规则的数据挖掘算法,而MVC(Model-...

Global site tag (gtag.js) - Google Analytics