`
liyonghui160com
  • 浏览: 775998 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

数据挖掘算法之-关联规则挖掘(Association Rule)(购物篮分析)

阅读更多

 

 

 

1.置信度(confidence)

定义:设W中支持物品集A的事务中,有c %的事务同时也支持物品集B,c %称为关联规则AB 的可信度。

通俗解释:简单地说,可信度就是指在出现了物品集A 的事务T 中,物品集B 也同时出现的概率有多大。

实例说明:上面所举的圆珠笔和笔记本的例子,该关联规则的可信度就回答了这样一个问题:如果一个顾客购买了圆珠笔,那么他也购买笔记本的可能性有多大呢?在上述例子中,购买圆珠笔的顾客中有65%的人购买了笔记本,信度是65%。

概率描述:物品集A对物品集B的置信度confidence(A==>B)=P(B|A)=N(AB)/N(A)

2.支持度(support)

定义:设W 中有s %的事务同时支持物品集A 和B,s %称为关联规则A→B 的支持度。支持度描述了A 和B 这两个物品集的并集C 在所有的事务中出现的概率有多大。

通俗解释:简单地说,A==>B的支持度就是指物品集A和物品集B同时出现的概率。

实例说明:某天共有1000 个顾客到商场购买物品,其中有150个顾客同时购买了圆珠笔和笔记本,那么上述的关联规则的支持度就是15%。

概率描述:物品集A对物品集B的支持度support(A==>B)=P(A n B)=N(AB)/N()

3.期望置信度(Expected confidence

定义:设W 中有e %的事务支持物品集B,e %称为关联规则A→B 的期望可信度度。

通俗解释:期望可信度描述了在没有任何条件影响时,物品集B 在所有事务中出现的概率有多大。

实例说明:如果某天共有1000 个顾客到商场购买物品,其中有250 个顾客购买了圆珠笔,则上述的关联规则的期望可信度就是25 %。

概率描述:物品集A对物品集B的期望置信度为support(B)=P(B)

4.提升度(lift)

定义:提升度是可信度与期望可信度的比值

通俗解释:提升度反映了“物品集A的出现”对物品集B的出现概率发生了多大的变化。

实例说明:上述的关联规则的提升度=65%/25%=2.6

概率描述:物品集A对物品集B的期望置信度为lift(A==>B)=confidence(A==>B)/support(B)=p(B|A)/p(B)=N(AB)*N()/N(A)*N(B)

总之,可信度是对关联规则的准确度的衡量,支持度是对关联规则重要性的衡量。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。有些关联规则可信度虽然很高,但支持度却很低,说明该关联规则实用的机会很小,因此也不重要。

 

在关联规则挖掘中,满足一定最小置信度以及支持度的集合成为频繁集(frequent itemset),或者强关联。关联规则挖掘则是一个寻找频繁集的过程。

 



 
  
如上图中数据库D,包含4个事务,项集I={I1,I2,I3,I4,I5},分析关联规则:I1=>I4,事务1、4包含I1,事务4同时包含I1和I4。


支持度support=1/4=25%(1个事务同时包含I1和I4,共有4个事务)指 在所有交易记录中有25%的交易记录同时包含I1和I4项目


置信度confidence=1/2=50%(1个事务同时包含I1和I4,2个事务包含I1)指 50%的顾客在购买I1时同时还会购买I4

 

 期望置信度 Expected confidence=2/4=50% 两个事务包含了I4 总顾客数为4

 

提升度lift(I1==>I4)= 50%/50%=1

分享到:
评论

相关推荐

    关联规则在购物篮数据分析中的应用-数据挖掘.doc

    关联规则挖掘算法(Association Rule Mining Algorithm)是购物篮分析中的一种重要技术。该算法可以自动发现购物篮数据中的相关关系,并将其转换为有用的营销信息。常见的关联规则挖掘算法包括Apriori算法、Eclat...

    华为大数据HCIE参考资料:关联规则(Association Rule).pptx

    关联规则在大数据分析中是一种重要的数据挖掘技术,它主要用于揭示数据集中不同元素之间的关系。华为大数据HCIE参考资料中深入介绍了关联规则的相关知识,这在理解并应用大数据解决方案时至关重要。 关联规则的核心...

    粒子群优化算法在关联规则挖掘中的研究综述.pdf

    PSO在不同领域的应用展示了其在关联规则挖掘上的优势,如在购物篮分析中发现消费者的购买习惯,金融领域中预测股票市场趋势,医疗领域中识别疾病相关因素,工业生产中优化生产流程,风险评估中识别潜在风险因素。...

    基于矩阵的关联规则挖掘算法.pdf

    最初,这一概念是为了解决零售行业的购物篮分析问题,通过发现不同商品之间的关联规则来优化商品布局、库存管理等。随着技术的发展,关联规则挖掘的应用范围不断扩大,如今已广泛应用于基因分析、医疗保健、金融证券...

    许多数据挖掘算法.rar

    3. 关联规则学习(Association Rule Learning):如Apriori算法和FP-Growth,用于发现项集之间的频繁模式,例如购物篮分析中的“买了A的人常常也买了B”。 4. 序列挖掘(Sequential Pattern Mining):用于发现数据...

    云计算数据挖掘算法

    6. **关联规则(Association Rule)**:关联规则学习用于发现数据集中的“如果-那么”规则,例如购物篮分析。在云环境中,它可以帮助商家发现商品之间的购买关联,提升销售策略。 7. **时间序列分析(Time Series)...

    关联规则数据挖掘.doc

    例如,沃尔玛的“尿布与啤酒”案例就是通过挖掘购物篮数据,发现了这两者之间的关联,从而调整了商品布局,提升了销售额。此外,关联规则还可以用于推荐系统,根据用户的购买历史推荐可能感兴趣的商品。 在数据挖掘...

    数据挖掘课件:第9章 关联规则.pdf

    【关联规则挖掘】是实际应用这一理论的过程,它在交易数据中寻找频繁模式,如购物篮分析。挖掘出的关联规则可用于交叉销售、产品目录设计等商业活动。例如,发现购买面包的顾客有很大比例会同时购买牛奶,商家可以...

    04-Association_Rule_Mining.rar_Rule Mining_data_association

    标题中的“04-Association_Rule_Mining.rar_Rule Mining_data_association”表明这是一个关于关联规则挖掘的主题,可能是一个教学资料或研讨会的压缩包。描述中的“data mining presentation 4”提示我们这可能是...

    数据挖掘在校园超市商品销售中的应用.pdf

    关联规则挖掘算法是一种常用的数据挖掘技术,旨在挖掘数据之间的相互关系,用于从大量数据中找出有价值的数据项之间的关联规则。关联规则反映的是事物之间的相互依存性和关联性,比如通过购物篮分析,可以发现哪些...

    数据挖掘apriori关联规则

    数据挖掘是一种从大量数据中发现有价值模式的过程,而Apriori关联规则是数据挖掘领域中的一个经典算法,尤其在市场篮子分析、购物行为研究等方面应用广泛。Apriori算法的核心思想是通过频繁项集挖掘来找出具有强关联...

    Oracle 10g数据挖掘示例代码

    3. **关联规则学习(Association Rule Learning)**:这种方法用于发现项集之间的频繁模式,如购物篮分析。Apriori或FP-Growth算法可以用于找出“如果购买了A,那么很可能也会购买B”的关系。示例代码可能包含创建...

    AR.rar_关联规则挖掘

    APRIOR算法是关联规则挖掘中最经典的算法之一,它的目标是从大量交易数据中找出频繁出现的项集,并在此基础上生成强关联规则。 关联规则的基本形式是"A → B",其中A和B是项集,→表示如果A发生,那么B也倾向于发生...

    Apriori关联性分析python实现(含数据集)

    Apriori关联规则挖掘是一种经典的、基于频繁项集的挖掘算法,主要用于发现数据集中隐藏的有趣关系,如购物篮分析中的商品组合。Python作为一种强大的数据分析工具,提供了多种库来实现Apriori算法,使得非专业程序员...

    ugeetunu.zip_association rule

    Apriori算法是关联规则挖掘中最经典的算法之一,由R Agrawal和R Srikant于1994年提出,主要用于购物篮分析。 关联规则通常表示为:如果A发生,那么B也会发生,其中A和B是数据集中不同的项目或项集。在本案例中,...

    Apriori-association-rule-mining:使用apriori算法设计给定数据集的关联规则挖掘模型

    关联规则挖掘不仅限于零售数据分析,还可以应用于多种场景,如医学诊断、网络日志分析等。通过调整支持度和置信度阈值,我们可以探索不同强度的关系,从而为业务决策提供依据。 总结起来,Apriori算法是关联规则...

    数据挖掘技术在会计管理与分析的实用性研究.pdf

    3. 关联规则分析(Association Rule Analysis):用于发现大量数据项之间有趣的关系,比如在购物篮分析中,它可以帮助分析哪些产品经常一起被购买。在会计中,关联规则可以用于挖掘财务报表中不同项目之间的关联性,...

    数据挖掘十大经典算法

    7. **关联规则学习(Association Rule Learning)**: 通过找出项集之间的频繁模式,如购物篮分析中的“购买A的人也常购买B”。Apriori和FP-Growth是两种常用的关联规则挖掘算法。 8. **主成分分析(Principal ...

    基于数据挖掘的用户信息分析构件系统.pdf

    - **关联规则学习(Association Rule Learning)**:用于发现大量数据中不同项之间的有趣关系,常用于购物篮分析。 - **预测建模(Predictive Modeling)**:建立模型来预测未来或未知数据点的值。 ### 行业数据在...

Global site tag (gtag.js) - Google Analytics