定义:设W中支持物品集A的事务中,有c %的事务同时也支持物品集B,c %称为关联规则A→B 的可信度。
通俗解释:简单地说,可信度就是指在出现了物品集A 的事务T 中,物品集B 也同时出现的概率有多大。
实例说明:上面所举的圆珠笔和笔记本的例子,该关联规则的可信度就回答了这样一个问题:如果一个顾客购买了圆珠笔,那么他也购买笔记本的可能性有多大呢?在上述例子中,购买圆珠笔的顾客中有65%的人购买了笔记本, 置信度是65%。
概率描述:物品集A对物品集B的置信度confidence(A==>B)=P(B|A)=N(AB)/N(A)
定义:设W 中有s %的事务同时支持物品集A 和B,s %称为关联规则A→B 的支持度。支持度描述了A 和B 这两个物品集的并集C 在所有的事务中出现的概率有多大。
通俗解释:简单地说,A==>B的支持度就是指物品集A和物品集B同时出现的概率。
实例说明:某天共有1000 个顾客到商场购买物品,其中有150个顾客同时购买了圆珠笔和笔记本,那么上述的关联规则的支持度就是15%。
概率描述:物品集A对物品集B的支持度support(A==>B)=P(A n B)=N(AB)/N()
定义:设W 中有e %的事务支持物品集B,e %称为关联规则A→B 的期望可信度度。
通俗解释:期望可信度描述了在没有任何条件影响时,物品集B 在所有事务中出现的概率有多大。
实例说明:如果某天共有1000 个顾客到商场购买物品,其中有250 个顾客购买了圆珠笔,则上述的关联规则的期望可信度就是25 %。
概率描述:物品集A对物品集B的期望置信度为support(B)=P(B)
定义:提升度是可信度与期望可信度的比值
通俗解释:提升度反映了“物品集A的出现”对物品集B的出现概率发生了多大的变化。
实例说明:上述的关联规则的提升度=65%/25%=2.6
概率描述:物品集A对物品集B的期望置信度为lift(A==>B)=confidence(A==>B)/support(B)=p(B|A)/p(B)=N(AB)*N()/N(A)*N(B)
总之,可信度是对关联规则的准确度的衡量,支持度是对关联规则重要性的衡量。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。有些关联规则可信度虽然很高,但支持度却很低,说明该关联规则实用的机会很小,因此也不重要。
在关联规则挖掘中,满足一定最小置信度以及支持度的集合成为频繁集(frequent itemset),或者强关联。关联规则挖掘则是一个寻找频繁集的过程。
如上图中数据库D,包含4个事务,项集I={I1,I2,I3,I4,I5},分析关联规则:I1=>I4,事务1、4包含I1,事务4同时包含I1和I4。
支持度support=1/4=25%(1个事务同时包含I1和I4,共有4个事务)指 在所有交易记录中有25%的交易记录同时包含I1和I4项目
置信度confidence=1/2=50%(1个事务同时包含I1和I4,2个事务包含I1)指 50%的顾客在购买I1时同时还会购买I4
期望置信度 Expected confidence=2/4=50% 两个事务包含了I4 总顾客数为4
提升度lift(I1==>I4)= 50%/50%=1
相关推荐
关联规则挖掘算法(Association Rule Mining Algorithm)是购物篮分析中的一种重要技术。该算法可以自动发现购物篮数据中的相关关系,并将其转换为有用的营销信息。常见的关联规则挖掘算法包括Apriori算法、Eclat...
关联规则在大数据分析中是一种重要的数据挖掘技术,它主要用于揭示数据集中不同元素之间的关系。华为大数据HCIE参考资料中深入介绍了关联规则的相关知识,这在理解并应用大数据解决方案时至关重要。 关联规则的核心...
PSO在不同领域的应用展示了其在关联规则挖掘上的优势,如在购物篮分析中发现消费者的购买习惯,金融领域中预测股票市场趋势,医疗领域中识别疾病相关因素,工业生产中优化生产流程,风险评估中识别潜在风险因素。...
最初,这一概念是为了解决零售行业的购物篮分析问题,通过发现不同商品之间的关联规则来优化商品布局、库存管理等。随着技术的发展,关联规则挖掘的应用范围不断扩大,如今已广泛应用于基因分析、医疗保健、金融证券...
3. 关联规则学习(Association Rule Learning):如Apriori算法和FP-Growth,用于发现项集之间的频繁模式,例如购物篮分析中的“买了A的人常常也买了B”。 4. 序列挖掘(Sequential Pattern Mining):用于发现数据...
6. **关联规则(Association Rule)**:关联规则学习用于发现数据集中的“如果-那么”规则,例如购物篮分析。在云环境中,它可以帮助商家发现商品之间的购买关联,提升销售策略。 7. **时间序列分析(Time Series)...
例如,沃尔玛的“尿布与啤酒”案例就是通过挖掘购物篮数据,发现了这两者之间的关联,从而调整了商品布局,提升了销售额。此外,关联规则还可以用于推荐系统,根据用户的购买历史推荐可能感兴趣的商品。 在数据挖掘...
【关联规则挖掘】是实际应用这一理论的过程,它在交易数据中寻找频繁模式,如购物篮分析。挖掘出的关联规则可用于交叉销售、产品目录设计等商业活动。例如,发现购买面包的顾客有很大比例会同时购买牛奶,商家可以...
标题中的“04-Association_Rule_Mining.rar_Rule Mining_data_association”表明这是一个关于关联规则挖掘的主题,可能是一个教学资料或研讨会的压缩包。描述中的“data mining presentation 4”提示我们这可能是...
关联规则挖掘算法是一种常用的数据挖掘技术,旨在挖掘数据之间的相互关系,用于从大量数据中找出有价值的数据项之间的关联规则。关联规则反映的是事物之间的相互依存性和关联性,比如通过购物篮分析,可以发现哪些...
数据挖掘是一种从大量数据中发现有价值模式的过程,而Apriori关联规则是数据挖掘领域中的一个经典算法,尤其在市场篮子分析、购物行为研究等方面应用广泛。Apriori算法的核心思想是通过频繁项集挖掘来找出具有强关联...
3. **关联规则学习(Association Rule Learning)**:这种方法用于发现项集之间的频繁模式,如购物篮分析。Apriori或FP-Growth算法可以用于找出“如果购买了A,那么很可能也会购买B”的关系。示例代码可能包含创建...
APRIOR算法是关联规则挖掘中最经典的算法之一,它的目标是从大量交易数据中找出频繁出现的项集,并在此基础上生成强关联规则。 关联规则的基本形式是"A → B",其中A和B是项集,→表示如果A发生,那么B也倾向于发生...
Apriori关联规则挖掘是一种经典的、基于频繁项集的挖掘算法,主要用于发现数据集中隐藏的有趣关系,如购物篮分析中的商品组合。Python作为一种强大的数据分析工具,提供了多种库来实现Apriori算法,使得非专业程序员...
Apriori算法是关联规则挖掘中最经典的算法之一,由R Agrawal和R Srikant于1994年提出,主要用于购物篮分析。 关联规则通常表示为:如果A发生,那么B也会发生,其中A和B是数据集中不同的项目或项集。在本案例中,...
关联规则挖掘不仅限于零售数据分析,还可以应用于多种场景,如医学诊断、网络日志分析等。通过调整支持度和置信度阈值,我们可以探索不同强度的关系,从而为业务决策提供依据。 总结起来,Apriori算法是关联规则...
3. 关联规则分析(Association Rule Analysis):用于发现大量数据项之间有趣的关系,比如在购物篮分析中,它可以帮助分析哪些产品经常一起被购买。在会计中,关联规则可以用于挖掘财务报表中不同项目之间的关联性,...
7. **关联规则学习(Association Rule Learning)**: 通过找出项集之间的频繁模式,如购物篮分析中的“购买A的人也常购买B”。Apriori和FP-Growth是两种常用的关联规则挖掘算法。 8. **主成分分析(Principal ...
- **关联规则学习(Association Rule Learning)**:用于发现大量数据中不同项之间的有趣关系,常用于购物篮分析。 - **预测建模(Predictive Modeling)**:建立模型来预测未来或未知数据点的值。 ### 行业数据在...