`
wbj0110
  • 浏览: 1604110 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

关联分析(购物篮)与R语言

阅读更多

世界上的万事万物都有着千丝万缕的联系,我们要善于发现这种关联

关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同时购买的几率比较高?买了A产品的同时买哪个产品的几率比较高?可能是由于最初关联分析主要是在超市应用比较广泛,所以又叫“购物篮分析”,英文简称为MBA,当然此MBA非彼MBA,意为Market Basket Analysis。

(1)普通问题:如果在研究的问题中,一个用户购买的所有产品假定是同时一次性购买的,分析的重点就是所有用户购买的产品之间关联性;
(2)序列问题:如果假定一个用户购买的产品的时间是不同的,而且分析时需要突出时间先后上的关联,如先买了什么,然后后买什么?那么这类问题称之为序列问题,它是关联问题的一种特殊情况。从某种意义上来说,序列问题也可以按照关联问题来操作

关联分析有三个非常重要的概念,那就是“三度”:支持度、可信度、提升度。

假设有10000个人购买了产品,其中购买A产品的人是1000个,购买B产品的人是2000个,AB同时购买的人是800个。

支持度指的是关联的产品(假定A产品和B产品关联)同时购买的人数占总人数的比例,即800/10000=8%,有8%的用户同时购买了A和B两个产品;

可信度指的是在购买了一个产品之后购买另外一个产品的可能性,例如购买了A产品之后购买B产品的可信度=800/1000=80%,即80%的用户在购买了A产品之后会购买B产品;

提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比,没有任何条件下购买B产品可能性=2000/10000=20%,那么提升度=80%/20%=4。


很多知识性的内容由于格式的问题或者自己的ppt太麻烦,没往里添加,加一些R的代码吧。基于啊apriori 和eclat算法


library(arules)

data(Groceries)

library(arulesViz)

-------------------------------------------------------------------------
apriori算法案例:简易应用之筛选购全脂牛奶 的关联分析情况

rules = apriori(Groceries,parameter = list(support = 0.01,confidence = 0.2))

inspect(sort(rules,by="support")[1:6]) #按支持度查看前6条规则
inspect(sort(rules,by="confidence")[1:6]) #按置信度查看前6条规则
sub.rules=subset(rules, subset = rhs %in% "whole milk" &lift > 1.2) #也可以用subset做规则的筛选,取"右手边"含有whole milk且lift大于1.2的规则

itemFrequencyPlot(Groceries,support = 0.05,cex.names =0.8) #数据画频繁项的图

plot(rules, shading="order", control=list(main = "Two-key plot"))#见chart.1
plot(rules, method="grouped")#见chart.2
plot(rules, method="graph")#见chart.3


----------------------------------------------------------------

eclat算法案例:简易应用之筛选购全脂牛奶 的关联分析情况


fsets <- eclat(Groceries, parameter = list(support = 0.05),control = list(verbose=FALSE)) #提取频繁项集

itemFrequencyPlot(Groceries,support = 0.05,cex.names =0.8) #数据画频繁项的图

itemsetList <- LIST(items(fsets), decode = FALSE)

singleItems <- fsets[size(items(fsets)) == 1] #筛选单独项集

singleSupport <- quality(singleItems)$support #单独项集的支持度

names(singleSupport) <- unlist(LIST(items(singleItems), decode = FALSE)) #转换为列表格式的数据

allConfidence <- quality(fsets)$support / sapply(itemsetList, function(x)max(singleSupport[as.character(x)]))

quality(fsets) <- cbind(quality(fsets), allConfidence)

fsetsmilk <- subset(fsets, subset = items %pin% "whole milk")

inspect(sort(fsetsmilk[size(fsetsmilk)>1], by = "allConfidence")[1:3])

  

http://soledede.com/

 

大家可以加我个人微信号:scccdgf

 

 

或者关注soledede的微信公众号:soledede
微信公众号:

 

分享到:
评论

相关推荐

    Apriori算法对购物篮进行关联分析-Apriori算法进行购物篮关联分析.rar

    Apriori算法对购物篮进行关联分析-Apriori算法进行购物篮关联分析.rar 大家好,出来乍到,看到好多高手分享自己的程序,我也想分享一下,做出自己的贡献。 虽然学MATLAB已经一年有余,但是一直忙着数学建模,对...

    运用R做关联度分析

    本文将详细介绍如何利用R语言进行关联度分析,并通过实际案例演示整个过程。 #### 关联分析基础概念 关联分析是一种寻找数据集中项集之间有趣的关系或相关性的统计方法。这些关系通常以规则的形式出现,例如“如果...

    R_guanlian_关联分析_关联分析R语言编程资料_

    本资料专注于使用R语言进行关联分析,R是一种强大的统计计算和图形生成环境,非常适合数据分析。 资料中包含了五个不同的数据集,这些数据集可能涵盖各种领域,如消费者购买行为、疾病症状、基因表达数据等,提供了...

    《R语言数据分析》课程教案—02商品零售购物篮分析.pdf

    在《R语言数据分析》课程教案中,《02商品零售购物篮分析》章节主要讲解了购物篮分析在零售商品销售中的应用。购物篮分析是数据挖掘技术中的一种常用方法,用于挖掘零售商品之间的关联关系。通过本章节的学习,学生...

    R语言数据分析及绘图代码.zip_drivingnfk_immediatelyqpj_关联分析_回归分析_相关分析;

    本资料“R语言数据分析及绘图代码.zip”包含了驾驶数据分析的关键技术,包括关联分析、回归分析和相关分析。这些方法在理解数据模式、预测趋势以及解释变量间关系时具有重要作用。 关联分析,又称为市场篮子分析,...

    R 语言 基于关联规则与聚类分析的消费行为统计

    在“R 语言 基于关联规则与聚类分析的消费行为统计”这一主题中,我们将深入探讨如何利用R语言来处理和分析消费行为数据。 关联规则学习是一种挖掘数据中项集之间有趣关系的方法,比如“如果用户购买了产品A,那么...

    基于R语言实现超市数据关联规则分析

    通过R语言的关联规则分析,我们可以找出像“购买电视机的顾客大部分会再购买DVD”这样的模式,从而指导营销策略,如商品捆绑销售或个性化推荐。同时,分析结果可以帮助超市更好地理解客户需求,优化库存管理和货架...

    完整版 数据分析 数据挖掘与统计学应用 系列课程09 第九章 关联分析 (共30页).rar

    在实际应用中,关联分析广泛应用于零售业的购物篮分析,例如“啤酒与尿布”效应,通过分析顾客购买行为发现商品之间的关联性,从而进行商品推荐或促销策略制定。此外,关联分析也被应用于医学诊断、网络日志分析、...

    FoodMart数据和实验分析及报告.rar

    在进行这样的分析时,可能需要的工具包括Excel、SQL、Python(pandas、numpy、matplotlib等库)、R语言或专门的BI工具,如Tableau、Power BI等。确保安装并熟悉这些工具是开始实验前的重要步骤。分析过程需要结合...

    实验6-关联分析.rar

    5. **案例分析**:实验说明文档和第五章关联规则的PPT可能会提供一个具体的数据集和场景,比如超市购物数据,让我们能够应用Apriori算法找出购物篮中的关联规则。通过运行`test6_association_rules.R`脚本,我们可以...

    精品版基于MATLAB R语言 SAS SPSS软件的 数据分析与挖掘实战 完整课程PPT课件 第5章 (共25页)挖掘建模之关联规则.pptx

    这一技术最初应用于购物篮分析,探究消费者在购买商品时的关联行为,例如“购买面包的顾客往往也会购买牛奶”。通过发现这样的关联规则,商家可以进行更有效的营销策略,如促销或捆绑销售,以提高销售额和利润。 ...

    Python——机器学习实战——Apriori算法进行关联分析

    关联分析可以帮助我们发现购物篮分析中的商品组合,市场篮子分析,以及其他领域的隐藏模式。例如,在零售业,Apriori算法可以发现哪些商品经常一起被购买,从而为营销策略提供指导。 在实践中,我们还需要考虑一些...

    数据挖掘与R语言1

    关联规则学习是发现数据中项集之间有趣关系的方法,例如购物篮分析。`arules`包提供了完整的关联规则挖掘功能,包括Apriori算法和FP-Growth算法,可以找出频繁项集和强规则。 此外,特征选择也是数据挖掘的关键步骤...

    清华大学精品数据科学R语言全套课程PPT课件含习题(63页) 第9章 数据建模.pptx

    关联规则学习通常基于Apriori算法,用于找出频繁项集和强规则,以揭示购物篮分析等场景中的消费模式。关联分析模型在零售、市场篮子分析等领域有广泛应用。 其他章节内容包括传统的决策树模型,如ID3和C4.5,以及...

    优质文档 十大经典数据挖掘算法R语言实现 共28页.pdf

    在实际应用中,如购物篮分析,Apriori可以帮助我们发现商品之间的关联性。 2. C4.5决策树算法:C4.5是ID3算法的升级版,用于构建分类决策树。它通过信息熵和信息增益来选择最佳分割属性,递归地划分数据空间,最终...

    精品版基于MATLAB R语言 SAS SPSS软件的 数据分析与挖掘实战 完整课程PPT课件 第5章 (共5页) 挖掘建模之离群点检测.pptx

    3. **关联规则**:关联规则挖掘的目标是找出数据集中项目之间的频繁模式,比如购物篮分析中的“买了A商品的顾客往往也会买B商品”。Apriori算法是一种经典的关联规则挖掘算法,通过迭代的方式找出满足最小支持度和...

    十大经典数据挖掘算法R语言的实现

    在购物篮分析中,Apriori算法可以用来找出商品之间的关联关系。例如,通过分析超市顾客的购买行为数据,可以发现“买了面包的人也很可能买牛奶”这样的关联规则。具体实现时,首先需要读入数据并转换成适合Apriori...

    关于举办--大数据分析与可视化技术应用实战培训通知-2017-.pdf

    - 数据挖掘模型实战:包括聚类分析、关联规则、KNN近邻算法和决策树分类等数据挖掘技术的实现,以及它们在R语言中的应用。案例分析涵盖了鸢尾花数据、汽车数据、超市购物篮数据等。 - 行业应用案例:介绍如何深度...

    大数据视野下的数据挖掘技术应用分析.pdf

    例如,如果一位消费者购买了一本关于“R语言编程艺术”的书籍,平台可能会推荐一些与数据挖掘或统计编程相关的图书。这种推荐是通过分析不同商品之间的购买关联性得出的,是数据挖掘技术中购物篮分析的一个典型应用...

    企业大数据分析方法论.pdf

    1. **关联分析**:通过发现不同变量间的关联规则,揭示购买行为或其他事件间的相互影响,如超市购物篮分析。 2. **聚类分析**:根据数据的相似性将数据分组,帮助企业识别客户群体、市场细分等。 3. **分类与回归*...

Global site tag (gtag.js) - Google Analytics