A-A+
设有如下所示的某商场购物记录集合 每个购物篮中包含若干商品:购物篮编号商品1面包 牛奶2面包
问题详情
设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品:
购物篮编号
商品
1
面包,牛奶
2
面包,啤酒,鸡蛋,尿布
3
牛奶,啤酒,尿布,可乐
4
面包,牛奶,啤酒,尿布
5
面包,牛奶,尿布,可乐
现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是()。
A.啤酒→尿布
B.(面包,尿布)→牛奶
C.面包→牛奶
D.(面包,啤酒)→尿布请帮忙给出正确答案和分析,谢谢!
参考答案
正确答案:A
关联规则是形如X->Y的蕴涵表达式。关联规则的强度可以用它的支持度(s)和置信度(e)度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含x的事务中出现的频繁程度。两者可以用公式表示:从题目中可以看到事务总数是5,A的{啤酒、尿布}支持度计数是3,{啤酒}支持计数是3,所以s=0.6。e=1。同理可得B{面包、尿布}支持计数为3,{面包、尿布、牛奶}支持计数是2,所以S=0.4,C=2/3。C中,{面包、牛奶}支持计数为3,{面包}支持计数为4,所以S=0.6,C=0.75。D中,{面包、啤酒}支持计数为2,{面包、啤酒、尿布}支持计数为2,所以S=0.4,e=1。综上所述,结果选A。