一.关联规则
关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,是数据挖掘的一个重要技术,用于从大量数据中挖掘出有价值的数据项之间的相关关系。其中关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事,通过对超市购物篮数据进行分析,即顾客放入购物篮中不同商品之间的关系来分析顾客的购物习惯,发现美国妇女们经常会叮嘱丈夫下班后为孩子买尿布,30%-40%的丈夫同时会顺便购买喜爱的啤酒,超市就把尿布和啤酒放在一起销售增加销售额。
二.基本概念
关联规则挖掘是寻找给定数据集中项之间的有趣联系。如下图所示:

本文介绍了关联规则挖掘的概念及其在超市购物篮数据中的应用,特别是Apriori算法。通过实例详细解释了Apriori算法的挖掘过程,包括频繁项集的生成和强关联规则的确定。此外,讨论了支持度和置信度作为评估规则的重要指标,并给出了满足最小支持度和置信度阈值的强关联规则示例。
订阅专栏 解锁全文
4879

被折叠的 条评论
为什么被折叠?



