tonglin0325的个人主页

机器学习——使用Apriori算法进行关联分析

从大规模的数据集中寻找隐含关系被称作为关联分析(association analysis)或者关联规则学习(association rule learning)

 

Apriori算法

优点:易编码实现

缺点:在大数据集上可能较慢

使用数据类型:数值型或者标称型数据

 

关联分析寻找的是隐含关系,这些关系可以有两种形式:频繁项集或者关联规则

频繁项集(frequent item sets)是经常出现在一起的集合

关联规则(association rule)暗示两种物品之间可能存在很强的关系

 

项集支持度可信度(置信度)

 

Apriori算法的原理是如果某个项集是频繁的,那么它的所有子集也是频繁的如果一个项集是非频繁的,那么它的所有超集也是非频繁的