关联规则

关联规则

关联规则挖掘

$ support(A => B) = P(A U B) $

$ confidence(A => B) = P(AUB)/P(A) $

  1. 找出频繁项集
  2. 由频繁项集产生强关联规则

由事务数据库挖掘单维布尔关联规则

Apriori算法: 使用候选项集找频繁项集

  1. 连接
  2. 剪枝

由频繁项集产生关联规则

$ confidence(A => B) = P(A|B) = supportcount(A U B)\div supportcount(A) $

提高Apriori有效性

  1. 基于散列的技术
  2. 事务压缩
  3. 划分
  4. 选样
  5. 动态项集计数

FP-树

冰山查询

多层关联规则

挖掘量化关联规则

  • 分箱: 等宽分箱 等深分箱 基于同质分箱
  • 找频繁谓词集
  • 关联规则聚类

A和B相关性: $ P(A U B)\div (P(A) * P(B)) $