关联规则通常使用3个指标来度量,来选取合适的关联规则。
三个指标分别为:
- Support(支持度)
- Confidence(置信度)
- Lift(提升度)
Support
同时购买$X$、$Y$的订单数占总订单数的比例。若用$P(X)$表示购买$X$的订单比例,那么
$$ \text{Support}(X, Y)=\frac{P(X, Y)}{P(A l l)}=\frac{\text{同时购买}\{X,Y\}\text{的订单}}{\text{总订单}} $$
Confidence
购买$X$的订单中同时购买$Y$的比例,即同时购买$X$和$Y$的订单数占购买X的订单的比例
$$ \text{Confidence}(X \rightarrow Y)=P(Y / X)=\frac{P(X, Y)}{P(X)}=\frac{\text{同时购买}\{X,Y\}\text{的订单}}{\text{购买}Y\text{的订单}} $$
Lift
提升度反应了X与Y的相关性,如果提升度为1,就说明没有相关性
$$ \text{Lift}(X \rightarrow Y)=\frac{P(X, Y)}{P(X) \cdot P(Y)}=\frac{P(Y / X)}{P(Y)}=\frac{\text{同时购买}\{X,Y\}\text{的订单}}{\text{购买}X\text{的订单}\cdot \text{购买}Y\text{的订单}} $$