文章目录
1、一些信息论概念
参考 https://blog.csdn.net/ranghanqiao5058/article/details/78458815
熵
如果本来一件事情发生的概率是50%,那么如果我知道了这件事情,那么这个信息就是有价值的。

条件熵

互信息、条件熵、联合熵区别

举个例子,假设H(X)用一块糖来表示,Y代表一杯水,H(X|Y)也就是将这杯水倒在糖上,H(X)还剩多少,那么溶于水的那部分糖就是Y给H(X)带来的损失,即就是互信息。
2、特征选择
信息增益
相当于信息论中的互信息,知道一个信息不确定性减少的程度的大小,信息增益越大,代表这个信息越有价值。
- 信息增益