还没怎么真正理解,仅为自己记录下,后期还会继续完善!
给定训练样本集合,其中每个样本有两个可选的label(+1, -1)。因此总共有
种不同的label组合。如果对于其中每一种组合,分类模型 f 都能够对其进行正确的划分,那么我们称 f 能够将训练样本集合
打散(shatter)。
举例来看,下图共有3个样本,可以看到,对于样本的任意一种label组合,图中的直线都可以将正样本和负样本分开。这时我们称这条直线可以将这三个样本打散(shatter)。
再来一个不能打散的例子:
上图中显示了四个样本,如果只用一条直线,那么无论这