算法复习——模型评估与选择

最新推荐文章于 2025-08-18 09:32:56 发布

原创最新推荐文章于 2025-08-18 09:32:56 发布 · 215 阅读

CC 4.0 BY-SA版权

文章标签：

1 篇文章

订阅专栏

本文探讨了机器学习中的误差与过拟合概念，包括错误率和精度的定义。过拟合和欠拟合的区分以及其原因。接着介绍了模型评估方法，如留出法、交叉验证法和自助法，分析了各种方法的优缺点和适用场景。最后，提到了性能度量在模型选择中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有多种因素可能会导致过拟合，最常见的情况是学习能力过于强大，学到了训练样本所包含的不太一般的特性。过拟合是机器学习面临的关键障碍，这一点只能缓解而无法完全避免。

留出法（hold-out）：将数据集划分为两个互斥的集合，一个作为训练集，一个作为测试集。
交叉验证法（cross validation）：先将数据集划分为 $k$ 个大小相似的互斥子集，每个子集都尽可能保持数据分布的一致性，即从原数据集中通过分层采样得到。每次用 $k - 1$ 个子集的并集作为训练集，余下的一个子集作为测试集。这样可获得 $k$ 组训练/测试集，从而可进行 $k$ 次训练和测试，最终返回 $k$ 个测试结果的均值。通常也叫做“ $k$ 折交叉验证”（ $k$ -fold cross validation）。

我们希望评估的是用整个训练集训练出的模型，但在留出法和交叉验证法中，由于保留了一部分样本用于测试，因此实际评估模型所使用的训练集比原训练集要小，这会引入因样本训练规模不同而导致的估计偏差。

自助法：一定程度上能够解决上述问题，它以自助采样法（bootstrap sampling）为基础。给定包含 $m$ 个样本的数据集 $D$ ，对其进行采样产生数据集 $D^{'}$ ：每次随机从 $D$ 中挑选一个样本，将其拷贝放入 $D^{'}$ ，然后再将该样本放回初始数据集 $D$ 中，使得该样本在下次采样时仍有可能被采到。反复执行该过程 $m$ 次，就得到了包含m个样本的数据集 $D^{'}$ 。显然 $D$ 中有一部分样本会在 $D^{'}$ 中多次出现，而另一部分不出现。根据估计，通过自助采样，初始数据集 $D$ 中约有36.8%的样本未出现在采样数据集 $D^{'}$ 中。于是可将 $D^{'}$ 用作训练集， $D$ \ $D^{'}$ 用作测试集。这样实际训练模型使用的是 $m$ 个样本，且仍有占数据总量约 $1 / 3$ 的没有在训练集中出现的样本用于测试。