Regularizing Neural Networks by Penalizing Confident Output Distributions (2017)摘要

深度学习中的过拟合解决

最新推荐文章于 2022-10-13 22:41:55 发布

翻译最新推荐文章于 2022-10-13 22:41:55 发布 · 1.5k 阅读

文章标签：

#Neural and Evolutionary Computing #Machine Learning

读论文专栏收录该内容

2 篇文章

订阅专栏

本文探讨了深度学习分类问题中的过拟合现象，即模型对某类预测过于自信而导致错误分类。提出了通过添加信心惩罚(confidence penalty)来解决这一问题的方法，包括条件概率熵的引入、阈值设置以及label smoothing的应用。

G. Pereyra, G. Tucker, J. Chorowski
原文地址
https://arxiv.org/abs/1701.06548

在深度学习的分类问题中，经常出现模型过拟合的情况，具体表现往往为：模型给一个目标分类时，给某个类过大的信任（概率）导致分类出错，（即概率集中在一个类上）。作者提出给这样的分布添加惩罚机制。

论文从条件概率的熵开始推导，y为类别，x为输入值。

将这个熵值加入似然函数，得到

Beta为该confidence penalty的惩罚力度参数。
由于模型在训练中需要同时保证在开始时尽量快的拟合和最后避免过拟合，所以需要在上式中添加阀值，使训练初期模型不会因受到penalty的影响而拟合失败。

Tao即熵的阀值。