吴恩达机器学习（正则化）

原创

于 2021-01-19 10:51:00 发布 · 979 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

（1）什么是过度拟合问题？

在线性回归中的过拟合例子：

图1：是一个线性模型，欠拟合或者叫做高偏差，不能很好地适应我们的训练集；我们看看这些数据，很明显，随着房子面积增大，住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。

图2：恰当合适的拟合了数据

图3：完美的拟合了训练数据，称之为过拟合或者叫做高方差，过于强调拟合原始数据，而丢失了算法的本质：预测新数据。我们可以看出，若给出一个新的值使之预测，它将表现的很差，是过拟合，虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好。
换句话说就是：训练出的假设函数能很好的拟合数据集，可能会使代价函数非常接近零或等于零，千方百计的拟合数据集，就会导致模型预测新样本（没有出现在训练集的样本）的能力降低。
在这里插入图片描述

在Logistic回归中的过拟合例子：

图1：欠拟合或者叫做高偏差
图2：恰当合适的拟合了数据
图3：过拟合或者叫做高方差
在这里插入图片描述

如果我们发现了过拟合问题，应该如何处理？

（1）减少选取变量的数量，人工选择哪些变量保留哪些变量舍去
（2）正则化。保留所有的特征，但是减少参数的大小（magnitude）。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。