吴恩达机器学习(正则化)

(1)什么是过度拟合问题?

在线性回归中的过拟合例子:

图1:是一个线性模型,欠拟合或者叫做高偏差,不能很好地适应我们的训练集;我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。

图2:恰当合适的拟合了数据

图3:完美的拟合了训练数据,称之为过拟合或者叫做高方差,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。我们可以看出,若给出一个新的值使之预测,它将表现的很差,是过拟合,虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好。
换句话说就是:训练出的假设函数能很好的拟合数据集,可能会使代价函数非常接近零或等于零,千方百计的拟合数据集,就会导致模型预测新样本(没有出现在训练集的样本)的能力降低。
在这里插入图片描述

在Logistic回归中的过拟合例子:

图1:欠拟合或者叫做高偏差
图2:恰当合适的拟合了数据
图3:过拟合或者叫做高方差
在这里插入图片描述

如果我们发现了过拟合问题,应该如何处理?

(1)减少选取变量的数量,人工选择哪些变量保留哪些变量舍去
(2)正则化。 保留所有的特征,但是减少参数的大小(magnitude)。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值