吴恩达ML课程自用笔记(1)

最新推荐文章于 2025-08-18 20:35:45 发布

哇咔咔负负得正

最新推荐文章于 2025-08-18 20:35:45 发布

阅读量211

点赞数

CC 4.0 BY-SA版权

分类专栏： ml 文章标签：机器学习

本文链接：https://blog.csdn.net/qq_39906884/article/details/112968430

ml 专栏收录该内容

10 篇文章

订阅专栏

本文介绍了机器学习的基本定义，包括监督学习与无监督学习的概念，并详细解释了线性回归算法模型的工作原理及其数学表达形式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习定义

计算机程序从经验(experience) E 中学习解决某一任务(task) T 进行某一性能度量(performance) P，通过P测定在T上的表现因经验E而提高。

机器学习分类

监督学习(Supervised learning)
无监督学习(Unsupervised learning)
其他：
加强学习(reinforcement)
推荐系统(recommender systems)

监督学习

监督学习就是给出算法一个数据集，其中包含了正确答案。
每个样本都有正确的答案（标签）。
通过算法预测的出正确答案。

回归问题：预测一个连续值输出
比如：房价预测
分类问题：预测离散值输出
比如：癌症预测

无监督学习

无监督学习给的数据集中样本没有任何标签，不知道要拿他做什么，也不知道每个数据点究竟是什么，只被告知有一个数据集，找出他们的某种结构。
无监督学习算法可能判定该数据集包含两个不同的簇。

聚类算法：将数据分为不同的簇
比如：市场划分，天文数据分析

线性回归算法模型

1. 线性回归平方差代价函数

预测一个 real-valued 输出，

Note：
$m$ ：训练样本数量
$x$ ：输入变量/特征
$y$ ：输出变量/目标变量
$(x, y)$ ：一个训练样本
$x^{(i)}, y^{(i)} )$ ：第 $i$ 个训练样本

h为假设函数
$hθ(x)=θ0+θ1xh_\theta(x) = \theta_0 + \theta_1 x$
线性方程整体目标函数：
$12m∑i=1m(hθ(x(i))−y(i))2\frac{1}{2m} \sum\limits_{i=1}^m(h_\theta(x^{(i)}) - y^{(i)})^2$
参数
$θ0,θ1\theta_0 , \theta_1$
代价函数：
$J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^m(h_\theta(x^{(i)}) - y^{(i)})^2$
目标：
$最小化J(θ0,θ1)最小化J(\theta_0 , \theta_1)$
在这里插入图片描述
选用平方差代价函数也许是解决回归问题最常用的手段

2. 线性回归代价函数J最小化的梯度下降法

Outline：

给定 $θ0,θ1\theta_0, \theta_1$
持续改变 $θ0,θ1\theta_0, \theta_1$ 的值去减小 $J(θ0,θ1)J(\theta_0, \theta_1)$ ，直到找到 $J$ 的最小值或者局部最小值

算法描述：

repeat until convergence{
$θj:=θj−α∂∂θjJ(θ0,θ1)\theta_j:=\theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta_0,\theta_1)$ (for j = 0 and j = 1)
}

即

repeat until convergence{
$θ0:=θ0−α1m∑i=1m(hθ(x(i))−y(i))\theta_0:=\theta_0-\alpha\frac{1}{m} \sum\limits_{i=1}^m(h_\theta(x^{(i)}) - y^{(i)})$
$θ1:=θ1−α1m∑i=1m(hθ(x(i))−y(i))⋅x(i)\theta_1:=\theta_1-\alpha\frac{1}{m} \sum\limits_{i=1}^m(h_\theta(x^{(i)}) - y^{(i)})·x^{(i)}$
}

$α\alpha$ 为学习率(learning rate)，用来控制梯度下降速度， $α\alpha$ 越大速度越快。
$∂∂θjJ(θ0,θ1)\frac{\partial}{\partial\theta_j}J(\theta_0,\theta_1)$ 为一个导数项

Correct：Simultaneous update

$temp0:=θ0−α∂∂θ0J(θ0,θ1)temp0:=\theta_0-\alpha\frac{\partial}{\partial\theta_0}J(\theta_0,\theta_1)$
$temp1:=θ1−α∂∂θ1J(θ0,θ1)temp1:=\theta_1-\alpha\frac{\partial}{\partial\theta_1}J(\theta_0,\theta_1)$
$θ0:=temp0\theta_0:=temp0$
$θ1:=temp1\theta_1:=temp1$