PyTorch_Practice项目解析：使用PyTorch实现线性回归模型-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01095/article/details/149015365

PyTorch_Practice项目解析：使用PyTorch实现线性回归模型

线性回归是机器学习中最基础的算法之一，也是理解神经网络工作原理的重要基础。本文将通过PyTorch_Practice项目中的线性回归实现，详细讲解如何使用PyTorch框架构建并训练一个简单的线性回归模型。

一、线性回归基本原理

线性回归模型试图学习一个线性函数来描述输入特征与输出目标之间的关系。在本例中，我们模拟的数据遵循y = 2x + 5的基本关系，并添加了一些随机噪声。

二、代码实现解析

1. 数据准备

import torch
import matplotlib.pyplot as plt
torch.manual_seed(10)  # 设置随机种子保证结果可复现

# 创建训练数据
x = torch.rand(20, 1) * 10  # 生成20个0-10之间的随机数作为x值
y = 2*x + (5 + torch.randn(20, 1))  # 生成对应的y值，并添加噪声

这里我们生成了20个样本点，x值在0-10之间均匀分布，y值在2x+5的基础上添加了标准正态分布的噪声。

2. 模型参数初始化

w = torch.randn((1), requires_grad=True)  # 随机初始化权重
b = torch.zeros((1), requires_grad=True)  # 初始化偏置为0

关键点：

requires_grad=True表示这两个参数需要计算梯度，这是PyTorch自动微分的基础
权重w使用随机初始化，偏置b初始化为0

3. 训练过程

训练循环包含以下几个关键步骤：

前向传播

wx = torch.mul(w, x)  # w*x
y_pred = torch.add(wx, b)  # w*x + b

损失计算

使用均方误差(MSE)作为损失函数：

loss = (0.5 * (y - y_pred) ** 2).mean()

反向传播

loss.backward()  # 自动计算梯度

参数更新

b.data.sub_(lr * b.grad)  # b = b - lr * b.grad
w.data.sub_(lr * w.grad)  # w = w - lr * w.grad

梯度清零

w.grad.zero_()
b.grad.zero_()

4. 可视化训练过程

代码中每隔20次迭代就会绘制当前的拟合直线：

plt.scatter(x.data.numpy(), y.data.numpy())  # 绘制原始数据点
plt.plot(x.data.numpy(), y_pred.data.numpy(), 'r-', lw=5)  # 绘制当前拟合直线

三、关键知识点详解

自动微分机制：PyTorch的autograd模块会自动计算梯度，这是深度学习框架的核心功能之一。
参数更新：使用梯度下降法更新参数时，需要注意：
- 学习率(lr)的选择很重要，太大可能导致震荡，太小收敛慢
- 每次更新后必须清零梯度，否则梯度会累积
损失函数：这里使用的是MSE(均方误差)的一半，乘以0.5是为了求导后系数为1，简化计算。
可视化：训练过程中的可视化可以帮助我们直观理解模型的学习过程。