均方根误差（RMSE）详解与Python实现

原创于 2025-07-10 14:16:25 发布 · 615 阅读

CC 4.0 BY-SA版权

文章标签：

在机器学习与回归模型评估中，均方根误差（Root Mean Squared Error，RMSE） 是常用的一种性能指标。本文将深入介绍 RMSE 的定义、数学公式、与其他评估指标（如 MAE、MSE）的对比，并通过 Python 手动实现 RMSE 函数，帮助大家更直观理解这一指标的含义和应用。

一、RMSE 是什么？

RMSE 是 均方误差（MSE） 的平方根，是对预测值与真实值之间误差的度量。它的本质是衡量预测值与实际值之间差异的 标准差。

与 MSE 相比，RMSE 对于离群点（Outliers）更敏感，因为误差被平方后再开方，较大的误差将被放大影响整体值。

二、数学公式

$\text{RMSE} = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} \left( y_i - \hat{y}_i \right)^2 }$

其中：

$n$ 是样本总数；
$y_i$ 是第 $i$ 个真实值；
$\hat{y}_i$ 是第 $i$ 个预测值。

三、RMSE 的 Python 实现（手动）

import math

def mean_squared_error_manual(y_true, y_pred):
    n = len(y_true)
    error = sum((yt - yp) ** 2 for yt, yp in zip(y_true, y_pred))
    return error / n

def root_mean_squared_error_manual(y_true, y_pred):
    mse = mean_squared_error_manual(y_true, y_pred)
    return math.sqrt(mse)

✅ 示例演示

y_true = [3.0, -0.5, 2.0, 7.0]
y_pred = [2.5, 0.0, 2.0, 8.0]

rmse = root_mean_squared_error_manual(y_true, y_pred)
print("RMSE:", rmse)

输出：

RMSE: 0.6123724356957945

四、RMSE 的实际应用场景

回归模型评估（如线性回归、XGBoost）
时间序列预测误差衡量（如销售、温度预测）
图像处理中的像素误差评估
推荐系统中预测评分误差度量

五、总结

RMSE 是回归模型中最常用的误差衡量之一；
它能更直观地反映预测误差大小（与原单位一致）；
但需注意其对异常值较为敏感，在实际中结合 MAE 使用效果更佳。