集成学习模型（二）——GBDT

最新推荐文章于 2025-06-29 16:01:44 发布

Storm*Rage

最新推荐文章于 2025-06-29 16:01:44 发布

阅读量939

点赞数 1

CC 4.0 BY-SA版权

本文链接：https://blog.csdn.net/weixin_43886056/article/details/108904443

GBDT是一种集成学习方法，属于Boosting算法，通过结合多个弱决策树来构建强预测模型。文章详细介绍了GBDT的原理，包括回归树、提升树的概念，以及GBDT的损失函数和正则化方法。通过逐步优化和拟合残差，GBDT能有效提升预测精度。最后，提到了GBDT在实际应用中的模型构建和测试过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GBDT

文章目录

GBDT

一、概述

梯度提升（Gradient boosting）是一种用于回归、分类和排序任务的机器学习技术1，属于Boosting算法族的一部分。Boosting是一族可将弱学习器提升为强学习器的算法，属于集成学习（ensemble learning）的范畴。Boosting方法基于这样一种思想：对于一个复杂任务来说，将多个专家的判断进行适当的综合所得出的判断，要比其中任何一个专家单独的判断要好。通俗地说，就是“三个臭皮匠顶个诸葛亮”的道理。梯度提升同其他boosting方法一样，通过集成（ensemble）多个弱学习器，通常是决策树，来构建最终的预测模型。
GBDT中的树是回归树（不是分类树），GBDT用来做回归预测，调整后也可以用于分类。

二、回归树

回归树（Regression Decision Tree），总体流程类似于分类树，区别在于，回归树的每一个节点都会得一个预测值，该预测值等于属于这个节点的所有样本的平均值。分枝时穷举每一个feature的每个阈值找最好的分割点，但衡量最好的标准不再是最大熵，而是最小化平方误差。也就是被预测出错的数量越多，错的越离谱，平方误差就越大，通过最小化平方误差能够找到最可靠的分枝依据。分枝直到每个叶子节点上样本特征都唯一或者达到预设的终止条件(如叶子个数上限)，若最终叶子节点上样本特征不唯一，则以该节点上所有样本的平均做为该叶子节点的预测值。

回归树的生成方法如下：

输入：训练数据集 $D$
输出：回归树 $f (x)$

在训练数据集所在的输入空间中，递归地将每个区域划分为两个子区块并决定每个子区域上的输出值，构建二叉决策树：

1.选择最优切分变量 $j$ 与切分点 $s$ ，求解
$\min _{j, s}\left[\min _{c_1} \sum_{x_i \in R_1(j,s)} (y_{i}-c_{1})^{2}+\min _{c_{2}} \sum_{x_{i} \in R_{2}(j, s)}\left(y_{i}-c_{2}\right)^{2}\right]$

容易得出，在 $j$ 和 $s$ 固定时， $c_{1}=\frac{1}{N_{1}} \sum_{x_{i} \in R_{1}} y_{i}, \quad c_{2}=\frac{1}{N_{2}} \sum_{x_{i} \in R_{2}} y_{i}$

遍历变量 $j$ ，对固定的切分变量 $j$ 扫描切分点 $s$ ，选择使其值达到最小的对 $(j, s)$ 。

2.用选定的对 $(j, s)$ 划分区域并决定相应的输出值：
$\begin{array}{c} R_{1}(j, s)=\left\{x \mid x^{(j)} \leqslant s\right\}, \quad R_{2}(j, s)=\left\{x \mid x^{(j)}>s\right\} \\ \hat{c}_{m}=\frac{1}{N_{m}} \sum_{x_{i} \in R_{m}(j, s)} y_{i}, \quad x \in R_{m}, \quad m=1,2 \end{array}$