机器学习算法中 GBDT 和 XGBOOST 的区别有哪些？

AI算法攻城狮

已于 2022-06-02 08:34:25 修改

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： # 机器学习算法原理文章标签：算法机器学习决策树

于 2021-05-10 12:42:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jxq0816/article/details/116592563

机器学习算法原理专栏收录该内容

68 篇文章 ¥99.90 ¥299.90

订阅专栏

本文探讨了机器学习中GBDT与XGBOOST在算法层面和系统层面的主要区别，包括XGBOOST的正则项控制、损失函数精确度、特征降采样、并行计算优化等特性，揭示了XGBOOST在防止过拟合和提升计算效率上的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

算法层面

1. Xgboost在代价函数里加入了正则项，用于控制模型的复杂度，降低了过拟合的可能性。正则项里包含了树的叶子节点个数，每个叶子节点上输出的score的L2模的平方和，普通GBDT没有。

T为叶子节点的数量，W为叶子的权重。

Y帽子为预测值，Y为目标值。

gamma ,delta 为参数

2.xgboost损失函数对误差部分是二阶泰勒展开，GBDT 是一阶泰勒展开，所以损失函数定义的更精确。

传统GBDT在优化时只用到一阶导数信息，xgboost则对代价函数进行了二阶泰勒展开，同时用到了一阶和二阶导数。为什么xgboost要用泰勒展开，优势在哪里？xgboost使用了一阶和二阶偏导, 二阶导数有利于梯度下降的更快更准. 使用泰勒展开取得函数做自变量的二阶导数形式, 可以在不选定损失函数具体形式的情况下, 仅仅依靠输入数据的值就可以进行叶子分裂优化计算, 本质上也就把损失函数的选取和模型算法优化/参数选择分开了. 这种去耦合增加了xgboost的适用性, 使得它按需选取损失函数, 可以用于分类, 也可以用于回归。

3.对每棵子

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI算法攻城狮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。