损失函数——交叉熵损失函数

最新推荐文章于 2025-06-21 15:45:00 发布

原创最新推荐文章于 2025-06-21 15:45:00 发布 · 6.3k 阅读

·

17

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #人工智能 #python

机器学习专栏收录该内容

3 篇文章

订阅专栏

本文介绍了机器学习中常用的交叉熵损失函数，包括其定义、计算公式及应用场景，并对比了其与KL散度的区别，适用于分类任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一篇弄懂交叉熵损失函数

一、定义
二、交叉熵损失函数：

一、定义

机器学习中所有的算法都需要最大化或最小化一个函数，这个函数被称为“目标函数”。其中，我们一般把最小化的一类函数，称为“损失函数”。它能根据预测结果，衡量出模型预测能力的好坏。

损失函数大致可分为两类：分类问题的损失函数和回归问题的损失函数

二、交叉熵损失函数：

知识准备：

熵：表示一个系统的不确定程度，或者说一个系统的混乱程度

1、信息熵：将熵引入到信息论中，命名为“信息熵”

在这里插入图片描述

公式运用：
此处的信息熵克表示混乱程度亦或是不确定性
在这里插入图片描述

2、 KL散度（相对熵）：

KL散度：是两个概率分布间差异的非对称性度量。
通俗说法是用来衡量同一个随机变量的两个不同分布之间的距离
在这里插入图片描述

在这里插入图片描述

公式运用：
在这里插入图片描述
公式变形：

在这里插入图片描述

交叉熵：

交叉熵主要用于度量同一个随便变量X的预测分布Q与真实分布P之间的差距
在这里插入图片描述
这里求得的交叉熵意味与真实标签的差距大小，越小越好

结论：

在这里插入图片描述
由图可知，如果不是真实标签，它的标签P(X)=0所以算的结果与之无关

1、预测越准确，交叉熵越小
2、交叉熵只跟真实标签的预测概率值有关
所以可以把交叉熵公式化简：
在这里插入图片描述

二分类交叉熵公式：
在这里插入图片描述

为什么要用交叉熵而不是用KL散度？
在这里插入图片描述

Softmax公式

1、将数字转化成概率
2、进行数据归一化的利器
在这里插入图片描述

Sigmoid

1、Sigmoid函数也叫Logistic函数
2、取值范围是（0，1）
3、神经网路常用函数
4、常被用作二分类
在这里插入图片描述

常见的交叉熵损失函数类型

在这里插入图片描述

交叉熵损失函数：

在这里插入图片描述
具体过程：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。