EMD loss

最新推荐文章于 2025-07-17 09:22:08 发布

hzhj

最新推荐文章于 2025-07-17 09:22:08 发布

阅读量7k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：损失函数文章标签： EMD 推土机距离地球移动距离 Wasserstein

本文链接：https://blog.csdn.net/hzhj2007/article/details/106111480

损失函数专栏收录该内容

5 篇文章

订阅专栏

地球移动距离(EMD)，又称推土机距离，是一种衡量特征空间中多维矩阵间距离的度量。它常用于解决运输规划问题，如土堆与土坑的分配或货物运输。EMD loss，即Wasserstein距离，通过最小化运输成本来确定最优运输方案。此外，EMD loss在图像相似性、文档相似性和多类别问题中也有应用，例如在年龄和图像美学分布上表现优于交叉熵损失，并在GAN网络中有重要角色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Earth Mover's Distance (EMD)，翻译过来是地球移动距离，又称为推土机距离，是对特征空间中两个多维矩阵中某一维距离的一种度量。

The Earth Mover's Distance (EMD) is a method to evaluate dissimilarity between two multi-dimensional distributions in some feature space where a distance measure between single features, which we call the ground distance is given. The EMD ``lifts'' this distance from individual features to full distributions.

先对该损失针对的生活场景进行描述。

假设有若干数量的土堆，每个土堆的大小不一且分布的位置不一样。同时存在若干数量的土坑，每个土坑的大小不一且位置不一样。对于每个土堆-土坑对的运输成本是给定的（以距离表示）。任务是把土堆搬动并填到土坑里，如何规划运输方案，使运输成本最低(描述详见这里)；
假设有一批货物需要从多个工厂运输到多个仓库，工厂和仓库的分布位置无规律，且它们的储存量不同。如何尽可能高效把所有 (当仓库总容量大于货物总重量) 或部分货物 (当仓库总容量小于货物总重量) 从工厂运送到仓库(描述详见这里)；

EMD loss（also known as Wasserstein distance）

上述两种场景是运输中的规划问题。抽象出来就是出发地和目的地间的距离是固定的，只是两者之间的运输量是变化的，且该运输量存在两个约束条件，目的是运输成本最低。

第一行表示P和Q两个(特征)向量间移动元素的工作量，即运输成本；
第二行表示i和j之间的运输量；
第三行和第四行表示运输量小于P和Q中当前位置的存量或需求量，即i和j之间的运输量不能大于仓库可存储的量，也不能大于工厂生产的量；
总的运输量小于总的存量或需求量；

emd loss定义为总运输量归一化后的运输成本，公式如下

图片来自这里

针对图像和文本的应用场景

图像间的相似性度量
文档、词汇和语义的相似性度量
具有顺序的多类别之间的距离，如年龄分布和图像美学分布。通常多分类问题采用交叉熵来计算预测值和真实值之间的差异，数据集中各类别之间也是相互独立的。文章表明 $EMD^{2}\: loss$ 在年龄和图像美学分布上的效果优于交叉熵损失，且给出了计算code 。
GAN 网络: Wasserstein GAN

参考文献：