一种提高TSP求解器泛化能力的对策论方法（ICLR 2022）(完)

太极生两鱼

已于 2024-10-29 13:11:30 修改

阅读量182

点赞数

CC 4.0 BY-SA版权

文章标签： python

于 2024-10-28 20:56:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45823731/article/details/143305348

文献阅读专栏收录该内容

57 篇文章 ¥39.90 ¥99.00

订阅专栏

文章目录

Abstract
1 INTRODUCTION
2 RELATED WORK
3 符号和预备知识
4 OUR METHOD
5 EXPERIMENTS
- 5.1实验设置
- 5.2 结果
6 DISCUSSIONS
- 6.1 Meta博弈分析
- 6.2求解器群体的使用
第七章结论

Abstract

在本文中，我们介绍了一个两玩家零和框架，介于一个可训练的求解器（Solver）和一个数据生成器（Data Generator）之间，以提高基于深度学习的旅行商问题（TSP）求解器的泛化能力。我们的两玩家框架基于策略空间响应Oracle（PSRO）方法，输出一系列最佳响应求解器，我们可以混合这些求解器，输出一个综合模型，该模型在对抗生成器时实现最小的可利用性，从而在不同的TSP任务上实现最泛化的绩效。我们在不同类型和规模的各种TSP实例上进行实验。结果表明，即使在求解器从未遇到过的任务上，我们的求解器也实现了最先进的性能，而其他基于深度学习的求解器由于过拟合，性能急剧下降。为了演示我们框架的原理，我们研究了所提出的两玩家游戏的学习结果，并证明求解器群体的可利用性在训练期间降低，并且最终逼近了与生成器一起的纳什均衡。

1 INTRODUCTION

由于深度学习能够从数以百万计的问题实例中训练并捕捉到复杂的改进启发式方法，它在解决组合优化问题上最近引起了极大的关注（Khalil等人，2017年）。此外，由于神经网络在前向计算上的高效性，基于深度学习的技术在处理大规模问题时，与传统方法相比尤其显得高效。因此，研究如何先在离线环境下训练基于深度学习的求解器，随后再在线环境下部署这些求解器，是一个充满希望的研究方向。

求解器的泛化能力指的是它在各种不同数据分布上的表现

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

太极生两鱼 要天天开心哦！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。