code
1 Abstract
为了开发一个强大的VLN-CE代理,我们提出了一个新的导航框架ETPNav。它专注于两个关键技能:1)抽象环境和生成远程导航计划的能力,以及2)在连续环境中进行避障控制的能力。ETPNav通过沿遍历路径的自组织预测路点来执行环境的在线拓扑映射,而无需事先的环境经验。它允许代理将导航过程分解为高级规划和低级控制。同时,ETPNav利用基于Transformer的跨模态规划器来生成基于拓扑图和指令的导航计划。然后通过障碍物规避控制器执行该计划,该控制器利用试错启发式来防止导航陷入障碍物。实验结果证明了该方法的有效性。ETPNav在R2R-CE和RxR-CE数据集上分别比现有技术提高了10%和20%以上。
最近,就VLN-CE的研究出现了一种新的趋势,即基于模块化航路点的方法[9]、[10]、[11],将复杂任务划分为航路点生成、子目标规划和导航控制。具体地说,在每个决策循环中,代理使用预先训练的网络来预测附近的几个候选路点,然后执行跨模态基础,从路点中选择一个子目标。之后,控制器通过低级操作驱动代理到达选定的子目标。总体而言,该模块化流水线简化了策略学习,并缩小了VLN-CE和VLN之间的性能差距。
尽管取得了进展,但我们