
论文题目:Accelerated Coordinate Encoding: Learning to Relocalize in Minutes using RGB and Poses
在公众号「3D视觉工坊」后台回复「原论文」,可获取对应论文pdf文件。
代码主页:https://github.com/nianticlabs/ace
这篇文章来自CVPR 2023(Highlight),作者来自鼎鼎大名的Niantic Labs,是一个很有名的VR游戏开发公司,做了增强现实游戏Ingress和位置发现应用Field Trip和pokemon go手游。其引领着全球VR游戏的发展历史。
1 介绍
本文是一篇基于学习的视觉定位算法,更具体的是通过网络学习回归图像密集像素三维坐标,建立2D-3D对应后放在鲁棒姿态估计器(RANSAC PNP + 迭代优化)中估计相机六自由度姿态。
与以往基于学习的视觉定位算法的区别在于:以前的方法往往需要数小时或数天的训练,而且每个新场景都需要再次进行训练,使得该方法在大多数应用程序中不太现实,所以在本文中作者团队提出的方法改善了这一确定,使得可以在不到5分钟