1 不确定环境下的规划
现实世界中运行的自动驾驶系统面临着一些可能与安全相关的不确定性来源。
(1)测量噪声(感知和定位)
对于感知和定位噪声,通常将安全约束与缓冲区膨胀。
道路边界的噪声缓冲区、车俩形状用圆表示、障碍物的椭球界
参考文献:Chen J, Zhan W, Tomizuka M. Constrained iterative lqr for on-road autonomous driving motion planning[C]//2017 IEEE 20th International conference onintelligent transportation systems (ITSC). IEEE, 2017: 1-7.
(2)代理意图的不确定性
如果充分考虑行驶的两个意图,自车可能没有传递的空间,不知道采用哪种意图
防御式规划:Contingency Planning
当意图不确定时,防御式规划考虑共享未来的多种可能性,随着时间的推移,代理驾驶意图的估计会变得更加清晰。
参考文献:Hardy J. Contingency Planning And Obstacle Anticipation For Autonomous Driving[J]. 2013.
防御式规划输出一个具有一个共享段和多个分支得轨迹树,独立处理不同的未来意图
(3)控制噪声和环境干扰
2 Data-driven Methods
传统的决策规划框架具有良好的可解释性和一定的可扩展性,但在面对长尾问题时很难完全设计。
基于机器学习的方法可以通过大量人类驾驶数据或在模拟场景中不断演变来实现更强大和人性化的驾驶能力,然而在当前阶段,可解释性是大规模应用中的瓶颈之一。
2.1 基于学习的规划
模仿学习
(1)本质上是监督学习,从人类专家驾驶数据学习策略函数
(2)使用卷积神经网络(CNN)将前置摄像头的原始像素映射到自动驾驶汽车的转向命令
强化学习
强化学习是一种学习的计算方法,试图在复杂和不确定的环境交互时最大化收到的奖励总量。
动作空间:{A=vf,df,tfA=v_f,d_f,t_fA=vf,df,tf}
奖励函数:安全驱动长距离(不与障碍物或道路边界发生碰撞),尽可能实现预期速度。
2.2 Hybrid 方法
(1)工程复杂性使得基于规则的规划器与人类行为不兼容
(2)ML方法不能提供安全保证,有时无法预测
(3)为了解决这个问题,这个方法使用一种简单而有效的基于规则的回退层,该层对ML规划器的决策执行健全性检查
参考文献:Vitelli M, Chang Y, Ye Y, et al. Safetynet: Safe planning for real-world self-driving vehicles using machine-learned policies[C]//2022International Conference on Robotics and Automation (ICRA). IEEE, 2022: 897-904.
https://github.com/woven-planet/l5kit
NθN_\thetaNθ:模仿昂贵的基于运行优化的规划器的输出
使用NθN_\thetaNθ初始化一个有效的优化器vvv来计算可行和低成本的轨迹。
参考文献:
(1)Eiras F, Hawasly M, Albrecht S V, et al. A two-stage optimization-based motion planner for safe urban driving[J]. IEEE Transactions on Robotics, 2021, 38(2): 822-834.
(2)Pulver H, Eiras F, Carozza L, et al. PILOT: Efficient planning by imitation learning and optimisation for safe autonomous driving[C] //2021 IEEE/RSJ InternationalConference on Intelligent Robots and Systems (IROS). IEEE, 2021: 1442-1449.