无人驾驶的下一个飞跃:预测
来源:智车科技    作者:商用汽车网    浏览:2068    2020-02-21 01:14:18

本文为Voyage公司Oliver Cameron分享的一篇文章,他认为深度学习对感知能力进步让无人驾驶有了很大的进步,而无人驾驶的下一个飞跃可能是预测能力。


深度学习对目标检测算法的提升


在过去的十年中,自动驾驶机器学习社区中的大多数话题都集中在目标检测上。 如何提高自动驾驶汽车对所有动态物体的检测和跟踪能力? 2010年,在深度学习变得很常见之前,感知是自动驾驶汽车功能的主要限制。一辆汽车具有如此高的误报率和误报率是不可接受的。ImageNet分类准确度可以很好地说明这一点,最新的解决方案在2010年的准确度仅为50%(今天是88%)。 尽管ImageNet分类与对象检测方面的最新技术并不能一一列举,但它确实可以作为计算机视觉技术进步的象征。


两年后的2012年,AlexNet成为ImageNet竞赛的第一批参赛者之一,该竞赛利用了深度学习和卷积神经网络。自2012年在ImageNet上获得最先进的准确性之后,AlexNet可能是计算机视觉中最具影响力的论文。


无论是应用于激光雷达,相机还是雷达的深度学习技术,都在2014年左右开始渗透到无人驾驶技术中。


如今,用于感知的深度学习在自动驾驶汽车中已司空见惯,因此,我们继续看到性能的惊人提升。 近年来,诸如VoxelNet,PIXOR和PointPillars之类的网络推动了我们在计算机视觉方面的思考。尽管我们绝不应该假设机器人已经获得了完美的感知,但是计算机视觉的最新发展已经发生了巨大变化,以至于它现在可以说不是自动驾驶汽车商业部署的主要障碍。


注意,以上陈述是基于具有多种传感器模式的自动驾驶汽车,其中包括飞行时间传感器,该传感器返回物理准确的深度信息以馈入您的感知模型。 抱歉,特斯拉!


既然感知不是自动驾驶的大火,那么下一步是什么? 预测!


预测的艺术


现在我们可以安全地检测到周围的关键物体,所以必须预测它们下一步将要做什么。正确的预测意味着我们将在正确的时间执行正确的操作,同时考虑到周围人的行动。错误的预测意味着我们可能会陷入危险的境地。作为人类,我们使用数千个环境输入直观地执行此预测。


预测问题对于无保护的左转弯最困难实例至关重要。无人驾驶汽车必须在执行转弯之前预测其周围所有动态代理的未来动作,这项任务比自动驾驶中的其他问题需要更多的智能。人类驾驶员尽管不是十全十美,但在很大程度上依靠通用情报,真实世界的驾驶经验和社交线索(例如轻推或手动信号)来成功执行不受保护的左转弯。



尽管机器比人类具有明显的优势(例如360°远程视野),但与人类相比,自动驾驶技术中的传统预测可能是非常原始的:


1.感知模块会在自动驾驶汽车的一定半径内输出一组物体检测结果(例如车辆,行人),然后将其输入到预测模块中;


2.然后预测模块会使用当前(例如方向,速度)和以前的观察结果来生成有关每个目标在接下来的5秒钟内可能做什么的单独预测;


3.通过将所有这些单独的预测输入算法,就可以得出关于自动驾驶汽车可以执行的最安全动作的假设;


4.自动驾驶开始执行规定的操作并每100毫秒重新评估该决定。


我们可以想象这种机器人方法会导致不舒适甚至潜在的危险驾驶行为,尤其是在密集的城市环境中。在过去的几年中,我们看到了深度学习预测方法的实现爆炸式增长。这些方法有可能显著提高预测的准确性,将其从机器人转换为类似人类的预测。


用数据驱动的方法解决这些原始的预测,与在深度学习中如何取代深度学习在2010年代中期极为相似。


企业预测研究实例


这是一些实际的例子。


克鲁斯(Cruise)的感知工程经理曾就他们如何将预测作为分类问题进行了精彩的演讲。


Uber在DRF-Net上分享了他们的工作,该DRF-Net增强了行人的预测能力:“广泛的实验表明,我们的模型优于几个强基准,表现出高可能性,低误差,低熵和高多模态。 DRF-NET离散预测的强大性能对于基于成本的受限机器人计划非常有前途。”


苹果公司发表了一篇名为“最坏案例政策梯度”的新颖的强化学习论文:“构建智能系统的主要挑战之一是开发在复杂环境中做出可靠,安全的顺序决策的能力。”


isee在CVPR 2019上发布了他们关于学习的预测方法的工作:“这种MAT编码自然可以处理具有不同数量的代理的场景,并通过与代理数量成线性关系的计算复杂性来预测场景中所有代理的轨迹,在MAT上进行卷积运算。”


尽管预测尚未达到所需的性能,但我们将看到数据驱动方法在预测性能方面的巨大飞跃,其方式与深度学习对经典感知的影响非常相似。这些即将到来的飞跃将极大地改善自动驾驶汽车的决策,从而为乘客提供更安全,更顺畅的乘车体验。