【新智元专访】 阿里巴巴“NASA计划”新进展:刷新视觉计算世界纪录
5月18日,机器视觉算法测评平台KITTI的世界纪录再次被刷新——阿里云将其车辆检测的准确率拉升至90.46%。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。
该成果公布后,新智元第一时间采访到了华先胜,解读他们所提出的基于区域融合决策和上下文相关的多任务深度神经网络。另外,就准确率上的疑惑、GAN思想的应用等问题,华先胜也与新智元进行了分享。
在这次比赛中,他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。
华先胜对新智元表示,他们所设计的网络结构融合了目标的空间信息、自身属性信息、上下文信息以及局部相关性等多种信息,最终构建了一个多任务深度神经网络结构。另外以区域(region)为单位还设计了融合决策机制,进一步优化每个目标的检测结果。他们所提