阿里达摩院突破自动驾驶技术难题:实现3D物体检测精度速度兼得
云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
最新消息,阿里达摩院又有新的研究进展,这次在自动驾驶3D物体检测领域。
达摩院的研究人员提出一个通用、高性能的检测器,在自动驾驶领域最重要的测试集之一 KITTI的鸟瞰(BEV)数据集上,检测速度达到25FPS ,一举占据榜首,与排名第二的方案相比,减少了一半多,同时精度也远超其他的单阶段检测器。可以说首次实现3D物体检测精度与速度兼得。
达摩院研究团队表示:“检测器是自动驾驶系统的核心组件之一,但该领域一直缺少创新和突破,此次我们实现3D检测精读和速度的提升,将有助于提高自动驾驶系统的安全性。”
从实验结果来看,他们显然取得了良好进展,而且研究的主要完成人员(一作),还是一名达摩院的实习生。
同时,该研究也得到了同行们的认可,被计算机视觉领域顶级会议CVPR 2020收录。他们是如何做到的呢?我们借助阿里达摩院提供的解读,一一来看。
如何实现精度和速度兼得?
众所周知,与普通2D图像识别应用不同,自动驾驶系统对精度和速度的要求更高,不仅需要快速识别周围环境的物体,还要对物体在三维空间中的位置做精准定位。
仅靠传感器和算法模型,通常无法平衡视觉识别的精度和速度。因此,检测器成为提升自动驾驶系统安全性的一个关键因素。
经过多年研究,当前业界主流的单阶段检测器在检测速度上很好,但在检测精度却差强人意。
这就是达摩院研究的出发点:寻找一种能二者兼得的方法。
他们提出的思路是:将两阶段检测器中对特征进行细粒度刻画的思想,移植到单阶段检测中。
在他们的模型中,用于部署的检测器, 即推断网络, 由一个骨干网络和检测头组成。
骨干网络用3D的稀疏网络实现,用于提取含有高语义的体素特征。检测头将体素特征压缩成鸟瞰图表示,并在上面运行2D全卷积网络来预测3D物体框。
他们在训练中利用一个辅助网络将单阶段检测器中的体素特征,转化为点级特征并施加一定的监督信号。
在实现上,他们将卷积特征中的非零信号映射到原始的点云空间中, 然后在每个点上进行插值,来获取卷积特征的点级表示。使得卷积特征也具有结构感知能力,来提高检测精度。
而在做模型推断时,辅助网络并不参与计算(detached),保证单阶段检测器的检测效率。
另外,他们还提出一个工程上的改进:Part-sensitive Warping (PSWarp),用于处理单阶段检测器中存在的 “框-置信度-不匹配” 问题。
核心思路是:利用采样器, 用生成的采样网格在对应的局部敏感特征图上进行采样,生成对齐好的特征图。最终能反映置信度的特征图,是K个对齐好特征图的平均。
单阶段方法,能达到两阶段方法精度
阿里达摩院的研究人员,在KITTI数据集上评估了方法的有效性。下图(PR Curve)中,实线为两阶段方法, 虚线为单阶段方法。
可以看出,达摩院提出的单阶段方法(黑色)能够达到两阶段方法才能达到的精度。
下图展示了他们在KITTI 鸟瞰(BEV) 和 3D 测试集上的结果。
可以看出,他们提出的方法,可以在不增加额外计算量的情况下,达到25FPS 的检测速度,而且还能保持精度。具体的检测效果如下:
两位共同一作,都是达摩院研究实习生
研究论文,标题为“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人员参与,分别来自阿里达摩院和香港理工大学。
第一作者是Chenhang He,是阿里达摩院的研究实习生,正在香港理工大学读博,预计2022年毕业。
他的导师是达摩院高级研究员、香港理工大学电子计算学系讲座教授、IEEE Fellow张磊,也是这一研究的通讯作者。
另一位第一作者Hui Zeng,也是是阿里达摩院的研究实习生,同样是张磊的博士生,预计在今年毕业。
其他作者,分别是达摩院高级研究员、IEEE Fellow华先胜、达摩院资深算法专家黄建强等。
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
TNWX 2.4.0 版本发布,微信系开发脚手架
TNWX: TypeScript + Node.js + WeiXin 微信系开发脚手架,支持微信公众号、微信支付、微信小游戏、微信小程序、企业号/企业微信、企业微信开放平台、微信开放平台。最最最重要的是能快速的集成至任何 Node.js 框架(Express、Nest、Egg、Koa 等) 支持微信开放平台,更新内容如下: 优化模块之间的包依赖 ApiConfig 中suiteTicket 修改为ticket 新增第三方平台推送的票据事件(component_verify_ticket) 新增授权变更通知推送事件(授权、取消授权、更新授权) 构建第三方平台授权链接,支持授权注册页面扫码授权、点击移动端链接快速授权 获取第三方平台接口的调用凭据(component_access_token) 获取接口调用令牌(authorizer_access_token) 兼容处理代公众号处理消息和事件 兼容处理代公众号使用JSSDK 新增代公众号发起网页授权相关接口(OpenMpSnsAccessTokenApi) 新增微信支付唤起支付时所需参数二次签名 感谢 @YunGouOS 提供微信开放平台...
- 下一篇
200G vs 400G:谁是数据中心网络下一站?
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 互联网联接全球 40 亿多用户,支撑着VR/AR、16K视频、自动驾驶、人工智能、5G、物联网等层出不穷的数字化应用。教育、医疗、办公等用户线上与线下的结合,正在影响和改变人们生活的方方面面。 数据中心网络,作为互联网业务赖以生存和发展的基础设施,早已从最初的千兆、万兆网络,走到了“25G接入+100G互联”规模部署的阶段。 100G互联:全盒架构被大型互联网企业看重 “25G接入+100G互联”的架构下,数据中心网络通过三级组网实现大规模接入,单集群服务器规模可以超过10万台。 如下图所示,基于T1和T2层的Pod可以像乐高积木一样灵活扩展,按需建设。 图1:右侧引用自 https://techblog.comsoc.org/2019/03/18/facebooks-f16-achieves-400g-effective-intra-dc-speeds-using-100ge-fabric-switches-and-100g-optics-other-hyperscalers/ 随着大...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Docker安装Oracle12C,快速搭建Oracle学习环境