CutLER:一种用于无监督目标检测和实例分割的方法
本文分享自华为云社区《CutLER:一种用于无监督目标检测和实例分割的方法》,作者:Hint。
目标检测是计算机视觉中的一种重要任务,使AI系统感知、推理、理解目标。训练定位模型需要特别的标注,比如目标的框、掩膜、定位点等。本文的工作研究了无监督的目标检测和实例分割,不使用人工标注。首先提出了MaskCut方法,可以自动的生成初始的粗糙掩膜,然后提出一种简单损失函数来帮助检测出MaskCut遗漏的目标。最后发现预测出的掩膜比初始的掩膜还要精细,因此可以迭代的训练检测器,进一步优化。
该方法的总体框架如上图所示,该模型首先使用了DINO[2]的自监督特征来生成二值掩膜,结合了Normalizes Cuts技术,改善了该技术中只能生成单个前景目标掩膜的缺陷,具体见公式2、3。这样就获得了一张图片中多个前景目标的粗糙掩膜。
然而在标准的检测训练损失函数中,会惩罚预测区域和ground truth区域不重叠的位置。这限制了检测器去发现新的目标,所以作者提出了一个新的损失函数,当预测和粗糙掩膜的IoU超过一定阈值时,该预测才参与loss的计算。最后作者采用了多轮次的迭代训练,进一步提升了模型的性能。
作者在多个数据集上进行实验,从以下的实验结果来看,该方法的性能在Zero-shot任务中达到SOTA效果,相比其他无监督方法提升效果显著,作者也证明了各个创新点的有效性。
可视化效果:
[1] Wang X, Girdhar R, Yu S X, et al. Cut and learn for unsupervised object detection and instance segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023: 3124-3134.
[2] Mathilde Caron, Hugo Touvron, Ishan Misra, Herv ́e J ́egou, Julien Mairal, Piotr Bojanowski, and Armand Joulin. Emerging properties in self-supervised vision transformers. In Proceedings of the IEEE/CVF International Conference on Computer Vision, pages 9650–9660, 2021. 1, 2, 3, 4, 6, 12

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
零代码搭建一个微信小程序
本文分享自华为云社区《【新手指引】体验通过Astro Zero零代码快速搭建微信小程序》,作者:华为云Astro 。 您将学会如何基于Astro零代码能力,DIY开发,完成问卷、投票、信息收集、流程处理等工作,还能够在线筛选、分析数据。实现一站式快速开发个性化应用,体验轻松拖拽开发的乐趣。 您需要什么 环境准备 注册华为云账号、实名认证 如果您已拥有华为账号且已通过实名认证,可直接体验。 若您还没有通过实名认证的账号,可通过下方指导,完成个人或企业账号的实名认证。 企业帐号如何完成实名认证 个人帐号如何完成实名认证 资源准备 申请免费试用Astro Zero: 本次体验使用免费版Astro Zero即可完成,点击链接“申请免费试用Astro Zero”,完成免费版的资源领取。 进入运行环境显示如下页面就完成了资源的所有准备了 应用构建部分: 点击模板中心 点击全部,找到《新手指引》模板,并安装。 安装好的模板如下: 检查应用处在可编辑状态下才可编辑表单,(显示退出编辑),依次点击编辑表单。 逐一拖拽左侧组件至中间画布区域,通过右侧属性面板了解每个组件的使用场景及功能;最右侧工具栏可了解...
- 下一篇
带你快速上手HetuEngine
本文分享自华为云社区《【手把手带你玩转HetuEngine】(一)HetuEngine快速上手》,作者:HetuEngine九级代言。 HetuEngine是什么 HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎。与大数据生态无缝融合,实现海量数据秒级交互式查询;支持跨源跨域统一访问,使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine适合做什么 适用于Hadoop集群(FusionInsight MRS)的Hive、Hudi数据源的交互式快速查询场景; 适用于跨源(多种数据源,如Hive,Hudi,HBase,GaussDB(DWS),Elasticsearch,ClickHouse等)查询; 适用于跨域(多个地域或数据中心)的快速联合查询; 不擅长大批量、复杂逻辑的跑批处理、创建事务、数据入库操作等。 HetuEngine特点 HetuEngine基本架构 HetuEngine面向企业级能力方面,构建了极致稳定、高性能的企业级交互式分析引擎。 云服务层:提供了企业级的运维管理监控能力,认证与业务接入统一访问入口,友好的可视化界面操作,一键式参数...
相关文章
文章评论
共有0条评论来说两句吧...