【计算机视觉这一年】万字长文盘点近百篇代表论文、应用和市场(全文报告下载)
本报告包括以下内容:
- 第一部分:分类/定位,目标检测,目标追踪
- 第二部分:分割,超分辨率,自动上色,风格迁移,动作识别
- 第三部分:3D世界理解
- 第四部分:卷积网络架构,数据集,新兴应用
计算机视觉通常是指赋予机器视觉的能力,或赋予机器能够直观地分析它们的环境和内在的刺激。这个过程通常包括对一个图像、很多图像或视频的评估。英国机器视觉协会(BMVA)将计算机视觉定义为“自动提取、分析和理解来自单个图像或一系列图像的有用信息的过程”。
这个定义中的“理解”这个词说明了计算机视觉的重要性和复杂性。对我们的环境的真正理解不是仅仅通过视觉表现来实现的。相反,视觉信号通过视觉神经传递给主视觉皮层,并由大脑来解释。从这些感官信息中得出的解释包含了我们的自然编程和主观体验的总体,即进化是如何让我们生存下来,以及我们在生活中对世界的