用语义分割突破边界框
我们应该如何描述一个场景?我们可以说窗户下面有一张桌子,或者沙发右边有一盏灯。理解图像的关键就是:将场景分解成一个个单独的实体,这也有助于我们理解对象的行为。
对象检测有助于绘制某些实体周围的边界框。但人类想要对场景有真正的理解,还需要能够以像素级精度对每个实体的边界进行检测和标记。随着我们开始构建无人驾驶汽车和智能机器人,而这些就需要细致了解周围环境,因此,绘制边界框也变得越来越重要。
什么是语义分割?
语义分割是一项计算机视觉任务,我们将视觉输入的不同部分分成不同的语义解释类。“语义解释”,也就是说,这些类具有某些真实世界的含义。例如,我们可能想要获取属于汽车类别的图像的所有像素,并将其着色为蓝色。

虽然聚类等无监督算法可用于分割,但并不适用于语义分割。这些方法不会对他们接受过训练的类别上进行分割,而是更广义上找到区域的边界,参见T