CVPR论文 | 基于尺度空间变换的本征图像分解
小叽导语:以CNN为代表的深度神经网络作为通用的函数映射关系拟合器在对图像数据的处理中展现了广泛的优越性。本工作针对图像到图像的转换问题,利用图像的尺度空间(scale space),设计了一个基于图像尺度空间分解的通用神经网络,刷新了图像分解问题在标准数据集上的测试性能,并可见用于深度重建和像素标记等常见视觉问题。
摘要
我们引入了一种新的网络结构,用于将图像分解为其本征的反射图像和光照图像。我们把它看作是一个图像到图像的转换问题,并且将输入和输出在尺度空间进行分解。通过将输出图像(反射图像和光照图像)扩展到它们的拉普拉斯金字塔的各个成分,我们开发了一种多通道网络结构,可以在每个通道内并行地学习到一个图像到图像转换函数,这个函数通过一个具有跳过连接的卷积神经网络来表示。该网络结构是通用的和可扩展的,并且已经在本征图像分解问题上表现出
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
蚂蚁实时视频通话技术和实践
小叽导读:从电影、电视到电脑、手机,人们获取视频信息的方式越来越方便、快捷。时下较热门的视频通话、互动直播时长占据了当下年轻人很大一部分的生活时间,可见实时视频技术在生活中的重要性。今天,蚂蚁金服高级技术专家樟松将为我们揭秘“蚂蚁实时视频通话系统”的技术架构及特点,讲述实时视频通话的底层技术以及其运用。 引子 直播作为一种品牌推广、业务拓展的便捷运营工具,最近几年得到爆发式发展,直播技术也相应地得到快速升级,从单纯的广播式向实时互动式演进,即连麦互动直播。 ARTVCS:蚂蚁实时视频通话系统,从P2P的双人视频通话开始向多人视频通话和连麦直播方向融合、演进。 技术选型 场景和核心需求基本明确,该选择什么技术路线呢? 我们先回顾连麦互动直播场景,主播在直播过程中,(可能多位)嘉宾连线主播,进入聊天室,与主播进行视频通话,其他粉丝观看主播和嘉宾实
- 下一篇
ACM MM 论文 | 用于行人重识别的多层相似度感知CNN网络
小叽导读: 行人重识别是指给定一个摄像头下某个行人的图片,在其他摄像头对应的图片中准确地找到同一个人。行人重识别技术有十分重要的科研和实际应用价值,近来广泛应用到交通、安防等领域,对于创建平安城市、智慧城市具有重要的意义。可能有人会说“人脸技术”的应用已经很成熟了,然而在复杂的实际场景中,由于低分辨率、遮挡、不同角度等各种原因,“人脸”很难看清。因此,利用人的全身信息来做检索就变得非常有必要。本篇论文收录于ACM MM 2017(多媒体领域世界顶级会议),提出了全新的基于 CNN 的行人重识别方法,接下来,我们一起进行深入思考。 作者:申晨、金仲明、赵一儒、付志航、蒋荣欣、陈耀武、华先胜 摘要 行人重识别(person re-ID)的目的是识别多个摄像头视角中的相关行人,这项任务在计算机视觉社区中已经得到了越来越多的关注。我们在本论文中
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果