视频剪辑中花式抠图的代码实操与案例详述
本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第三期,讲述围绕 视频剪辑及数字人训练中的抠图需求,如何运用 绿幕抠图、实景抠图能力,实现高效、便捷的视频制作及合成体验。
昱尘|作者
悬刃|算法支持
“你这背景太假了”,博主疆域阿力木因为背景太好看而被质疑,随后画风突转,网友们通过“抠图技术”将博主合成到各种视频背景中,其搞笑程度一度冲上热搜。
抠图技术常常被应用在众多场景中,发挥着越来越重要的作用。
比如:直播带货场景中,商家通常会搭建绿幕背景,使用“绿幕抠图”技术,将绿幕背景替换成与商品相关的图片或视频,帮助消费者更加直观地了解产品的使用方法、功能及特点;或是在短视频营销中,通过“实景抠图”技术,将人像和指定物品从任意背景中抠出,替换成各种风景图片或视频,增加视频对观众的吸引力……
抠图技术也在数字人训练领域发挥着越来越重要的作用,数字人训练需要去除背景,只保留人物视频,才能做后续的分析训练处理,使用绿幕抠图及实景抠图可以完美解决数字人训练素材的抠图问题。
IMS云端智能剪辑已将绿幕抠图以及实景抠图集成到了智能时间线Timeline中,客户可以使用IMS基础剪辑能力、调用IMS数字人视频合成接口、智能时间线Timeline。
本文主要介绍三种场景下的抠图技术,展现如何花式抠图。
三种场景下的抠图技术
场景一:绿幕
生成训练数字人所需要的透明背景素材
训练数字人,在拍摄人物动作视频之后,通常需要将原始素材进行二次处理,生成只保留人像且背景透明的webm,或者生成代表人像区域和代表背景区域的黑白遮罩视频,我们分别来讲解如何利用绿幕抠图分别生成这两种视频。
「云端智能剪辑」时间线Timeline中支持设置AI_Matting这个Effect,并支持设置Color为Green或者Blue两种抠图模式(绿幕抠图或蓝幕抠图),若期望生成带透明通道的webm,可以在OutputMediaConfig指定文件后缀名为webm即可。
这是该场景中使用的素材示例:https://v.youku.com/v_show/id_XNjAxOTE3Njk2MA==.html
生成透明webm
成片效果视频:https://v.youku.com/v_show/id_XNjAxOTE3NzA0OA==.html
Timeline示例:
{ "VideoTracks": [{ "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/material.mp4", "Effects": [{ "Type": "AI_Matting", "Color": "Green" }] }] }] }
{ "Height": 1920, "Width": 1080, "MediaURL": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/output.webm" }
生成黑白遮罩视频
合成webm由于编码器本身速度较慢的原因,耗时方面可能会不满足用户诉求,我们建议客户在抠图的同时添加背景、字幕等直接输出mp4成片。还有一种场景是客户要输出黑白透明通道视频,在前端展示、后续的剪辑处理中使用(Timeline中支持传入黑白透明通道视频对原素材进行遮罩),通过在AI_Matting这个Effect下增加MaskMode:true参数,黑色部分表示背景,白色部分表示人物位置和动作信息。
成片效果视频:https://v.youku.com/v_show/id_XNjAxNjQ4ODAwOA==.html
Timeline示例:
{ "VideoTracks": [{ "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/material.mp4", "Effects": [{ "Type": "AI_Matting", "Color": "Green", "MaskMode": true }] }] }] }
场景二:实景
仅保留人像,不保留其他物体
在背景是家具环境或者其他不方便搭建绿幕背景的情况时,需要利用实景抠图,将人像从背景中抠出,并替换其他图片背景或者视频背景。使用IMS云端智能剪辑时,可以通过一个Timeline,一次性完成抠图、背景裁剪、替换背景、增加字幕、增加配乐的所有操作。
使用AI_RealMatting这个Effect,可以一键式地将人物信息从任意背景中抠出,您可以选择什么都不做,直接输出只有人像、背景透明的webm或者黑白遮罩视频,也可以选择替换背景、增加字幕、配乐,丰富视频内容,本章节主要介绍后者。
这是该场景中使用的素材示例:https://v.youku.com/v_show/id_XNjAxNjQ4NjcyMA==.html
背景图:
背景音乐(该BGM由AIGC生成):https://v.youku.com/v_show/id_XNjAxOTE3NzQ0MA==.html
成片效果视频:https://v.youku.com/v_show/id_XNjAxOTE4NjQzNg==.html
Timeline示例:
{ "VideoTracks": [{ "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/background.jpg", "Type": "GlobalImage", "Width": 1080, "Height": 1920, "AdaptMode": "Cover", "Effects": [{ "Type": "Crop", "X": 0.0, "Y": 0.0, "Height": 0.7, "Width": 1 }] }] }, { "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/material.mp4", "Width": 1080, "Height": 1920, "AdaptMode": "Cover", "Effects": [{ "Type": "AI_RealMatting" }] }] } ], "SubtitleTracks": [{ "SubtitleTrackClips": [{ "Type": "Text", "X": 0.02, "Y": 0.02, "Content": "《美妆小课堂》", "FontSize": 80, "EffectColorStyle": "CS0001-000012", "Font": "Source Han Sans CN" }, { "Type": "Text", "X": 0.2, "Y": 0.7, "Content": "金牌美妆师", "FontSize": 80, "EffectColorStyle": "CS0001-000014" } ] }], "AudioTracks": [{ "AudioTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/aigc_bgm.wav" }] }] }
Tips:
➤ GlobalImage可以在背景图片或者logo上使用,会自适应将图片的时长设定为视频的总时长;
➤ AdaptMode:Cover,可以将图片放大到指定的Width和Height上,如果素材的宽高比和设置的Width和Height不符,会自动进行裁剪;
➤ 在字幕轨道上,可以一键式设置花字样式,设置EffectColorStyle为相应的花字Id,丰富视频内容。
场景三:实景+其他物体保留
保留人像、桌子以及桌子上的物体
如果需要在实景抠图中,保留视频中除了人像以外的其他物体,我们还即将会支持自然语言形式的抠图物体保留能力。
基于CLIP语言图像预训练模型技术,我们能够有效分析视频中的物体类别信息,通过大模型技术有效保留抠图视频除了人像之外其他需要保留的物体。
可以设置AI_RealMatting这个Effect下的ReserveObjects数组内容,指定需要保留的物体自然语言名称,比如在本示例中,我们期望保留桌子和手机,就可以设置ReserveObjects为phone和desk组成的数组。
成片效果视频:https://v.youku.com/v_show/id_XNjAxOTE4NjQ4MA==.html
Timeline示例:
{ "VideoTracks": [{ "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/background.jpg", "Type": "GlobalImage", "Width": 1080, "Height": 1920, "AdaptMode": "Cover", "Effects": [{ "Type": "Crop", "X": 0.0, "Y": 0.0, "Height": 0.7, "Width": 1 }] }] }, { "VideoTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/material.mp4", "Width": 1080, "Height": 1920, "AdaptMode": "Cover", "Effects": [{ "Type": "AI_RealMatting", "ReserveObjects": ["phone", "desk"] }] }] } ], "SubtitleTracks": [{ "SubtitleTrackClips": [{ "Type": "Text", "X": 0.02, "Y": 0.02, "Content": "《美妆小课堂》", "FontSize": 80, "EffectColorStyle": "CS0001-000012", "Font": "Source Han Sans CN" }, { "Type": "Text", "X": 0.2, "Y": 0.7, "Content": "金牌美妆师", "FontSize": 80, "EffectColorStyle": "CS0001-000014" } ] }], "AudioTracks": [{ "AudioTrackClips": [{ "MediaUrl": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/aigc_bgm.wav" }] }] }
智能媒体服务IMS(Intelligent Media Services)是2021年5月正式商业化的一款云产品,其中的云剪辑功能主打视频生产能力,通过组织剪辑需要的时间线(Timeline)结构,即可在云端对用户的音视频素材进行剪辑,可以理解为IMS云端智能剪辑就是一款API版的iMovie。
本篇主要讲解绿幕抠图、实景抠图技术在视频剪辑及数字人训练中的使用,IMS云端智能剪辑还融入了众多AI能力,助力提高开发者的视频生产效率。
欢迎加入官方答疑钉钉群咨询交流:31783668

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
9.23IvorySQL@北京用户组技术沙龙向您发出邀请!
「IvorySQL地区用户组线下沙龙」活动已在济南、成都成功举办两期,IvorySQL很开心与社区伙伴们一起畅聊技术和开源文化,让更多优秀的小伙伴和其技术实践经验在社区中展示。 9 月 23 日(周六)下午,北京的小伙伴们!第三期IvorySQL地区用户组技术沙龙@北京站来啦!!! 本次活动以数据库国产化替代的技术难点和应对为主题,邀请瀚高数据库技术大咖,PG行业资深技术专家等优秀工程师来分享国产数据库替代的技术难点和应对以及畅聊PostgreSQL的最新实践。 无论你是否了解或使用过IvorySQL,我们都非常欢迎你报名参加本次活动,🧋咖啡茶点快乐水、丰富的社区周边应有尽有!最最最...重要的是,社区伙伴都期待着彼此的到来!🤗 01 讲师议题报名 02北京用户组报名 如果您还没有加入北京用户组,扫描二维码即可报名,我们会在 24 小时内联系您。 03用户组成员福利 首批社区成员大礼包个人荣誉证书、马克杯、短袖、棒球帽、毛毡包等。 04 合作伙伴招募 🙋合作伙伴需要:在社群、公众号发布活动信息; 💁♂️合作伙伴权益:免费活动现场、活动宣传物料、合作伙伴Logo展出。 ?...
- 下一篇
「程序员转型技术管理」必修的 10 个能力提升方向
对许多开发者而言,深耕技术,然后成为技术专家或许是职业发展的唯一答案。但如果你赞同「软件开发只是我众多职业目标中的一个」,也许你可以试试「技术管理之路」。 我原来觉得和计算机打交道比跟人打交道轻松得多,所以我成了一名软件开发者。一段时间后,我发现自己越来越多地在给别人提供帮助;我喜欢领导项目,热衷于推动更好的代码标准。于是,我几乎毫无挣扎地成为了一名技术管理者。 尽管这些年,外界有许多声音反复提及「技术管理转型」,但大多数开发者并不清楚「从技术到管理,我需要作出哪些适应和改变?」 如果你想要尝试探索技术管理之路,首先请你坦诚地回答几个问题: 为什么想要当技术管理者? 想成为哪种技术管理者?想对人负责,对项目负责,还是对业务负责? 你的转型动力是什么?是编写代码和构建软件吗?还是帮他人获得更好的结果、与利益相关者协商交付时间、说服业务团队代码重构并非浪费光阴? 如果你现在仍然确信技术管理很适合你,那么你需要为此做一些准备——与上层领导或者导师合作,在不甚熟悉的领域向他们寻求帮助。下面介绍十个重点提升方向。 01 技术领导力 真正的领导者不需要头衔或权力也能领导团队。拥有华丽头衔或被组织赋...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2全家桶,快速入门学习开发网站教程