字节跳动发布豆包视频生成大模型
字节跳动今天在深圳举办2024火山引擎 AI 创新巡展,并发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型等产品。
据悉,豆包·视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力。
据火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角,带来真实世界的体验。支持包括黑白、3D 动画、2D 动画、国画等多种风格,包含1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配于各种终端,以及电影、手机竖屏等不同画幅。
字节跳动表示,豆包·视频生成模型可以大幅降低动画的制作成本,生动的呈现童话故事情节。此外,还有城市文旅、音乐 MV、微电影、短剧等应用场景,都可以通过豆包·视频生成模型实现降本提效和创意合规。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
从 11.2 万亿元到 53.9 万亿元
经济日报消息称,党的十八大以来,我国先后印发数字经济发展战略、“十四五”数字经济发展规划,推动数字经济蓬勃发展。数字经济规模由2012年的11.2万亿元增长至2023年的53.9万亿元,11年间规模扩张了3.8倍。 人工智能加速迭代 今年是我国全功能接入国际互联网30周年。“经过30年发展,我国已经拥有10.9亿网民,形成全球最大的数字消费市场。2023年,我国网络零售额达15.42万亿元,连续11年居世界首位;移动支付规模相比2012年增长了239倍。”工业和信息化部总工程师赵志国说。 人工智能是引领新一轮科技革命和产业变革的重要驱动力。近年来,生成式人工智能技术加速迭代,为各行各业创新发展和转型升级提供了新的工具和视角。截至2023年底,我国人工智能核心产业规模接近5800亿元。 工业和信息化部部长金壮龙表示,人工智能为经济社会发展注入新动能,正在深刻改变人们的生活生产方式。要聚焦人形机器人、脑机接口、元宇宙、下一代互联网、6G、量子科技、原子级制造、深海空天开发等领域,实施一批科研攻关项目、突破一批关键核心技术、形成一批标志性产品。 数字产业蓬勃发展 数字经济主要包括数字产业化和...
- 下一篇
开源日报 | 微软开源C++库Proxy 3;字节发布豆包视频生成大模型;开源苹果手机备份工具;腾讯发布第五代机器人;纯血鸿蒙应用适配工作量大
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.9.24 今日要闻 腾讯发布第五代机器人 The Five 腾讯 Robotics X 实验室公布最新机器人研究进展,推出人居环境机器人 “5 号”(The Five,小五),目标是成为可以与人居环境和谐相处的通用机器人。 该机器人拥有四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项能力。可在真实人居环境中完成行走、搬运物体等动作,处理复杂任务,与人进行交互。 字节跳动发布豆包视频生成大模型 字节跳动今天在深圳举办 2024 火山引擎 AI 创新巡展,并发布豆包・视频生成模型以及豆包・音乐模型、豆包・同声传译模型等产品。 据悉,豆包・视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力。 据火山引擎介绍,豆包视频生成模型基于 DiT 架构,通过高效的 DiT 融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角,带来真实世界的体验。支持包括黑白、3D 动画、2D 动画、国画等多种风格,包含 1:1、...
相关文章
文章评论
共有0条评论来说两句吧...