字节跳动发布视频生成基础大模型 Seaweed-7B
字节跳动近日公布了一个仅 70 亿参数的视频生成基础大模型「Seaweed-7B」。
令人惊喜的是,该模型以 66.5 万个 H100 GPU 小时训练成本,在文本/图像到视频生成任务中全面超越 140 亿参数的 Wan 2.1,具体来看:
- Seaweed-7B Elo 评分为 1047,胜率 58%,而 Wan 2.1 仅有 53%,OpenAI 的 Sora 更是仅有 36%
- 可实时生成分辨率为 1280×720、帧率为 24fps 的视频,比同类模型快 62 倍
- 40GB 显存即可支持 1280×720 分辨率生成
据官方介绍,Seaweed-7B 结合了变分自编码器(VAE)和潜在扩散变换器(DiT)。其中,VAE 负责高效的训练和推理,而 DiT 则通过扩散模型生成图像和视频,显著提高了生成的质量与效率。
另外,团队为了提升 Seaweed-7B 的训练效率,采用了多阶段训练策略和 GPU 资源的优化调配。预训练阶段通过低分辨率图像开始,逐步引入高分辨率视频训练,提升了模型的泛化能力。此外,在后训练阶段,通过监督微调和基于人类反馈的强化学习(RLHF)进一步提高了生成视频的美学质量和运动一致性。
目前,Seaweed-7B 相关报告已公开:https://seaweed.video/seaweed.pdf

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
马斯克:特斯拉将实现纯 AI 自动驾驶,仅需摄像头和 AI 芯片
马斯克近日在社交媒体发文称,特斯拉即将实现一种通用的、纯AI的全自动驾驶(FSD)解决方案。 据其介绍,这一技术将完全依赖于摄像头和特斯拉自主研发的AI芯片,并由特斯拉开发的AI软件驱动。实际上,这一声明与特斯拉长期以来坚持的仅靠视觉实现自动驾驶的愿景相一致。 值得注意的是,特斯拉官方X账号近日发布视频,称特斯拉德克萨斯工厂现在使用FSD无监督技术将汽车从生产线末端运送到发货物流区,同时宣布无监督FSD系统已积累超50000英里(约80467.22公里)驾驶里程,全程无需人工干预。 在特斯拉工厂内部,新款Model Y和Cybertruck实现了从生产线到交付停车场的自动行驶。自动驾驶车辆运用最新AI4硬件(4.0版),可应对交通标志、工厂建设、行人和机械化交通等复杂道路环境,且车辆间能相互通信以避免碰撞。 据悉,特斯拉无监督FSD公路测试计划即将开启,预计6月于奥斯汀率先开展。 相关阅读:马斯克:2024 年特斯拉 AI 投资约 100 亿美元、FSD 安全水平将超过人类
- 下一篇
特朗普政府考虑在美国禁用 DeepSeek
《纽约时报》周三报道称,特朗普政府正在考虑对中国人工智能实验室DeepSeek实施新的限制,限制其购买英伟达的人工智能芯片,并可能禁止美国人访问其人工智能服务。 这些限制是特朗普政府在人工智能领域与中国竞争的举措之一。在DeepSeek震惊硅谷和华尔街数月后,美国官员似乎正在权衡多种方案,以限制中国获取美国技术和消费者。 周二,白宫采取行动限制更多英伟达人工智能芯片以及AMD的计算卡产品向中国销售,加强拜登政府制定的规定。 近几个月来,DeepSeek在美国人工智能开发者中的人气飙升,这家初创公司具有竞争力的定价迫使硅谷以更低的成本提供前沿人工智能模型。 此前,OpenAI指控这家中国实验室对其模型进行了篡改,违反了OpenAI的使用条款。 相关阅读: OpenAI 呼吁美国政府禁止 DeepSeek 英伟达对华特供版 AI 芯片(H20 GPU)遭遇出口管制
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装Docker,最新的服务器搭配容器使用
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19