字节跳动发布视频生成基础大模型 Seaweed-7B-低调大师

字节跳动发布视频生成基础大模型 Seaweed-7B

2025-04-17 430

字节跳动近日公布了一个仅 70 亿参数的视频生成基础大模型「Seaweed-7B」。

令人惊喜的是，该模型以 66.5 万个 H100 GPU 小时训练成本，在文本/图像到视频生成任务中全面超越 140 亿参数的 Wan 2.1，具体来看：

Seaweed-7B Elo 评分为 1047，胜率 58%，而 Wan 2.1 仅有 53%，OpenAI 的 Sora 更是仅有 36%
可实时生成分辨率为 1280×720、帧率为 24fps 的视频，比同类模型快 62 倍
40GB 显存即可支持 1280×720 分辨率生成

据官方介绍，Seaweed-7B 结合了变分自编码器（VAE）和潜在扩散变换器（DiT）。其中，VAE 负责高效的训练和推理，而 DiT 则通过扩散模型生成图像和视频，显著提高了生成的质量与效率。

另外，团队为了提升 Seaweed-7B 的训练效率，采用了多阶段训练策略和 GPU 资源的优化调配。预训练阶段通过低分辨率图像开始，逐步引入高分辨率视频训练，提升了模型的泛化能力。此外，在后训练阶段，通过监督微调和基于人类反馈的强化学习（RLHF）进一步提高了生成视频的美学质量和运动一致性。

目前，Seaweed-7B 相关报告已公开：https://seaweed.video/seaweed.pdf

微信关注我们

原文链接：https://www.oschina.net/news/345103/bytedance-seaweed-video

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

马斯克：特斯拉将实现纯 AI 自动驾驶，仅需摄像头和 AI 芯片

马斯克近日在社交媒体发文称，特斯拉即将实现一种通用的、纯AI的全自动驾驶（FSD）解决方案。据其介绍，这一技术将完全依赖于摄像头和特斯拉自主研发的AI芯片，并由特斯拉开发的AI软件驱动。实际上，这一声明与特斯拉长期以来坚持的仅靠视觉实现自动驾驶的愿景相一致。值得注意的是，特斯拉官方X账号近日发布视频，称特斯拉德克萨斯工厂现在使用FSD无监督技术将汽车从生产线末端运送到发货物流区，同时宣布无监督FSD系统已积累超50000英里（约80467.22公里）驾驶里程，全程无需人工干预。在特斯拉工厂内部，新款Model Y和Cybertruck实现了从生产线到交付停车场的自动行驶。自动驾驶车辆运用最新AI4硬件（4.0版），可应对交通标志、工厂建设、行人和机械化交通等复杂道路环境，且车辆间能相互通信以避免碰撞。据悉，特斯拉无监督FSD公路测试计划即将开启，预计6月于奥斯汀率先开展。相关阅读：马斯克：2024 年特斯拉 AI 投资约 100 亿美元、FSD 安全水平将超过人类

2025-04-17

249

《纽约时报》周三报道称，特朗普政府正在考虑对中国人工智能实验室DeepSeek实施新的限制，限制其购买英伟达的人工智能芯片，并可能禁止美国人访问其人工智能服务。这些限制是特朗普政府在人工智能领域与中国竞争的举措之一。在DeepSeek震惊硅谷和华尔街数月后，美国官员似乎正在权衡多种方案，以限制中国获取美国技术和消费者。周二，白宫采取行动限制更多英伟达人工智能芯片以及AMD的计算卡产品向中国销售，加强拜登政府制定的规定。近几个月来，DeepSeek在美国人工智能开发者中的人气飙升，这家初创公司具有竞争力的定价迫使硅谷以更低的成本提供前沿人工智能模型。此前，OpenAI指控这家中国实验室对其模型进行了篡改，违反了OpenAI的使用条款。相关阅读： OpenAI 呼吁美国政府禁止 DeepSeek 英伟达对华特供版 AI 芯片（H20 GPU）遭遇出口管制

2025-04-17

189

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。