百度蒸汽机发布通用 AI 长视频生成功能
“全球首个中文音视频一体化视频生成模型”百度蒸汽机今天宣布再次升级,并发布通用 AI 长视频生成功能。
该功能支持用户生成无限长度的 AI 视频。根据官方介绍,本次升级在行业尚属首次,突破了此前 AI 仅能生成 5 秒、10 秒短视频,或依赖首尾帧控制续写时长的局限,借助流式生成技术实现了在通用长视频上的“无限”生成能力。
就在上个月,百度蒸汽机音视频一体化模型完成 2.0 版本升级,在行业内首次实现多人有声视频一体化生成。
2.0 版本基于多模态时空规划、中文场景深度优化以及音视端到端建模等领先的技术能力,实现多人音视频一体化生成、复杂运镜、电影级的人物细腻表演、丰富镜头表现和流畅画质等。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
搜狗输入法回应被指“暗中篡改浏览器配置”:测试功能异常导致,已修复
针对被安全软件公司指控“暗中”篡改浏览器配置,搜狗输入法今日正式作出官方回应。 近日,我们关注到有关搜狗输入法“存在病毒漏洞”的不实信息。经核查,该问题源于一项尚未正式发布的测试功能,由于测试配置异常导致外部可访问。发现问题后,我们已于第一时间(9月20日)完成修复,不会对用户的实际使用造成影响。 对此给大家带来的困扰,我们深表歉意。后续我们将进一步加强测试流程的管理,防止类似情况再次发生。感谢大家对搜狗输入法监督和信任。 https://www.zhihu.com/question/1952759970803196309/answer/1954568475814105677 9月20日,火绒安全发布标题为《搜狗输入法云控下发模块,“暗中”篡改浏览器配置》的文章,称火绒威胁情报中心近期监测到一款专门锁定浏览器主页的病毒正加速蔓延。 经溯源,该病毒的源头指向搜狗输入法。
-
下一篇
国内最大人形机器人训练场在京启用,年产数据量超 600 万条
国内最大人形机器人训练场已于2025年9月25日在北京石景山正式启用。该训练场由石景山区政府牵头,京石科创集团、乐聚机器人联合运营,占地面积超万平方米,年产数据量超600万条。 数据是人形机器人实现智能化的核心要素。当前,具身智能行业面临着数据质量参差不齐、多模态数据采集门槛高、数据规模与场景泛化能力不足等痛点。尽管视觉语言动作模型(VLA)为机器人实现跨平台、跨场景泛化能力提供了技术路径,但其性能很大程度上依赖高质量、大规模训练数据的支撑。 同时,仿真数据、合成数据等无法完全复现真实物理交互、传感器噪声、环境动态扰动、执行器延迟等细节,而真机数据是模型从“纸上谈兵”走向“现实落地”的关键桥梁。 据负责人介绍,该训练场已建立全流程标准化数据体系,正积极推动异构数据融合与开放合作,所提供的数据集可直接用于训练通用型机器人基模型(Base Model),为行业构建跨本体、跨任务的数据公共基础,助力我国人形机器人产业实现标准化、规模化发展。
相关文章
文章评论
共有0条评论来说两句吧...




微信收款码
支付宝收款码