谷歌推出了超越 Sora 的 Veo 2,生成 8 秒超逼真视频
谷歌 DeepMind 终于将大家期待已久的 Veo 2 整合到 GeminiApp 应用中,全面开放使用。
Veo 是谷歌迄今为止最强大的视频生成模型。它可以生成各种电影和视觉风格的视频,捕捉提示中的细微之处,以便在各个画面中一致呈现精致细节。
据介绍,Veo 2 可以最高生成 8 秒 720P 电影级视频,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优秀,同时支持图片转视频功能。谷歌公布的测试数据显示,Veo 2 在用户偏好和提示还原方面已经超过了 Sora、可灵1.5、Meta Movie Gen 和 Minimax。
开发者可以在 Google AI Studio 中通过 API 使用 Veo 2。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Reachy 2 开源人形机器人 7 万美元正式开售
Pollen Robotics 推出其最新开源人形机器人Reachy2,正式开启销售,定价为7万美元。 Reachy2并非面向消费市场,而是专为AI与机器人实验室设计,目标是推动开源机器人生态的发展。据 AIbase了解,这款机器人已在Cornell大学、Carnegie Mellon大学及多家顶级AI实验室投入使用。 Reachy2 以其高度仿人的外形与交互能力脱颖而出,主要亮点如下: 仿人设计:配备双臂、头部及独特的天线,Reachy2的7自由度(DoF)手臂模仿成人手臂的尺寸与运动方式,可实现自然、精准的动作,每只手臂能负重高达3公斤。 全向移动:其移动底盘采用三全向轮设计,结合LiDAR与多传感器系统,确保平滑、精准的导航,适应多样化应用场景。 丰富的传感器阵列:集成双1080p摄像头、麦克风阵列、扬声器、LiDAR及惯性测量单元(IMU),为环境感知与交互提供强大支持。 开源与模块化:基于ROS2和Hugging Face的LeRobotHF框架,Reachy2支持Python SDK编程,开发者可轻松扩展与定制功能,满足特定研究或应用需求。 目前,Reachy2已被全球2...
- 下一篇
豆包 1.5·深度思考模型发布
在今日火山引擎AI创新巡展杭州站现场,火山引擎总裁谭待发布了最新的豆包1.5·深度思考模型,升级豆包·文生图模型3.0、豆包·视觉理解模型。 同时,面向Agent服务,发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件。 据透露,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。 豆包1.5·深度思考模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。同时,模型采用MoE架构,总参数200B,激活参数为20B,低于业界同类模型参数规模的50%,具备显著的推理成本优势。基于高效算法,豆包1.5·深度思考模型在提供行业极高并发承载能力的同时,实现20毫秒极低延迟。 此外,豆包1.5·深度思考模型还具备视觉理解能力,可以像人类一样,不光基于文字思考,更能基于所见画面思考,思考更立体,让模型同时拥有“...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品