“全模态” Gemini Omni 来了,谷歌用自然对话重新定义视频创作
去年,Google推出了Nano Banana,将Gemini的智能带入了图像生成和编辑领域——帮助数百万人修复老照片、从草图开始设计、以此前无法实现的方式可视化创意。在I/O 2026大会上,Google宣布了这项能力的下一个延伸:Gemini Omni。 Gemini Omni将Gemini的推理能力与视频生成创作能力融合,是一款能够从任意输入创作内容的模型——从视频开始,用户可以结合图像、音频、视频和文本作为输入,生成基于Gemini真实世界知识的高质量视频,还可以通过对话轻松编辑视频。标志着在世界理解、全模态处理和视频编辑能力上的飞跃。 ...