谷歌 NotebookLM 升级:支持 80 种语言的视频与音频概述
谷歌宣布其 AI 研究助手 NotebookLM 迎来重大更新,其 “Video Overviews(视频概述)” 功能现已支持 80 种语言(包括简体中文),并同步升级了 Audio Overviews(音频概述)。Video Overviews 最初于 7 月推出,此次更新后,全球用户可用本地语言生成笔记本内容的视频摘要。
此次升级的核心亮点如下:
-
视频概述扩展至 80 种语言:NotebookLM 的 AI 讲解视频功能现已面向全球用户,支持多达 80 种语言。用户可将笔记内容自动生成带有画面和解说的视频,更适合需要视觉化学习或分享的场景。
-
音频概述全面升级:原本仅提供简短亮点的 “音频概述” 如今扩展为完整版本,覆盖与英文版同等质量的连贯讲解,并同步支持多语言。这意味着无论用户选择何种语言,都能获得深度的音频总结体验。
-
内容更长,生成更灵活:Google 同时强化了 NotebookLM 的 Studio 面板。用户现在可在一个笔记本中生成多个不同版本的音频或视频概述,以满足不同受众与学习目标的需求。
从最初的 “播客式音频总结” 到如今支持图表、网页、幻灯片甚至视频讲解,NotebookLM 正逐步演变为一个集多模态知识提炼、个性化讲解于一体的 AI 学习与研究助手。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
快手可灵&港大提出 Context-as-Memory,上下文记忆力媲美 Genie3 且问世更早
香港大学和快手可灵团队近日联合发表论文《Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval》,提出一种创新性方法:将历史生成的上下文作为“记忆”(即Context-as-Memory),通过context learning 技术学习上下文条件,从而实现对长视频前后场景一致性的有效控制。研究发现:视频生成模型能够隐式学习视频数据中的 3D 先验,无需显式 3D 建模辅助,这一理念与 Genie 3 不谋而合。 为了高效利用理论上可无限延长的历史帧序列,论文还提出了基于相机轨迹视场(FOV)的记忆检索机制(Memory Retrieval),从全部历史帧中筛选出与当前生成视频高度相关的帧作为记忆条件,大幅提升视频生成的计算效率并降低训练成本。 在数据构建上,研究团队基于 Unreal Engine 5 收集了多样化场景、带有精确相机轨迹标注的长视频,用于充分训练和测试上述技术。用户只需提供一张初始图像,即可沿设定的相机轨迹自由探索生成的虚拟世界。 根据介绍,C...
- 下一篇
亚马逊 AGI 实验室掌门人首度回应
去年,当亚马逊以一种前所未有的方式招揽AI初创公司Adept的创始团队时,整个行业都为之震动。这种被称为"反向人才收购"的全新交易模式,让大型科技公司无需完全收购初创企业,而是通过挖走核心团队并获得技术授权来达到目的。 这场交易的核心人物David Luan,从Adept联合创始人兼CEO摇身一变,成为了亚马逊全新AGI实验室的掌舵人。如今,面对外界的质疑声浪,Luan终于打破沉默,在接受The Verge采访时为自己的选择进行了辩护。 当被问及这种"反向人才收购"趋势时,Luan的回应颇具深意。他坦言希望自己未来能够"作为AI研究创新者而非交易结构创新者被人们铭记"。但从他的角度来看,像亚马逊这样的科技巨头在当下"集中人才和计算资源的关键质量"是完全合理的战略选择。 更加引人深思的是Luan对于离开自己创立公司的解释。他毫不讳言地表示,自己并不愿意将Adept打造成"一家只销售小型模型的企业级公司"。在他眼中,还有"通向AGI的四个关键研究难题"亟待解决,而这正是他真正的使命所在。 最令人震撼的是Luan对于资源需求的坦率描述。他直言不讳地指出,要解决这些核心问题,"每一个都需要价值...
相关文章
文章评论
共有0条评论来说两句吧...