Sand.AI 发布音画同步 AI 视频生成模型 GAGA-1
清华博士曹越创立的 Sand.AI 发布了全新音画同步 AI 视频模型 GAGA-1,目前已经正式上线,无需邀请码、无需排队,目前全员免费开放使用,官网地址为 https://gaga.art。
据介绍,GAGA-1 的研发历时 6 个月,远超最初 “2 个月完成” 的预期,其核心亮点集中在人物表演维度,尤其带台词的表演已达影视级水平(短剧、影游级完全适配,部分满足电视剧级需求,暂未达电影级神韵)。
经实测,GAGA-1 能精准还原人物情绪(如失望、气愤、歇斯底里等),支持双人场景表演,甚至可识别外国人形象并生成蹩脚普通话,还具备唱歌功能。
关于后续规划,曹越透露,自定义音频、固定音色 ID 功能已接近完成,仅因工程进度未赶上此次发布;价格方面,虽未确定免费期限,但明确后续定价将远低于 Sora2 与 Veo3,现阶段可满足短剧创作、影游 NPC 对话生成、小说角色可视化等需求,为低成本视频创作提供新可能。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
苹果拟收购计算机视觉初创公司 Prompt AI 团队与技术
据 CNBC 报道,苹果正接近与计算机视觉初创公司 Prompt AI 达成交易,收购其团队与技术,而不一定是整体资产或母公司。这是一种典型的 “人才+技术” 式收购(acqui-hire),用于快速吸纳关键 AI 能力。 该媒体获得的音频显示,Prompt 领导层在周四的全体会议上向员工通报了这笔即将进行的交易,并表示那些最终没有加入苹果的员工将被降低薪水,并鼓励他们申请公司的空缺职位。 高管们在会议上表示,这家拥有 11 名员工的公司还受到了其他潜在追求者的接洽,其中包括马斯克的xAI 和 Neuralink。 Prompt 成立于 2023 年,其代表产品 Seemour 能通过家庭摄像头识别人、宠物或物体,并用自然语言描述或提醒异常活动。 业内分析认为,苹果此次动作意在 强化智能家居与视觉 AI 技术布局,可能服务于 HomeKit、摄像头或家庭安全等生态。相比昂贵的整并,苹果正以更灵活的小型收购补强 AI 技术储备,继续追赶在生成式AI与智能设备融合上的竞争。
-
下一篇
开源鸿蒙技术大会2025 | 跨平台开发框架分论坛:共拓移动开发新边界,共创跨平台生态新时代
随着开源鸿蒙生态的持续壮大,开发者迎来了除Android与iOS之外的“第三种选择”。为解决“加入一个新生态就会增加一倍投入”的行业痛点,让开发者的代码能够在更多平台上复用,开源鸿蒙跨平台框架PMC(筹)应运而生,标志着开源鸿蒙在应用开发基础设施建设层面迎来重大里程碑,也为整个行业带来“打破平台壁垒、提升开发效率”的全新可能。 9月25日,开源鸿蒙技术大会2025跨平台开发框架分论坛在湖南长沙国际会议中心举行。论坛汇聚了开源鸿蒙平台框架PMC(筹)成员代表以及来自产业界、学术界的各个领域的专家学者,聚焦探讨基于开源鸿蒙跨平台开发及三方库的实践案例和思考,主题涵盖了React Native、Flutter、QT、KMP以及国内的Kuikly、CJMP等多个技术框架,旨在共同开拓移动开发的新边界,共创跨平台生态的新时代。跨平台开发框架分论坛由华为终端BG OpenHarmony使能部开源技术专家傅小煜、华为终端BG开发者技术部跨平台框架技术专家曹银元担任出品人。 跨平台开发框架分论坛成功举办 跨平台开发框架分论坛现场 论坛由开源鸿蒙项目群工作委员会执行主席章晓峰、华为开源管理中心主任柯猛做...
相关文章
文章评论
共有0条评论来说两句吧...