Sand.AI 发布音画同步 AI 视频生成模型 GAGA-1-低调大师

Sand.AI 发布音画同步 AI 视频生成模型 GAGA-1

2025-10-11 307

清华博士曹越创立的 Sand.AI 发布了全新音画同步 AI 视频模型 GAGA-1，目前已经正式上线，无需邀请码、无需排队，目前全员免费开放使用，官网地址为 https://gaga.art。

据介绍，GAGA-1 的研发历时 6 个月，远超最初 “2 个月完成” 的预期，其核心亮点集中在人物表演维度，尤其带台词的表演已达影视级水平（短剧、影游级完全适配，部分满足电视剧级需求，暂未达电影级神韵）。

经实测，GAGA-1 能精准还原人物情绪（如失望、气愤、歇斯底里等），支持双人场景表演，甚至可识别外国人形象并生成蹩脚普通话，还具备唱歌功能。

关于后续规划，曹越透露，自定义音频、固定音色 ID 功能已接近完成，仅因工程进度未赶上此次发布；价格方面，虽未确定免费期限，但明确后续定价将远低于 Sora2 与 Veo3，现阶段可满足短剧创作、影游 NPC 对话生成、小说角色可视化等需求，为低成本视频创作提供新可能。

推荐阅读：清华博士带队，发布全球首个自回归视频生成大模型「Magi-1」

微信关注我们

原文链接：https://www.oschina.net/news/376786

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

苹果拟收购计算机视觉初创公司 Prompt AI 团队与技术

据 CNBC 报道，苹果正接近与计算机视觉初创公司 Prompt AI 达成交易，收购其团队与技术，而不一定是整体资产或母公司。这是一种典型的 “人才＋技术” 式收购（acqui-hire），用于快速吸纳关键 AI 能力。该媒体获得的音频显示，Prompt 领导层在周四的全体会议上向员工通报了这笔即将进行的交易，并表示那些最终没有加入苹果的员工将被降低薪水，并鼓励他们申请公司的空缺职位。高管们在会议上表示，这家拥有 11 名员工的公司还受到了其他潜在追求者的接洽，其中包括马斯克的xAI 和 Neuralink。 Prompt 成立于 2023 年，其代表产品 Seemour 能通过家庭摄像头识别人、宠物或物体，并用自然语言描述或提醒异常活动。业内分析认为，苹果此次动作意在强化智能家居与视觉 AI 技术布局，可能服务于 HomeKit、摄像头或家庭安全等生态。相比昂贵的整并，苹果正以更灵活的小型收购补强 AI 技术储备，继续追赶在生成式AI与智能设备融合上的竞争。

2025-10-11

263

随着开源鸿蒙生态的持续壮大，开发者迎来了除Android与iOS之外的“第三种选择”。为解决“加入一个新生态就会增加一倍投入”的行业痛点，让开发者的代码能够在更多平台上复用，开源鸿蒙跨平台框架PMC（筹）应运而生，标志着开源鸿蒙在应用开发基础设施建设层面迎来重大里程碑，也为整个行业带来“打破平台壁垒、提升开发效率”的全新可能。 9月25日，开源鸿蒙技术大会2025跨平台开发框架分论坛在湖南长沙国际会议中心举行。论坛汇聚了开源鸿蒙平台框架PMC（筹）成员代表以及来自产业界、学术界的各个领域的专家学者，聚焦探讨基于开源鸿蒙跨平台开发及三方库的实践案例和思考，主题涵盖了React Native、Flutter、QT、KMP以及国内的Kuikly、CJMP等多个技术框架，旨在共同开拓移动开发的新边界，共创跨平台生态的新时代。跨平台开发框架分论坛由华为终端BG OpenHarmony使能部开源技术专家傅小煜、华为终端BG开发者技术部跨平台框架技术专家曹银元担任出品人。跨平台开发框架分论坛成功举办跨平台开发框架分论坛现场论坛由开源鸿蒙项目群工作委员会执行主席章晓峰、华为开源管理中心主任柯猛做...

2025-10-11

347

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。