智谱上线并开源工业级语音合成系统 GLM‑TTS-低调大师

智谱上线并开源工业级语音合成系统 GLM‑TTS

2025-12-11 106

智谱AI宣布正式上线并开源 GLM‑TTS 工业级语音合成系统。

据介绍，只需 3 秒语音样本，GLM‑TTS 即可学习说话人的音色和说话习惯。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中，实现自然流畅、贴近真人的语音。

GLM‑TTS 在架构上采用两阶段生成，并在训练中引入基于 GRPO 的强化学习方案，在公开评测的「字错误率」和「情感表达」上取得开源 SOTA 表现。

GLM‑TTS 基于 GRPO 框架，引入多维度奖励和稳定训练机制，在可控前提下提升模型的表达力和鲁棒性。

强化学习采用了训练数据与合成数据相结合的数据构造模式，实现了几乎零成本的数据生成。通过与训练算法的优化协同，有效避免了奖励欺骗（reward hacking），从而保证了模型性能的真实性和泛化能力，在未见过的测试集上同样取得了理想效果。

值得一提的是，GLM-TTS 仅使用 10w 小时训练数据，远低于行业主流商用模型。同时，GLM-TTS 也兼顾了训练成本和效果，预训练仅需要单机 4 天即可得到开源 SOTA“发音准确度”与超高“音色还原度”，精品音色 LORA 和强化学习也仅需要单机 1 天即可完成训练，远低于行业平均水平。

另外，GLM‑TTS 还以更低的价格获得了行业领先的 MOS 分数（平均主观意见分）。

GLM‑TTS 相关资源（模型权重、推理脚本、示例项目等）：

GitHub：https://github.com/zai-org/GLM-TTS
Hugging Face：https://huggingface.co/zai-org/GLM-TTS

微信关注我们

原文链接：https://www.oschina.net/news/389143

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Let's Encrypt 证书服务上线 10 周年

Let’s Encrypt 宣布证书服务已上线十周年。自 2015 年 9 月 14 日发布首张受信任的 TLS 证书以来，这个由 ISRG（Internet Security Research Group）运营的公益项目，其使命是通过免费、自动化 TLS/SSL 证书，让网页更容易启用 HTTPS，从而提升网络安全与隐私，目前已成为全球最重要的加密基础设施之一。在十年间，Let’s Encrypt 的证书发行量从最初的百万级跃升至如今的单日可发放近千万张证书，累计规模推动其覆盖接近十亿个活跃网站。这一爆炸式增长依托其“免费 + 自动化”的设计，也使 HTTPS 成为互联网的默认安全标准。官方数据称，全球网页的 HTTPS 使用率已从十年前的不足 30% 提升到约 80%，美国等地区甚至长期维持在 95% 左右。剩余未加密流量多来自组织内部网或私有系统。为应对指数级增长，Let’s Encrypt 十年间完成了多次基础设施演进：从获取并独立运营根证书，到支持通配符域名、短期证书、IP 证书，再到提升网络链路、扩展日志和数据库架构，以确保在高流量下保持稳定。 Let’s Encry...

2025-12-10

104

根据《智能涌现》的独家报道，前闪极 AI 合伙人、前字节视觉大模型 AI 平台负责人潘欣，近期已经加入美团。潘欣曾任谷歌大脑（Google Deepmind）研究员，推动 TensorFlow 动态图模式开发。回国后，他先后在百度、腾讯与字节跳动任职。具体来看，百度期间，潘欣曾主导 PaddlePaddle 平台优化、无量深度学习框架构建，而后任腾讯、字节跳动 AIGC 和视觉大模型 AI 平台负责人，业务方向集中在多模态领域。此后，2024 年 11 月，其加入闪极科技，担任 AI 合伙人，整体负责 AI 技术研发及智能眼镜项目。据了解，入职美团后，潘欣负责多模态 AI 创新工作，主导了 LongCat App 等多个相关应用的开发。报道指出，2025 年，美团的关键词是外卖大战与 AI。但今年第二季度起，国内开始了轰轰烈烈的外卖大战。压力之下，美团将有限的子弹，先放在了基座模型的训练上。据知情人士透露，2025 年，美团在包括预训练、业务侧 AI 应用方面的招聘积极性并没有减少。“今年美团招聘的 AI 人才集中在模型训练方面，招聘标准也很高，人才主要来自阿里通义、Seed ...

2025-12-11

81

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。