MiniMax 发布最新语音模型 MiniMax Speech 2.6-低调大师

MiniMax 发布最新语音模型 MiniMax Speech 2.6

2025-10-30 183

MiniMax 发布了最新的语音模型 MiniMax Speech 2.6，全面升级突破Voice Agent场景，超低延时，专业格式无障碍，更高自然度。

1. 超低延时，更灵敏：整体交互更顺畅

对音频生成链路进行了全面优化，使端到端延迟低于250毫秒，达到了行业顶尖水平。在实时对话等对响应速度有严苛要求的场景中，音频生成不再是瓶颈，确保整体交互更流畅。

2. 专业格式无障碍，更聪明：信息传递更流畅

Speech 2.6 现已支持多种语言的网址、邮箱、电话号码、日期及金额等非标准文本格式的直接转换。无论您是结合大语言模型使用，还是需要在业务中处理动态变化的实体信息，都无需再进行繁琐的文本预处理。输入即正确，实现信息传递更流畅。

例如，在传统TTS中需要正确朗读下面一段话，则需要做一系列转换：

+1 415 415 9921 → “plus one, four one five, four one five, nine nine two one ”
$1,234.56 → “one thousand two hundred thirty-four dollars and fifty-six cents”
192.168.1.1 → “one nine two dot one six eight dot one dot one”
2032-5-6 → “May sixth, twenty thirty-two”
support-vip@technet.com → “support dash vip at technet dot com”

语段原文：Hello Oliver Smith, I'm your intelligent virtual assistant Max! Thank you for your call. I've found your file. The outstanding balance for the phone number +1 415 415 9921 is $1,234.56. The associated IP addresses is 192.168.1.1. Your next payment is due in 2032-5-6. If you have any questions, please contact support-vip@technet.com.

语段原文：您好Oliver Smith，我是您的智能虚拟助手Max！感谢您的来电，我已找到您的档案。电话号码14154159921 的未付清余额为 ¥1,234.56。关联的 IP 地址是 192.168.1.1。您的下一个付款到期日是 2032/5/6。如有任何疑问，请联系 support-vip@technet.com。

3. 更高自然度与Fluent LoRA：声音表达更流利

进一步提升了音韵自然度之外，Speech 2.6 还提供了Fluent LoRA。

此前Speech 2.5就提供了便捷、高还原度的音色复刻功能，用户能够保留原始音色的口音、口癖等特色。这一能力满足了实际使用场景中多样化的语音需求。

现在，音色复刻时，您无需再为不完美的原始素材而烦恼。即使是带有口音或不流利的非母语录音，也可通过 Fluent LoRA，在完美复刻音色的同时，生成符合目标文本的流利、自然的语音，让您的声音表达更流利。

除了视频里展示的英文场景外，模型支持的40+语种都可以实现在音色复刻时一键变流利，我们以日语场景为例：

Speech 2.6 已经全面上线：

MiniMax开放平台：Minimaxi.com/platform_overview

MiniMax Audio：Minimaxi.com/audio

微信关注我们

原文链接：https://www.oschina.net/news/380483

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

字体设计工具字玩 v0.3.4 发布，新增字母数字参数化模板雏形

字玩是一款开源的字体设计工具，致力于探索以参数化、脚本化的方式设计中文字库，帮助用户高效设计个性化字体。使用Vue3 + Tauri2开发，支持Web端、MacOS和Windows平台。开源地址：字玩在gitee| 字玩在github v0.3.4版本更新说明 1. 新增大写字母参数化模板雏形 2. 新增小写字母参数化模板雏形 3. 新增数字参数化模板雏形 4. 绘制部分基础西文参数化衬线这次更新主要使用程序绘制了西文参数化模板的雏形，可以实现基本的拖拽骨架调整字母数字字符结构。尽管字形还不太美观，还有很多可优化的空间。目前骨架结构比较简单，很多地方的曲率都不能修改，之后还会进一步优化。另外，这次更新也绘制了部分基础西文衬线，目前只设置了衬线类型和衬线大小两个相关参数，之后还会丰富可调参样式。

2025-10-31

196

近日，由中国卫生经济学会主办的中国卫生经济学会第二十六次学术年会分论坛六暨公立医院高质量发展分会学术年会在北京举办，本次会议以“智慧管理推动公立医院高质量发展”为主题，围绕智慧管理在优化医疗服务流程、提升医院运营效率、保障医疗质量安全等方面的实践路径与未来发展方向展开深入探讨。作为会议支持单位，东软集团总裁盖龙佳、副总裁兼医疗健康事业部总经理李东出席此次会议。中国卫生经济学会副会长、公立医院高质量发展分会会长、上海交通大学中国医院发展研究院院长许树强在致辞中指出，信息化、数字化、智能化对公立医院的影响已从“辅助支撑”转向“主动赋能”，如何让数智技术与医院管理深度融合、如何通过智慧手段构建更具韧性的医院组织与现代化治理体系、如何激活数据要素价值、打造高质量发展新引擎，是本次会议的核心议题，期待凝聚共识推动行业发展。本次会议聚焦公立医院高质量发展的关键阶段，来自行业主管部门、医疗卫生机构、科研单位等分享了各自的最新实践。其中，东软深度参与了多个案例，不仅见证了智慧医院与区域卫健信息化的前沿探索，也进一步印证了东软相关解决方案在助力公立医院改革与高质量发展中的技术领先性、实践有效性与生态...

2025-10-30

140

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。