MiniMax 发布最新语音模型 MiniMax Speech 2.6
MiniMax 发布了最新的语音模型 MiniMax Speech 2.6,全面升级突破Voice Agent场景,超低延时,专业格式无障碍,更高自然度。
1. 超低延时,更灵敏:整体交互更顺畅
对音频生成链路进行了全面优化,使端到端延迟低于250毫秒,达到了行业顶尖水平。在实时对话等对响应速度有严苛要求的场景中,音频生成不再是瓶颈,确保整体交互更流畅。
2. 专业格式无障碍,更聪明:信息传递更流畅
Speech 2.6 现已支持多种语言的网址、邮箱、电话号码、日期及金额等非标准文本格式的直接转换。无论您是结合大语言模型使用,还是需要在业务中处理动态变化的实体信息,都无需再进行繁琐的文本预处理。输入即正确,实现信息传递更流畅。
例如,在传统TTS中需要正确朗读下面一段话,则需要做一系列转换:
- 
  +1 415 415 9921 → “plus one, four one five, four one five, nine nine two one ” 
- 
  $1,234.56 → “one thousand two hundred thirty-four dollars and fifty-six cents” 
- 
  192.168.1.1 → “one nine two dot one six eight dot one dot one” 
- 
  2032-5-6 → “May sixth, twenty thirty-two” 
- 
  support-vip@technet.com → “support dash vip at technet dot com” 
语段原文:Hello Oliver Smith, I'm your intelligent virtual assistant Max! Thank you for your call. I've found your file. The outstanding balance for the phone number +1 415 415 9921 is $1,234.56. The associated IP addresses is 192.168.1.1. Your next payment is due in 2032-5-6. If you have any questions, please contact support-vip@technet.com.
语段原文:您好Oliver Smith,我是您的智能虚拟助手Max!感谢您的来电,我已找到您的档案。电话号码14154159921 的未付清余额为 ¥1,234.56。关联的 IP 地址是 192.168.1.1。您的下一个付款到期日是 2032/5/6。如有任何疑问,请联系 support-vip@technet.com。
3. 更高自然度与Fluent LoRA:声音表达更流利
进一步提升了音韵自然度之外,Speech 2.6 还提供了Fluent LoRA。
此前Speech 2.5就提供了便捷、高还原度的音色复刻功能,用户能够保留原始音色的口音、口癖等特色。这一能力满足了实际使用场景中多样化的语音需求。
现在,音色复刻时,您无需再为不完美的原始素材而烦恼。即使是带有口音或不流利的非母语录音,也可通过 Fluent LoRA,在完美复刻音色的同时,生成符合目标文本的流利、自然的语音,让您的声音表达更流利。
除了视频里展示的英文场景外,模型支持的40+语种都可以实现在音色复刻时一键变流利,我们以日语场景为例:
Speech 2.6 已经全面上线:
MiniMax开放平台:Minimaxi.com/platform_overview
MiniMax Audio:Minimaxi.com/audio
 关注公众号
关注公众号
					低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 
							
								
								    上一篇
								      字体设计工具字玩 v0.3.4 发布,新增字母数字参数化模板雏形字玩是一款开源的字体设计工具,致力于探索以参数化、脚本化的方式设计中文字库,帮助用户高效设计个性化字体。使用Vue3 + Tauri2开发,支持Web端、MacOS和Windows平台。 开源地址: 字玩在gitee| 字玩在github v0.3.4版本更新说明 1. 新增大写字母参数化模板雏形 2. 新增小写字母参数化模板雏形 3. 新增数字参数化模板雏形 4. 绘制部分基础西文参数化衬线 这次更新主要使用程序绘制了西文参数化模板的雏形,可以实现基本的拖拽骨架调整字母数字字符结构。尽管字形还不太美观,还有很多可优化的空间。目前骨架结构比较简单,很多地方的曲率都不能修改,之后还会进一步优化。 另外,这次更新也绘制了部分基础西文衬线,目前只设置了衬线类型和衬线大小两个相关参数,之后还会丰富可调参样式。 
- 
							
								
								    下一篇
								      东软出席中国卫生经济学会公立医院高质量发展分会学术年会近日,由中国卫生经济学会主办的中国卫生经济学会第二十六次学术年会分论坛六暨公立医院高质量发展分会学术年会在北京举办,本次会议以“智慧管理推动公立医院高质量发展”为主题,围绕智慧管理在优化医疗服务流程、提升医院运营效率、保障医疗质量安全等方面的实践路径与未来发展方向展开深入探讨。作为会议支持单位,东软集团总裁盖龙佳、副总裁兼医疗健康事业部总经理李东出席此次会议。 中国卫生经济学会副会长、公立医院高质量发展分会会长、上海交通大学中国医院发展研究院院长许树强在致辞中指出,信息化、数字化、智能化对公立医院的影响已从“辅助支撑”转向“主动赋能”,如何让数智技术与医院管理深度融合、如何通过智慧手段构建更具韧性的医院组织与现代化治理体系、如何激活数据要素价值、打造高质量发展新引擎,是本次会议的核心议题,期待凝聚共识推动行业发展。 本次会议聚焦公立医院高质量发展的关键阶段,来自行业主管部门、医疗卫生机构、科研单位等分享了各自的最新实践。其中,东软深度参与了多个案例,不仅见证了智慧医院与区域卫健信息化的前沿探索,也进一步印证了东软相关解决方案在助力公立医院改革与高质量发展中的技术领先性、实践有效性与生态... 
相关文章
文章评论
共有0条评论来说两句吧...

 
			
 
				 
				 
				 
				 
				 
				 
				



 微信收款码
微信收款码 支付宝收款码
支付宝收款码