MiniMax 上线 AI 音色设计功能
MiniMax 稀宇科技宣布旗下 MiniMax Audio 上线了「Voice Design 音色设计」功能。
音色的维度一般分成音频质量、发声方式、情感基调以及人物画像。该功能根据用户对音色需求的描述,模型自动拆解成音色相关的描述信息,并根据上述的描述来得到一个新的音色编码。同视频模型类似,该功能支持对音色的抽卡,如果不满意,多试几次,很容易得到理想中的专属独一音色,并可存储下来做后续的音频内容创作。
据介绍,通过 Voice Design 音色设计,用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制,甚至生成世界上不存在的音色。同时,Voice Design 与 Speech 02 语音模型在链路上相配合,用户在文字转语音中可真正实现了「所需即所得」,以「任意语言 × 任意口音 × 任意音色」,实现可全自定义的无限组合。
此外,Voice Design 解决了语音合成领域的两个挑战:难以精准匹配用户各个细分场景下的多样需求;复刻音色需要用户花费大量时间准备输入素材,并且存在潜在的版权风险。
目前,Voice Design 已上线 MiniMax Audio 国内、海外两个版本。
- 国内版:minimaxi.com/audio
- 海外版:minimax.io/audio

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
空间理解模型 SpatialLM 正式发布首份技术报告
近日,空间理解模型SpatialLM正式发布首份技术报告。这一模型此前曾与DeepSeek-V3、通义千问Qwen2.5-Omni一起登上全球最大的开源社区HuggingFace全球趋势榜前三。 作为一款将大语言模型扩展到3D空间理解任务中的模型,SpatialLM能从3D点云输入生成结构化的空间场景描述,这一过程突破了大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,为具身智能等相关领域提供空间理解基础训练框架。 在开源后经过广泛的实际验证,本次技术报告聚焦SpatialLM 1.1升级版本,其不仅包含了详细的消融实验与训练配方,还在点云编码方式、分辨率、用户指定识别类目等维度上实现优化。 多项基准测试数据显示:该模型在任务数据集微调后,在空间布局识别、3D物体检测任务中,均达到了相比与最新专业模型持平或更优的效果。 本次报告重点围绕算法框架和训练数据两方面展开。 在算法架构方面,SpatialLM将大语言模型(LLMs)扩展到3D空间理解任务中,特别在结构化室内建模领域实现了重要突破。 这一技术路线打破了传统任务专属架构(task-specific arc...
- 下一篇
curl 之父发文介绍 OpenSSL 分支家族
curl 之父近日发表文章介绍 OpenSSL 分支家族,展示了它们的差异、相似之处,以及支持它们所需的一些见解。 译文如下: curl 支持使用 11 种不同的 TLS 库进行编译。其中六个库是 OpenSSL 或其分支。让我向你展示它们的差异、相似之处,以及支持它们所需的一些见解。 SSLeay 这一切都始于 SSLeay。这是我发现的第一个 SSL 库,我们使用这个库在 1998 年春天为 curl 添加了第一个 HTTPS 支持。显然,SSLeay 项目早在 1995 年就已经启动了。 那是一个我们还只支持 SSL 的年代;TLS 会在之后才出现。 OpenSSL 一直拥有一个古怪、不一致且极其庞大的 API 集(其中一大部分是从 SSLeay 继承而来的),这进一步被稀疏的文档所复杂化,这些文档留给用户去依靠自己的想象力和技能去查阅源代码,以获取最后的细节解答(即使在 2025 年今天也是如此)。在 curl 中,我们经常收到关于如何使用这个库的偶尔问题报告,即使已经过了几十年。 presumably,这同样适用于所有 OpenSSL 用户。 OpenSSL 项目经常受到批评...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启