AudioGPT —— 基于 LLM 的音频助手-低调大师

AudioGPT —— 基于 LLM 的音频助手

2023-05-10 668

AudioGPT 是一个借助大语言模型 (LLM) 处理音频的工具。

AudioGPT 在收到用户请求时使用 ChatGPT 进行任务分析，根据语音基础模型中可用的功能描述选择模型，用选定的语音基础模型执行用户指令，并根据执行结果汇总响应。借助 ChatGPT 强大的语言能力和众多的语音基础模型，AudioGPT 能够完成几乎所有语音领域的任务。

具体来说，AudioGPT 运行过程可以分成 4 个阶段：模态转化、任务分析、模型分配和回复生成。

AudioGPT 核心功能

生成音乐
背景音效
音频生成字幕
文字生成音频
文字生成音频并模拟声音
根据图片生成音频
对音频进行inpaint（局部屏蔽）
根据音频和人脸照片合成视频
检测音频中的事件，以及开始和结束时间
单声道变双声道
通过文本描述检测特定声音发生的时间
抽取某种声音
去除背景噪音
多人混合声分离出单人声音
语音翻译

微信关注我们

原文链接：https://www.oschina.net/p/audiogpt

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Easy Retry 发布 v1.2.0 版本

分布式系统大行其道的当前，系统数据的准确性和正确性是重大的挑战，基于 CAP 理论，采用柔性事务，保障系统可用性以及数据的最终一致性成为技术共识为了保障分布式服务的可用性，服务容错性，服务数据一致性以及服务间掉用的网络问题。依据 "墨菲定律"，增加核心流程重试，数据核对校验成为提高系统鲁棒性常用的技术方案特性易用性业务接入成本小。避免依赖研发人员的技术水平，保障重试的稳定性灵活性能够动态调整配置，启动 / 停止任务，以及终止运行中的重试数据操作简单分钟上手，支持 WEB 页面对重试数据 CRUD 操作。数据大盘实时管控系统重试数据多样化退避策略Cron、固定间隔、等级触发、随机时间触发容器化部署服务端支持 docker 容器部署高性能调度平台支持服务端节点动态扩容和缩容多样化重试类型支持 ONLY_LOCAL、ONLY_REMOTE、LOCAL_REMOTE 多种重试类型重试数据管理可以做到重试数据不丢失、重试数据一键回放支持多样化的告警方式邮箱、企业微信、钉钉、飞书客户端与服务端数据交互图 #系统架构图分布式系统重试的重要性在分布式系统中，由于网络延...

2023-05-10

483

日前，一款由欧洲航天局（European Space Agency）赞助，并由苏黎世联邦理工学院和博洛尼亚大学的研究人员开发的 Occamy 处理器已经流片。该芯片采用两组 32 位 216 核 RISC-V 架构 chiplet（一共 432 核），外加未知数量的 64 位 FPU 用于矩阵计算，以及两个来自美光的 16GB HBM2e 内存（总共 32GB）。这款处理器的内核通过中间层互连，可提供 0.75 FP64 TFLOPS 和 6 FP8 TFLOPS 的计算能力。然而，欧洲航天局及其开发合作伙伴都没有透露 Occamy 的功耗，不过传言称该芯片采用的是被动散热，也就是说这是一款低功耗处理器。采用 chiplet 设计是该芯片的优势之一，因为它可以在后续封装中加入具有其他功能的小芯片，以在必要时提高某些负载能力。Occamy 的尺寸大约为 73 平方毫米，总共有 10 亿个晶体管，并采用 GlobalFoundries 的 12 纳米工艺打造。 73 平方毫米的芯片并不是一个特别大的芯片。例如，英特尔的 Alder Lake 采用的是 10 纳米工艺，芯片尺寸为 163...

2023-05-10

1106

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。