阿里通义开源音频语言模型 Qwen2-Audio-低调大师

阿里通义开源音频语言模型 Qwen2-Audio

2024-08-13 445

通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。具有以下特点：

语音聊天：用户可以使用语音向音频语言模型发出指令，无需通过自动语音识别（ASR）模块。
音频分析：该模型能够根据文本指令分析音频信息，包括语音、声音、音乐等。
多语言支持：该模型支持超过8种语言和方言，例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。

Qwen2-Audio的模型结构包含一个Qwen大语言模型和一个音频编码器。在预训练阶段，依次进行ASR、AAC等多任务预训练以实现音频与语言的对齐，接着通过SFT（监督微调）强化模型处理下游任务的能力，再通过 DPO（直接偏好优化）方法加强模型与人类偏好的对齐。

目前通义团队同步开源了基础模型 Qwen2-Audio-7B 及其指令跟随版本 Qwen2-Audio-7B-Instruct。

微信关注我们

原文链接：https://www.oschina.net/news/306796/qwen2-audio

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

首发！麒麟软件打造的跨平台通用 Linux 端间互联组件 Klink 正式开源

随着智能终端设备的普及，多个智能终端设备之间的互联互通应用场景日益丰富。多设备互联互通应用场景需要开发者单独实现通讯协议，为解决跨平台问题，麒麟软件打造了跨平台的通用Linux端间互联组件——Klink，并在开源社区openKylin（开放麒麟）发布。 Klink是由麒麟软件在2021年开始打造的端间互联组件，也是通用Linux上最早兼容鸿蒙软总线的通信组件，支持在Linux上跨平台设备之间的发现、连接、组网、认证及数据安全传输。Klink解耦了软总线模块对多系统平台的应用，使包括openKylin桌面操作系统、银河麒麟桌面操作系统等在内的各种主流Linux发行版皆可跨平台互联互通，大幅扩展了生态边界，为我国基础软件健康开放发展做出了贡献。麒麟软件旗下星光麒麟万物智联操作系统，以“弹性扩展、智能互联、内生安全、统一框架”的产品特性，针对国家、行业、企业和个人数字化应用需求，开启了面向全场景的新一代操作系统创新之路。其中智能互联特性就是以Klink作为统一通信底座，实现了两大端间互联能力：分布式硬件资源共享能力抽象终端设备硬件能力为显示、摄像头、音频等基础能力，基于Klink技术实...

2024-08-13

433

ChatGPT Mirror 后台是一个 ChatGPT 镜像站，允许多账号共享管理。实现多人同时使用 ChatGPT 服务，同时还支持 API 对外开放，方便开发者进行对接。 GitHub 地址：https://github.com/dairoot/ChatGPT-Mirror 功能简介提供与官网同等的极致体验。提供ChatGPT聊天接口转 API /v1/chat/completions 用户无需魔法，便可轻松访问并使用ChatGPT官方网站的所有功能。提供便捷的管理后台，帮助管理员高效管理账号。在线体验 https://chatgpt.dairoot.cn 账号：dairoot 密码：dairoot 在部署之前，请先观看以下视频教程，以确保获得最佳体验。本地一键部署 # 本地需要科学上网 docker pull dairoot/chatgpt-mirror docker run -p 50001:50001 -p 443:443 \ -e ADMIN_USERNAME=管理后台账号 \ -e ADMIN_PASSWORD=管理后台密码 \ dai...

2024-08-13

643

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。