开源 MoE 模型 Mixtral 8x7B 性能超过 GPT-3.5
大模型创业公司 Mistral AI 终于介绍了前两天“开源”的 MoE 模型 Mixtral 8x7B。
官方称,Mixtral 8x7B 是开放权重的高质量稀疏混合专家模型 (SMoE),采用 Apache 2.0 License 开源。在大多数基准测试中,Mixtral 的成绩都优于 Llama 2-70B,且推理速度提升了 6 倍。而且在大多数标准基准测试中超过 GPT-3.5。
因此,Mistral AI 称 Mixtral 是最强大的开放权重模型,也是成本/性能权衡方面的最佳模型。
Mixtral 主要特性
• 32k上下文
• 支持英语、法语、意大利语、德语和西班牙语
• 性能超过 Llama 2 系列和GPT-3.5
• 在代码生成方面具有强劲性能
• 在 MT-Bench 上获得 8.3 分
Mixtral 作为稀疏混合专家网络,是一个纯解码器模型,其中前馈块从 8 组不同的参数组中选择。在每一层,对于每个 token,路由网络选择两组“专家”来处理 token 并相加地结合它们的输出。
Mixtral 总共有 45B 个参数,但每个 token 只使用 12B 个参数。因此,它以与 12B 模型相同的速度和成本处理输入和生成输出。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
荣耀申请魔方大模型商标
天眼查信息显示,荣耀终端有限公司近日申请注册“荣耀魔方大模型”商标,国际分类为网站服务,当前商标状态为等待实质审查。 此前,该公司曾申请两枚“MAGIC大模型”商标。荣耀 CEO 赵明曾发文称,荣耀即将推出自研端侧 AI 大模型和全新云服务。
- 下一篇
GaussDB SQL基础语法示例-常见的条件表达式
目录 一、前言 二、条件表达式的概念及GaussDB中的常见条件表达式 三、GaussDB中常用的条件表达式(语法 + 示例) 1、CASE表达式 2、DECODE表达式 3、COALESCE表达式 4、NULLIF表达式 5、GREATEST/ LEAST表达式 6、NVL表达式 四、小结 一、前言 SQL是用于访问和处理数据库的标准计算机语言。GaussDB支持SQL标准(默认支持SQL2、SQL3和SQL4的主要特性)。 本系列将以《云数据库GaussDB—SQL参考》为主线进行介绍。 二、条件表达式的概念及GaussDB中的常见条件表达式 条件表达式是指在数据库中进行SQL语句查询时,根据特定条件筛选出符合要求的数据所使用的表达式。 在GaussDB数据库中,CASE、DECODE、COALESCE、NULLIF、GREATEST和NVL等都是常用的条件表达式。 CASE:根据条件进行多分支判断,根据不同的条件返回不同的结果。 DECODE:GaussDB数据库提供的函数功能,相当于SQL语言中的IF-THEN-ELSE语句,根据第一个参数和后续参数进行比较,返回符合条件的结果...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G