您现在的位置是:首页 > 文章详情

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

日期:2024-05-06点击:167

面壁智能近日发布开源大模型 Eurux-8x22B,包括Eurux-8x22B-NCA 与Eurux-8x22B-KTO,主打推理能力。

官方介绍道:

相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。

Eurux-8x22B 在 LeetCode(180 道 LeetCode 编程真题)与 TheoremQA 测试上超越了 Llama3-70B,在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

据介绍,Eurux-8x22B 模型激活参数 39B,支持 64k 上下文,是由 Mixtral-8x22B 模型对齐而来,在 UltraInteract 对齐数据集上训练而成。

Eurux-8x22B模型+对齐数据集均已开源:

原文链接:https://www.oschina.net/news/291040
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章