百川智能发布 Baichuan 2,号称全面领先 LLaMA 2
百川智能宣布正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。
根据介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
本次开源的两个模型在各大评测榜单上的表现优秀,在MMLU、CMMLU、GSM8K等几大权威评估基准中,以绝对优势领先LLaMA2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于LLaMA2等同尺寸模型竞品。
且根据MMLU等多个权威英文评估基准评分 Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。
Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。
与此同时,百川智能还宣布开源了模型训练从220B到2640B全过程的 Check Ponit。
并公开了Baichuan 2的技术报告。技术报告将详细介绍Baichuan 2训练的全过程,包括数据处理、模型结构优化、Scaling law、过程指标等。
王小川透露,按照公司计划,今年四季度将发布对标GPT-3.5的千亿级参数模型,预计于明年一季度发布超级应用。“除开源模型以外,下一次在闭源模型上会有更多的突破,希望在中国的开源闭源生态中都能给中国的经济社会发展带来我们的贡献。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
腾讯正式发布混元大模型
在今天举办的2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。其参数规模超过一千亿,预训练语料超过2万亿tokens。 据悉,混元大模型是腾讯全链路自研的通用大语言模型,具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。该模型同时也服务产业场景,客户可以基于 API 调用混元,也可以基于混元做专属的行业大模型。腾讯表示,混元大模型可以有效识别陷阱,拒绝回答一些难以回答的问题。 腾讯集团副总裁蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。 目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试。混元大模型将作为腾讯云MaaS(大模型即服务)服务的底座,客户可以直接通过API(应用程序编程接口)调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。
- 下一篇
Python 3.12.0 发布第 2 个 RC,正式版将于 10 月推出
Python 3.12.0 发布了第 2 个 RC 版本,也是最后一个 RC。正式版将于 2023 年 10 月 2 日星期一发布。 开发团队表示,进入候选版本阶段后,只接受经过 review 且修复明确错误的代码。RC2 是发现并修复重要问题的最后机会。 从该版本开始,3.12 系列将不进行 ABI 更改,目标是尽可能少地更改代码。 Python 3.12 中部分新的主要新特性和变化: 针对泛型类的新类型注释语法 (PEP 695) 更灵活的 f-string 解析 (PEP 701) 支持 buffer 协议 (PEP 688) 改进错误消息 改进性能 支持 Linux perf 分析器在跟踪过程中报告 Python 函数名称 根据PEP 623提案,删除了 C 语言实现 unicode 对象中被废弃的 `wstr` 和 `wstr_length` 成员 在 `unittest` 模块中,删除了一些长期被废弃的方法和类(它们从 Python 3.1 或 3.2 开始就已被废弃) 废弃的 `smtpd` 和 `distutilsd` 模块已被删除(查看PEP 594和PEP 632)...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品