百川智能发布 Baichuan 2，号称全面领先 LLaMA 2-低调大师

百川智能发布 Baichuan 2，号称全面领先 LLaMA 2

2023-09-07 521

百川智能宣布正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。

根据介绍，Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6万亿高质量多语言数据进行训练，在保留了上一代开源模型良好的生成与创作能力，流畅的多轮对话能力以及部署门槛较低等众多特性的基础上，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan2-13B-Base相比上一代13B模型，数学能力提升49%，代码能力提升46%，安全能力提升37%，逻辑推理能力提升25%，语义理解能力提升15%。

本次开源的两个模型在各大评测榜单上的表现优秀，在MMLU、CMMLU、GSM8K等几大权威评估基准中，以绝对优势领先LLaMA2，相比其他同等参数量大模型，表现也十分亮眼，性能大幅度优于LLaMA2等同尺寸模型竞品。

且根据MMLU等多个权威英文评估基准评分 Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放，开发者也仅需邮件申请获得官方商用许可后，即可以免费商用。

与此同时，百川智能还宣布开源了模型训练从220B到2640B全过程的 Check Ponit。

并公开了Baichuan 2的技术报告。技术报告将详细介绍Baichuan 2训练的全过程，包括数据处理、模型结构优化、Scaling law、过程指标等。

王小川透露，按照公司计划，今年四季度将发布对标GPT-3.5的千亿级参数模型，预计于明年一季度发布超级应用。“除开源模型以外，下一次在闭源模型上会有更多的突破，希望在中国的开源闭源生态中都能给中国的经济社会发展带来我们的贡献。”

微信关注我们

原文链接：https://www.oschina.net/news/257190

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

腾讯正式发布混元大模型

在今天举办的2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，并宣布通过腾讯云对外开放。其参数规模超过一千亿，预训练语料超过2万亿tokens。据悉，混元大模型是腾讯全链路自研的通用大语言模型，具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。该模型同时也服务产业场景，客户可以基于 API 调用混元，也可以基于混元做专属的行业大模型。腾讯表示，混元大模型可以有效识别陷阱，拒绝回答一些难以回答的问题。腾讯集团副总裁蒋杰表示：“我们研发大模型的目标不是在评测上获得高分，而是将技术应用到实际场景中。腾讯将全面拥抱大模型。目前，腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品，已经接入腾讯混元大模型测试。混元大模型将作为腾讯云MaaS（大模型即服务）服务的底座，客户可以直接通过API（应用程序编程接口）调用混元，也可以将混元作为基底模型，为不同产业场景构建专属应用。

2023-09-07

417

Python 3.12.0 发布了第 2 个 RC 版本，也是最后一个 RC。正式版将于 2023 年 10 月 2 日星期一发布。开发团队表示，进入候选版本阶段后，只接受经过 review 且修复明确错误的代码。RC2 是发现并修复重要问题的最后机会。从该版本开始，3.12 系列将不进行 ABI 更改，目标是尽可能少地更改代码。 Python 3.12 中部分新的主要新特性和变化：针对泛型类的新类型注释语法 (PEP 695) 更灵活的 f-string 解析 (PEP 701) 支持 buffer 协议 (PEP 688) 改进错误消息改进性能支持 Linux perf 分析器在跟踪过程中报告 Python 函数名称根据PEP 623提案，删除了 C 语言实现 unicode 对象中被废弃的 `wstr` 和 `wstr_length` 成员在 `unittest` 模块中，删除了一些长期被废弃的方法和类（它们从 Python 3.1 或 3.2 开始就已被废弃）废弃的 `smtpd` 和 `distutilsd` 模块已被删除（查看PEP 594和PEP 632）...

2023-09-07

516

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。