百川智能发布超千亿大模型 Baichuan 3,中文评测超越 GPT-4
1月29日,百川智能发布超千亿参数的大语言模型 Baichuan 3。 链接:https://www.baichuan-ai.com/ 据称在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色。 不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan 3还突破“迭代式强化学习”技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现优异,领先于其他大模型。 在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上,Baichuan 3 的中文效果同样号称超过了 GPT-4,是“中文医疗任务表现最佳的大模型”。 据介绍,百川智能在 Baichuan 3 训练过程中提出了“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”等多种技术手段...

