瑞士三强联合发布开源大模型 Apertus
瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)近日联合发布了一个名为 “Apertus” 的大规模开源语言模型,该模型的名字在拉丁语中意为 “开放”。 与当前市场上如 OpenAI 的 GPT 系列、Meta 的 Llama 和 Anthropic 的 Claude 等美国大型模型相比,Apertus 不仅注重技术本身,更以其透明度赢得了广泛的关注。 这款模型的所有内容,包括模型权重、架构设计、训练代码以及数据来源等,全部实现了公开,甚至连训练过程的完整文档也毫无保留。这种 “开放” 策略让 Apertus 成为了一个值得期待的新选择。 在这个 AI 快速发展的时代,“数据黑箱” 的现象依然普遍存在。许多大型科技公司在发布他们的模型时,往往对外界隐瞒了大量关键细节,导致了行业的不信任感。而 Apertus 则打破了这一常规,力求通过开源的方式来促进技术的共享与合作。研究人员和开发者们可以在此基础上进行创新与改进,推动整个行业的进步。 这项研究的团队表示,Apertus 的推出不仅旨在为研究提供便利,更希望激励全球的 ...
