您现在的位置是:首页 > 文章详情

“零一万物” 回应 Yi 开源大模型“套壳” Llama

日期:2023-11-15点击:77

李开复旗下 AI 公司零一万物” (01.AI上周宣布推出 Yi-34B 和 Yi-6B 两个开源大模型。其公布的基准测试结果显示虽然模型参数少于其它大模型,但性能更出色。零一万物的估值高达 10 亿美元,已跻身独角兽行列。

Yi 正式开源数日后,在其 Hugging Face 主页的讨论区中,有人指出 Yi-34B 完全使用了 Meta 开源大模型 Llama 的架构,最明显的变化只是修改了张量 (Tensor) 名称。

111349_Novu_2720166.png

来源:https://huggingface.co/01-ai/Yi-34B/discussions/11

根据公开的信息,Yi 系列开源大模型没有在开源 License 中提及 Llama。上面的帖子内容经过广泛传播后,零一万物的 Yi 系列大模型被质疑是 Llama 的套壳。

昨天,“零一万物” 正式公开回应了此事。根据该公司开源团队总监 Richard Lin 的跟帖回复,他们承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。

Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。

与此同时,Richard Lin 邀请这名指出问题的开发者提交包含上述改动的 PR——对 Yi 的张量名称进行重命名以符合 Llama 架构。

最后,Richard Lin 表示团队会增强对流程的执行,避免此类错误再次发生,他们也将再次检查所有代码,确保其他一切正常。

原文链接:https://www.oschina.net/news/266525
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章