日本乐天 Rakuten AI 3.0 大模型被指套壳 DeepSeek
日本乐天集团(Rakuten)近期发布了“Rakuten AI 3.0” AI 模型,该模型虽被宣称为“日本最大”自研成果,但经技术社区核查,实为基于 DeepSeek-V3 模型微调而成,引发强烈争议。 据了解,乐天集团在日本经济产业省(METI)的 GENIAC 项目支持下,高调发布了号称“日本最大、性能最强”的 7000 亿参数大模型 Rakuten AI 3.0。 然而开源社区很快发现,该模型的底层架构实为 DeepSeek-V3,配置文件config.json中明确写有"DeepseekV3ForCausalLM"和"model_type": "deepseek_v3"。乐天仅对其进行了日语数据的微调。 在模型发布新闻稿和相关描述中,乐天仅含糊地表示“融合了开源社区的精华”,绝口不提使用了 DeepSeek。此外,乐天在开源发布时,偷偷删除了原项目应包含的 MIT 开源协议文件。 在被社区发现后,才以添加NOTICE文件的方式弥补。尽管从法律层面看,此举已满足 MIT 许可要求,但社区仍指责其透明度不足。目前,乐天集团尚未就移除许可文件的具体原因作出进一步解释。

