从通义千问“霸榜”开源榜单到斯坦福团队“抄袭”清华系AI公司,中国大模型技术有多强?
斯坦福AI团队(Llama3-V)“镜像级套壳”清华系开源大模型(MiniCPM-Llama3-V 2.5)事件近日引发巨大关注——让人不禁感叹一句“国内一开源,国外就自主”。
调侃归调侃,斯坦福AI团队抄袭事件相关的三名成员都有着卓越的学术和技术研发背景,并且在AI模型领域有着深厚的积累。他们本应避免将他人的成果直接宣称为自己的,这种做法无疑是违背了开源社区所推崇的共享精神。
此外,社区中的一些开发者也注意到了一个现象。在这次抄袭事件中,三人敢于公开抄袭MiniCPM,这背后可能基于一个判断:中国的开源模型虽然十分强大,但在国际社区中的知名度并不高。
MiniCPM作为一个极其强大的开源模型,在发布后并没有得到应有的关注,反而是其套壳的海外版本意外走红。直到抄袭事件曝光,许多本应持续关注开源社区优秀作品的研究者才意识到MiniCPM的存在。
就连抄袭事件的主角之一也在回应中所表示,他们“看了很多最近的论文以验证这项工作的创新性,但却并不知道也未被告知有关OpenBMB 的任何先前工作”。
有DeepMind的工程师就指出,这件事里有意思的地方是,相比造假的Llama3-V,MiniCPM是真的存在的能达到如此强大能力的模型。但是它获得的关注是如此之少。同样的结果,就因为不是来自一些常青藤大学,就无法流行起来。
还有一位国外 AI 社区的创始人也说道:“中国在机器学习生态的工作一直以来都被社区忽视了。他们正在用有趣的 LLM、VLM、音频和扩散模型做一些令人惊奇的事情。”
事实上,中国大模型在国际社区中确实有非常好的口碑。
通义千问不久前开源千亿参数大模型Qwen1.5-110B就在国外社区引起巨大反响,持续占领了Hacker News热度榜首一段时间。
当时Stability AI研究主管Tanishq Mathew Abraham说道:
“许多最具竞争力的开源大模型,包括Qwen、Yi、InternLM、Deepseek、BGE、CogVLM 等正是来自中国。
关于中国在人工智能领域落后的说法完全不属实。相反,他们正在为生态系统和社区做出重大贡献。”
还有人表示,由于中英文间的语言障碍,海外通常能看到中国大模型也只是发布的一部分,太多AI应用和集成没有被完全展现。推测这些模型在中文上表现应该比英文更好。但即便如此,它们在英文基准测试上已具备相当的竞争力。
也有人称自己属实被过去一年中Arxiv上AI论文里中文署名作者的庞大数量震惊到了。
前斯坦福兼职讲师、Claypot AI联合创始人Chip Huyen在调研过900个流行开源AI工具后,在个人博客中分享自己的发现:“在GitHub排名前20的账户中,有6个源自中国。
OpenAI早期投资人Vinod Khosla曾在X发文称,美国的开源模型都会被中国抄去。
但这番言论马上被Meta的AI教父Yann LeCun反驳:“AI不是武器。无论我们是否把技术开源,中国都不会落后。他们会掌控自己的人工智能,开发自己的本土技术栈。”
还有在斯坦福读书的同学也分享称,教授在课堂上大力称赞中国开源模型,特别是开诚布公地与社区积极分享成果,跟欧美一些头顶“开源”名号的明星公司不同。
有网友也表达了和这个教授相似的观点,“美国最该尴尬的,是今天中国开源模型们重大的贡献”。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
SerenityOS 作者卸任 BDFL,分叉 Ladybird
Andreas Kling 宣布卸任 SerenityOS BDFL 职务,同时分叉 Ladybird 项目。他解释称,此举并无任何其他隐情,单纯只是因为他觉得两个项目都需要独立的发展空间。 SerenityOS 是一个用于 x86 计算机的图形化的类 Unix 操作系统,由 Andreas Kling 在 2018 年创建。Ladybird 则诞生于 2022 年,最初是作为 SerenityOS 系统的 “LibWeb” 浏览器引擎调试工具开发;经过不断地完善之后,逐渐发展成了一个跨平台的 Web 浏览器。 迄今为止,两个项目群体一直在社区中共享所有资源和基础设施的状态: 一个群体主要关心构建桌面操作系统。 另一个群体主要关心构建跨平台的 Web 浏览器。 “过去,兴趣之间有足够多的重合,因此分享一切是有意义的,但这些兴趣已经逐渐疏远”。考虑到这一点,Andreas 决定将 Ladybird 从 SerenityOS 中分离出来,成为一个新的、独立的顶级项目。 Andreas 称,SerenityOS 发展至今已经形成了一个庞大的 OSS 社区;但就他个人而言,过去两年来几乎把全部...
- 下一篇
20+公司AI应用产品分析;24名工程师的LLM使用痛点
1. 20多家顶尖科技公司的AI应用 AI产品功能对市场来说仍然是新事物。没有人完全弄清楚其中多少功能将得到广泛使用,以及用户在多大程度上真正想要这些新产品。 本系列文章分析了海外科技公司将AI集成到其产品中的新方法和功能,包括Chrome、Slack、Docusign、Yelp、Google地图、Pinterest、Airbnb、Replit、Airtable等,总体而言,这些产品团队目前正在构建的功能分为5种不同的类别: 嵌入式助手:嵌入在核心产品中的AI助手,旨在以某种方式放大其产品价值主张 新的独立产品:由AI驱动的独立产品,区分于核心产品 用户体验增强器:由AI驱动的功能,旨在让现有产品更容易使用或以某种方式改善整体用户体验 生产力助推器/节省时间:旨在提高用户生产力的AI功能 ML智能/数据分析:部署AI驱动的机器学习模型以增加价值或发现见解 本文从功能类别、工作原理等维度分析了上述公司发布的不同的新AI功能,有助于AI团队做产品时进行参考。 https://departmentofproduct.substack.com/p/dop-deep-what-ai-featur...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6