开源模型未必更先进，但会更长久-低调大师

开源模型未必更先进，但会更长久

2025-02-06 193

最近，开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。报告聚焦 AI 大模型领域，对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。查看完整报告：2024 中国开源开发者报告.pdf

在第二章《TOP 101-2024 大模型观点》中，资深开发者社区运营专家顾钧直言，开源策略是大模型最好的竞争策略，并分享了诸多思考，全文如下。

开源模型未必更先进，但会更长久

文/顾钧

“开源”是指采用符合OSI官方认可的软件许可证进行软件发布的行为。目前大模型的“开源”与传统的开源定义并不相同。我所说的开源策略是指以开源发布软件为起点，用户/开发者运营为途径的软件产品推广策略。

我的观点是，开源策略是大模型最好的竞争策略。接下来让我们从头捋一捋推导过程。

我们先看大模型赛道的整体状况：

大模型是一项相对较新的技术。尽管OpenAI早在2019年就发布了第一个重要的模型GPT-2，但大模型的广受关注实际始于2022年11月发布的ChatGPT。8个月以后Meta就与微软合作发布了开源大模型LLaMA-2。这个赛道的主要玩家在技术和商业化上有差距，但没有到翻盘无望的程度。
大模型赛道不但包括模型的训练，也包括模型服务。训练是软件的制作成本，而服务是软件的长期运行成本。
大模型赛道的市场化程度非常高。算法、算力、数据、人才，这些构建大模型的基础要素并不为权力机构垄断，大多要从市场上获得。
大模型作为一项令人激动的技术，商业化场景覆盖了对企业(2B)与对个人(2C)两个大方向。
大模型赛道在海外是“一超多强”，在国内则是“多头并举”，两种典型的竞争格局都全了。

以上，大模型赛道的元素非常丰富，各种商业化方法的排列组合都不缺，为我们的分析与推演提供了可贵的素材。对软件商业化问题感兴趣的朋友一定要长期关注这个赛道。只有这样的对象才能更有力地说明开源策略的重要性。

其次，我们得明确一点——大模型竞争的赛点是什么？常用的判断依据包括：技术的先进性，C端用户基数，依赖这个软件的生态系统大小等等。其中哪个更关键一点？

技术先进是好事，但大模型领域的先进技术远没有达到能为大模型企业带来可观收入的程度。整个大模型赛道还处在商业化的摸索阶段。这个时间点上的“技术先进性”更多是用于公关宣传的素材。考虑到数据获取、加工的成本，模型训练的成本，这是一种相当昂贵的宣传方式。

C端用户指那些把大模型当成智能个人助理来使用的普通个人用户。OpenAI在ChatGPT上一个重要且成功的操作就是把大模型从学术界、工业界直接推向了普通个体，让C端用户切实感受到了大模型的可能性与魅力。这一点被国内的大模型厂商广泛学习。在B站刷视频，国内知名的那几个大模型厂商的广告，你一个也不会落下。

受到大家的认可与喜爱固然重要，但对于C端用户，有两个需要时刻牢记的问题：一是C端用户是没有忠诚度的，谁免费就用谁，谁给补贴就用谁；二是某一个大模型对C端用户比较难产生独特的粘性。

第一个问题的例证太多了，百团大战、滴滴快的、社区团购、pdd。大模型厂商维系C端流量的成本可能是个无底洞。

第二个问题则涉及两个方面，一是大模型赛道本身的极度内卷，技术上拉不开差距；二是普通用户的使用随意性很强，准确性要求也不高，最终各家大模型的基础能力都足以应付。

一个大模型的生态系统的大小，也就是指有多少开发者在基于这个大模型构建应用。我认为这是一个更靠谱的评价指标，是某个大模型最终能胜出的关键所在。

构建开发者生态通常有两种做法，一种是提供API云服务，对注册开发者进行一定的云资源补贴；另一种是“开源”的方法，提供大模型免费下载，免费商用（一定条件下）。两种方法各有支持者。闭源大模型一般会采用第一种方法，其中的代表有OpenAI、Anthropic等（为避免麻烦，国内厂商的名字就不提了）。能用第二种方法的，必然是某种程度上的“开源”模型，以Meta的Llama 2、Llama 3模型为首。

前段时间李彦宏在Create 2024百度AI开发者大会上放言“开源模型会越来越落后”。前文我有提到，此时此刻的技术先进性并不重要。甚至在计算机发展史上，很多领域中笑到最后的产品，并不是技术上最先进的。抛开成本和易用性，空谈技术先进性是最常见的错误。

那么具体到大模型领域，闭源与开源，两种方法孰优孰劣？我的回答是采取什么方法因人而异，但开源会更有优势。

大模型赛道的核心制约条件是成本太高——训练成本高，运行成本高。如何尽可能降低成本，比对手坚持得更久一些是确保长期成功的必要条件。现在的宏观环境下，一味靠融资来支撑自己的高成本支出不是长久之计。

闭源大模型厂商必须维持一定的云资源，工程师资源来支撑小额的开发者调试需求。投入产出上恐怕是算不过来的。即便闭源厂商愿意持续地补贴开发者，他们最终会发现大模型对开发者的粘性也非常有限，没比在C端用户那边好到哪里去。

大模型这一产品形态实在是太特殊了——大多以自然语言为交互方式。因此大模型API云服务的接口是非常简单的，高度一致的。在这种情况下，如果开发者构建的大模型应用只是调用大模型的API，那么大模型应用与某个具体的大模型之间很难形成强绑定。也就是说，面对各种大模型云服务，主动权在开发者这里。

与之相对，开源的方法至少可以相当程度地省去为了拓展开发者生态而付出的大模型运行成本。开发者免费下载大模型以后，会在自己的计算机资源上进行大模型应用的开发和调试。大模型厂商提供一些技术支持即可。同时因为大模型运行在本地，开发者在构建大模型应用时，为了物理部署上的便利，很可能会在应用与模型之间创造出物理部署上的耦合性。

当然这种“开源策略”不是进攻的方法，而是“先为不可胜，以待敌之可胜”。目标是以最小的代价，尽可能多地消耗闭源对手的资源与心气。

作者简介：

顾钧

资深开发者社区运营专家，目前担任杭州映云科技 (EMQ) 市场&开发者社区总监一职。2004 年，顾钧从北京大学计算机系本科毕业，其后在工商银行、IBM、摩根士丹利、华为和Zilliz等多家知名企业工作。曾联合发起全球首个开源向量数据库项目Milvus，并帮助Milvus社区在两年间迅速拓展到两千家企业用户。

查看完整报告：2024 中国开源开发者报告.pdf

微信关注我们

原文链接：https://my.oschina.net/u/3859945/blog/17503844

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2024 年中国开源模型：崛起与变革

最近，开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。报告聚焦 AI 大模型领域，对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。查看完整报告：2024 中国开源开发者报告.pdf 在第二章《TOP 101-2024 大模型观点》中，Hugging Face 工程师Tiezhen、Hugging Face 中文社区项目经理Adina 以及Hugging Face FellowLu Cheng，从崛起与变革两个维度，探讨中国开源模型在这一年取得的重大成就和未来展望，全文如下。 2024 年中国开源模型：崛起与变革文/Tiezhen、Adina、Lu Cheng 2024年，中国在开源人工智能模型领域的崛起和变革成为全球瞩目的焦点：从学术到产业，从技术到生态，中国通过自主研发和协同创新，逐步完成了从“追随者”到“引领者”的转变。这种转变不仅是技术实力的体现，更是中国人工智能生态系统快速完善的真实写照。以下，我们将从崛起与变革两个维度，探讨中国开源模型在这一年取得的重大成就和未来展望。崛起从“追随...

2025-02-06

180

概述 SeaTunnel 缘起随着大数据和AI快速崛起与迅猛发展，数据源的多样化和数据量爆炸性增长，业务需求也在快速变化，企业需要具备更强大的新一代数据集成能力来高效地处理各种各样的数据源。SeaTunnel通过其高度可扩展和灵活的架构，可以帮助企业快速实现多源数据的快速集成。同时AI的快速发展也对数据集成提出了新的要求。通过集成AI能力，SeaTunnel可以帮助企业在数据处理过程中进行智能分析、异常检测、数据质量评估及优化，从而进一步提升数据的质量和整体智能化水平。在技术发展趋势上，各种数据库、湖仓、向量、 SAAS、非结构化、对象存储等众多数据来源让传统的数据处理流程从ETL、ELT变为能更加快速满足业务需求和能够更加有效应对日益庞大数据量的EtLT 架构，EtLT 能更加敏捷应对离线/实时数据湖、数据仓库、AI模型训练当中的复杂多变的数据需求场景。目标本说明旨在为系统架构师、开发者、用户和运维人员提供SeaTunnel的技术架构介绍，以支持其在项目使用及优化中进行数据集成任务的开发和运维。整体架构说明 SeaTunnel 主要由一套数据同步处理的 API 和...

2025-02-06

291

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

JDK

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

开源模型未必更先进，但会更长久

开源模型未必更先进，但会更长久

2024 年中国开源模型：崛起与变革

Apache SeaTunnel 整体架构运行原理

相关文章

发表评论

资源下载

优质分享App

Oracle

JDK

Sublime Text

欢迎您！