据The Information报道,DeepSeek已告知部分潜在投资者,公司计划提高模型发布频率,以更接近行业主流水平。同时,该公司计划在6月发布其V4模型的更新版本V4.1。
从"慢工出细活"到追赶行业节奏
DeepSeek一直以技术深度著称,但在模型迭代速度上却长期落后于同行。据统计,从2025年12月1日到2026年4月20日的140天里,DeepSeek未发布任何新模型。而同期,全球11家主要AI公司合计发布了约50个新模型,平均不到3天就有一个新版本问世。
这种"慢节奏"在V4的开发过程中尤为明显。原定于2026年2月发布的V4旗舰模型因硬件迁移等因素多次推迟,直到4月24日才以预览版形式亮相(包含V4-Pro和V4-Flash两个版本),同步开源并上线API。
不过,这一状况可能即将改变。接近DeepSeek投资谈判的人士透露,公司明确向投资者承诺将加快发布节奏。6月即将推出的V4.1,正是这一新策略的首个成果。
V4.1将补齐全模态能力
V4.1被定位为V4的优化升级版本。据业内人士预期,新版本将在以下方面有所突破:
首先是多模态能力。4月发布的V4预览版在文本和代码生成方面表现强劲,上下文窗口达到100万token,并采用新的注意力机制,在Agentic Coding、数学推理和STEM领域达到开源模型最佳水平。但V4目前尚未集成图像和音频处理能力。V4.1有望补上这一短板,实现真正的全模态覆盖。
其次是对Model Context Protocol(MCP)的更好支持,以及更丰富的企业级工具链。这意味着DeepSeek正在从单纯的"技术展示"向"企业落地"加速转型。
500亿融资背后的商业化提速
加快发布节奏的背后,是DeepSeek首次大规模外部融资的推进。据多家媒体报道,DeepSeek正寻求约500亿元人民币的融资,投后估值可能达到3500亿元人民币(约515亿美元)。若交易达成,这将是中国AI创业公司单轮融资的最高纪录。
值得注意的是,创始人梁文锋计划个人出资约200亿元,占募资总额的40%,成为本轮最大的单一投资人。这显示了他对公司长期价值的强烈信心。同时,国家集成电路产业投资基金(大基金)可能担任领投方,腾讯、阿里巴巴等科技巨头也被传将参与。
从拒绝外部资本到主动拥抱融资,DeepSeek的战略转向反映了现实压力:一方面,核心研究人员近期流向小米、字节跳动等竞争对手,人才留存需要更具竞争力的薪酬和股权激励;另一方面,从英伟达CUDA生态向华为昇腾芯片的迁移带来了巨大的算力成本。
从理想主义到产业竞争
DeepSeek的崛起曾被视为中国AI"技术理想主义"的典范——用极少的算力资源做出顶尖模型,用开源策略赢得开发者口碑。但当行业竞争进入"周更"甚至"日更"的节奏,当商业落地成为衡量AI公司价值的核心标准,纯粹的技术标签已不足以维持领先地位。
V4.1的发布和融资的完成,将是DeepSeek能否从"现象级网红"转型为"可持续商业实体"的关键节点。市场期待的不只是一个更强的模型,更是一个能在快速迭代中持续领先的组织。
参考来源:https://www.theinformation.com/articles/deepseek-raise-7-billion-startup-plots-revenue-efforts