回顾 DeepSeek “全球出圈”前后值得关注的 AI 大模型要闻
农历新年假期前后短短十来天,AI 大模型领域几乎每天都有新的惊喜:多模态进一步成熟,Agent形态百花齐放,云平台和终端算力竞相拥抱开源模型。 一起来看看过去这半个月到底发生了什么。 DeepSeek 打响 “第一枪” 春节假期前,2025年1月20日,DeepSeek团队率先发布了全新的DeepSeek-R1模型。其在后训练阶段大规模运用强化学习(RL)技术,显著降低了对人工标注数据的依赖,从而有效减少训练和推理成本。 与此同时,这款模型还通过完全开源策略以及极具竞争力的API定价(输入tokens每百万0.55美元,输出tokens每百万2.19美元)吸引了大量开发者。 彼时,在数学、代码、自然语言推理等多项测试中,DeepSeek-R1的表现逼近甚至超越OpenAI o1,打响中国团队在大模型创新道路上的“第一枪”。 同日,豆包团队也推出了实时语音大模型,并在豆包App中全量开放。它既可实现语音理解与生成的一体化,还具备低时延和随时打断的灵活特性。 相比OpenAI的GPT-4o,这款模型在语音自然度和情绪承接上拥有更出色的表现,更展示了专注语音交互的深厚潜力。 随后在1月21日...
