DeepSeek 刚刚更新线上模型版本至 V3.1
DeepSeek在官方社群宣布,其线上模型版本已升级至V3.1,上下文长度拓展至128k。
欢迎前往官方网页、APP、小程序测试,API 接口调用方式保持不变。
接口信息:https://platform.deepseek.com/usage
近日市场再度传出深度求索下一代AI大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此,接近DeepSeek人士表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。
DeepSeek创始人梁文锋在内部表示,他对R2取得的进展并不满意,并一直在竭力投入更多的时间来研发一款能够让该公司在AI领域保持领先地位的先进模型。
梁文峰要求模型达到更出色的结果才批准发布,R2的发布还因更新版模型的数据标注时间超出预期而被推迟。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
OpenAI 总裁透露 OpenAI 的 AGI 之路
在最新一期的《Latent Space》访谈中,OpenAI 总裁 Greg Brockman 深入阐述了公司迈向 AGI 的整体路线图,核心可概括为“三个转向”: 技术转向:从“一次性预训练”到“强化学习推理” 资源转向:把“算力”视为唯一稀缺资源 落地转向:从“科研样品”到“可审计的生产 Agent” Greg Brockman 透露,GPT-4 发布之后,团队内部复盘“它为何还不是 AGI”,结论是仅靠大规模预训练无法解决可靠性不足的问题,必须让模型在与真实世界的交互中“试错—反馈—再训练”。因此 GPT-5 首次引入强化学习驱动的“动态推理”范式:模型边使用边生成数据,再用这些数据进行再训练,逼近人类“边做边学”的循环。 他将这种“推理-重训”飞轮称为“超临界学习”(supercritical learning):当算力放大 10× 乃至 10 000× 时,模型不仅能掌握任务本身,还能推演出二阶、三阶后果,从而快速逼近 AGI。 Greg Brockman 还把“算力”视为唯一稀缺资源,他认为算法壁垒往往可通过堆算力解决;AGI 进度条几乎与可用计算量线性相关。OpenAI ...
- 下一篇
OpenAI 计划通过股权出售成为全球最有价值私营公司,估值达 5000 亿美元
OpenAI 正在考虑进行一轮价值60亿美元的股权出售,这将使其估值达到5000亿美元,超越目前全球最有价值的私人公司 SpaceX(估值3500亿美元)。这次股权出售的股份将主要由现有和前员工出售。 过去一年,OpenAI 经历了迅猛的增长,微软和软银等投资者已经为该公司投入了至少400亿美元,使其在2023年3月的估值达到了3000亿美元。而在2022年10月,OpenAI 的估值仅为1570亿美元。如果此次股权出售成功,OpenAI 将成为全球估值最高的私人公司。 当前,参与此次股权出售谈判的投资者包括已经对 OpenAI 投资的三家机构:软银、Dragoneer 投资集团和 Thrive 资本。根据彭博社的报道,相关谈判仍处于早期阶段,最终的数字可能会有所变动。OpenAI 对此未作出评论。 在人工智能领域,OpenAI 正处于激烈的竞争之中。全球多家科技巨头,包括 Meta、谷歌、亚马逊和微软,正在大力投入人工智能研发, hiring engineers and building data centers。仅在2025年,这四家公司在人工智能领域的投入就超过了1550亿美元。...
相关文章
文章评论
共有0条评论来说两句吧...