DeepSeek 启用硬盘缓存技术,大模型价格再降一个数量级
DeepSeek 宣布启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。
缓存命中的部分,DeepSeek 费用为 0.1元 每百万 tokens。至此,大模型的价格再降低一个数量级。
目前,硬盘缓存服务已经全面上线,用户无需修改代码,无需更换接口,硬盘缓存服务将自动运行,系统自动按照实际命中情况计费。只有当两个请求的前缀内容相同时(从第 0 个 token 开始相同),才算重复。中间开始的重复不能被缓存命中。
两个经典场景的缓存举例:
多种应用能从上下文硬盘缓存中受益:
- 具有长预设提示词的问答助手类应用
- 具有长角色设定与多轮对话的角色扮演类应用
- 针对固定文本集合进行频繁询问的数据分析类应用
- 代码仓库级别的代码分析与排障工具
公告指出,该技术最高可以节省 90% 的费用(需要针对缓存特性进行优化)。即使不做任何优化,按历史使用情况,用户整体节省的费用也超过 50%。缓存没有其它额外的费用,只有0.1 元每百万 tokens。缓存占用存储无需付费。
该缓存系统在设计的时候已充分考虑了各种潜在的安全问题。每个用户的缓存是独立的,逻辑上相互不可见,从底层确保用户数据的安全和隐私。长时间不用的缓存会自动清空,不会长期保留,且不会用于其他用途。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Zulip Server 9.1 发布,开源团队协作工具
Zulip 是一个开源团队协作工具,一款专为实时和异步对话而设计的现代团队聊天应用程序,支持快速搜索、拖放文件上传、图像预览、组私人消息、可听通知、错过电子邮件消息提醒与桌面应用等。 Zulip Server 9.1 现已发布,一些更新亮点如下: 澄清了升级说明和安装程序错误消息。改进了文档,以便在升级到 Zulip 9.x 之前顺利将 Ubuntu 20.04 升级到 22.04。当前运行 Ubuntu 20.04 的安装应首先升级到最新的 Zulip 8.x 版本,然后按照 Zuliphost OS 升级说明为升级到 Zulip 9.x 做准备。 通过调整 API response compression 并删除用户对象有效负载中的一些不必要的熵,改善了 Web 和移动应用程序的加载时间和带宽使用情况。 修复了 Zulip 处理 GitHub quirk 的方式,以避免在提交拉取请求审查时出现重复通知。 修复了可能导致上传的图像显示为永久 loading spinner 的罕见 race condition。 修复了 lightbox bottom carousel 中出现视频播放...
- 下一篇
STF 为个人开源维护者设立奖学金计划
一直以来,德国主权技术基金 Sovereign Tech Fund (STF) 都在为各种开源项目提供资金以推动自由软件的发展。今年 6 月,该基金宣布面向小额开源项目开放投资。 时至今日,他们又计划为个人开源项目维护者设立奖学金计划,以资助开源开发人员,缓解其压力和倦怠。 “这项新预计将于 2024 年第四季度启动,旨在应对开源生态系统中的一个关键挑战:支持那些为我们的数字基础设施运行做出贡献的个人......通过这个新的奖学金计划,我们直接投资于代码背后的人员,向关键开源组件的维护者支付报酬。” STF 奖学金计划旨在资助那些在多个开源项目中从事有影响力工作、但却无法获得足够资助的的开发人员。现在还只是一个试点项目,目的是了解新项目对所有参与方的效果如何。 主权技术基金计划在 2024 年第三季度末开始接受奖学金申请,并将在第四季度公布入选的维护者名单。 更多详情可查看官方公告。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6