您现在的位置是:首页 > 文章详情

Ollama 推出付费服务“Turbo”

日期:2025-08-06点击:46

Ollama 推出了名为“Turbo”的付费服务,旨在解决本地运行超大模型的性能瓶颈,让用户在数据中心级的硬件上运行大型开源模型,服务月费为 20 美元。

Ollama “Turbo”适用场景:

  • 本地显卡显存不足,无法加载 120B 级别模型

  • 需要快速原型验证、批量推理或高并发调用

  • 希望保持本地环境简洁,同时获得接近数据中心的性能

据介绍,Ollama “Turbo”服务主要解决新模型体积过大、在普通 GPU 上难以运行或运行缓慢的问题。通过将模型运行负载转移到云端,用户可以释放本地计算机(Mac, Windows, Linux)的性能。在预览阶段,Turbo 支持 gpt-oss-20b 和 gpt-oss-120b 模型。

该服务与 Ollama 的 CLI、API 以及 JavaScript/Python 库完全兼容。Ollama 承诺不会记录或保留通过 Turbo 模式进行的任何查询,所有硬件均位于美国。

原文链接:https://www.oschina.net/news/364625
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章