开源跨平台大模型工具 Ollama 发布 0.11.9-rc0 测试版
ollama 团队近日发布了 0.11.9-rc0 测试版,重点提升了 CPU/GPU 并行性能。此次更新引入了新的执行机制,让 GPU 在处理当前批次任务的同时,CPU 可以并行准备下一批计算,从而减少 GPU 空闲等待时间,旨在提升其在多平台运行 AI 大语言模型时的整体性能。
在实测中,macOS Metal 环境下 token 处理速度提升约 2–3%,而在 GeForce RTX 4090 上提升幅度约 7%。
此外,新版本还修复了 AMD GPU 无法识别的问题,并解决了 macOS 与 Linux 上因未处理错误导致的部分崩溃情况,进一步提升了跨平台稳定性与兼容性。这意味着 ollama 在运行大语言模型时将具备更高的效率和更稳定的表现。
关键性能优化
-
引入一种新的执行方式:通过在后台并行构建下一批次的计算图,将 GPU 与 CPU 的计算任务重叠执行。这能有效减少 GPU 等待下一批任务所造成的空闲时间,提升吞吐效率。
-
该改动由 VMware 工程师 Daniel Hiltgen 提出,他在 Pull Request 中指出:
“这重构了 ollama 主运行循环,将主要 GPU 密集任务(Compute+Floats)放在 Go 协程中执行,从而可以并行准备下一批任务,减少 GPU 在等待时的停顿。”
“在 metal(macOS 上)测试中,token 处理速度提升约 2–3%;在单块 GeForce RTX 4090 上,速度提升约 7%。”
其他改进与修复
-
修复了部分 AMD GPU 无法识别时出现的错误,增强了对 AMD 硬件的兼容性。
-
修补了一些 在 macOS 和 Linux 上因未处理错误而导致的崩溃问题,提升稳定性。
下载地址:https://github.com/ollama/ollama/releases/tag/v0.11.9-rc0

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Habitica v5.40.0 发布,隐私控制
Habitica v5.40.0 现已发布。Habitica 是一个习惯养成及生产力应用,让你 “游戏人生”。游戏里的奖惩措施能激励用户完成任务,还有一个强大的互动社区为完成任务提供好建议,帮助达成目标,变得健康、勤奋与快乐。 此版本更新内容如下: API Feature:后端支持隐私控制,包括preferences.analyticsConsent字段和淘汰过时的 Google Analytics 软件包 Fix:内容接口正确返回用户首选语言的数据 Chore:Locale files 已更新 Client Feature:让用户能够选择是否将分析事件发送到外部平台 Feature:修改注册流程,第二步选择用户名 Fix:尊重用户的全局隐私控制浏览器设置 Chore:将隐私政策和服务条款文本更新为 2025 年 9 月 1 日修订版 Repo Chore:关键软件包更新 更新说明:https://github.com/HabitRPG/habitica/releases/tag/v5.40.0
-
下一篇
Apache Cloudberry (Incubating) 2.0.0 发布
Apache Cloudberry 2.0.0 现已发布,这是该项目在 Apache 软件基金会下的第一个正式版本。 主要亮点 PostgreSQL 14 Foundation:基于 PostgreSQL 14.x 构建,为分布式分析环境带来稳定的 PostgreSQL 功能和改进 性能改进: 优化查询执行:分布式查询规划和执行的显著改进 增强的资源管理:跨集群节点优化内存与 CPU 利用率 改进的并行处理:更高效的数据分发和并行查询处理 备份和恢复:改进分布式环境的备份策略 动态表:全新功能支持查询结果的自动定时刷新,专为实时分析、Lakehouse 架构及自动化 ETL 管道等需实时数据的场景设计 PAX 存储格式:引入 PAX(Partition Attributes Across)存储格式,这是一种结合了行式存储和列式存储优势的混合存储格式。PAX 在数据写入和分析查询方面均具有高性能,非常适合 OLAP 工作负载和大规模数据分析。 ASF 合规性:license headers、LICENSE/NOTICE/DISCLAIMER 文件更新、完善的依赖项属性等 更多详情可查看官...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS关闭SELinux安全模块
- Docker容器配置,解决镜像无法拉取问题
- CentOS7设置SWAP分区,小内存服务器的救世主
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启