Ollama v0.12.8 发布,开源跨平台大模型工具
开源本地大模型运行工具 Ollama 发布了 v0.12.8 版本。
新功能
-
针对模型 qwen3‑vl(“qwen3-vl”)做了性能提升,包括默认支持 Flash Attention。
-
在 “thinking” 过程(即模型输出前推理)中,qwen3-vl 现在会 减少前导空白字符(leading whitespace)输出。
Bug 修复
-
修复了一个 bug:当通过 DeepSeek‑v3.1 思考(thinking)功能禁用时,Ollama 新的应用中不能正确关闭该思考功能的问题。
-
修复了 qwen3-vl 在 带透明背景图像(transparent background image) 输入时的识别失败问题。
-
修复了当在 Windows 上执行设备发现(device discovery)时,系统会错误地考虑不支持的集成显卡(iGPU)的问题。
-
修正了当使用
ollama rm命令移除模型前,模型还在运行的问题。 -
优化了 Ollama 引擎中 Prompt 处理速度慢的问题。
下载地址:https://github.com/ollama/ollama/releases/tag/v0.12.8