Qwen 3.6 27B 实测：本地模型第一次有了 GPT-5 水平的智力-低调大师

Qwen 3.6 27B 实测：本地模型第一次有了 GPT-5 水平的智力

2026-06-30 1

Piotr Migdał 在 MacBook Max M5 128GB 上跑了一整天 Qwen 3.6 27B，结论是：这是他第一次觉得本地模型能当通用智能用，不需要将就。他把体验写成了一篇博客，标题直白——Qwen 3.6 27B is awesome。

先说配置。他用的是 unsloth 的 8-bit GGUF 量化版，llama.cpp 跑服务，开了多 token 预测（MTP）和 flash attention，64K 上下文，速度 32 tok/s。RTX 5090 上有人用 Q6_K 跑到了 50 tok/s、12.3 万上下文。两个 Qwen 3.6 变体——27B 密集版和 35B A3B MoE 版——都能塞进 48GB 的苹果统一内存里。

智力水平怎么衡量？他引了 Artificial Analysis 的评分。Qwen 3.6 27B 拿了 37 分，大致对应 2025 年中的 GPT-5 或 Claude Sonnet 4.5。作为对比，之前本地编码模型的默认选项 Gemma 4 31B 只有 29 分——那是 2024 年底的 Claude 3.5 Sonnet 水平。一年之内，本地模型从两年前前沿跨到了一年前的次前沿。

35B A3B MoE 版更快——同样 8-bit 下用 llama.cpp + MTP 能到 105 tok/s——但评分只有 32 分。Migdał 的态度是不纠结："宁可生成三分之一的代码，但是质量更高。"他的实际测试佐证了这个判断：让模型写一首关于 Zouk 舞和量子物理的八行诗，推理过程"在术语和押韵上都说得通"。用 pnpm 写六边形扫雷游戏，27B 版一次过，35B 版忽略掉了包依赖指令。从一句话 prompt 生成蜡烛店落地页，出来的效果不错。

技术栈上他选的是 llama.cpp 直跑而非 Ollama——原话是“出于道德原因不推荐 Ollama”。服务端一行命令：llama-server -hf unsloth/Qwen3.6-27B-MTP-GGUF:Q8_0 --spec-type draft-mtp -ngl 999 -fa on -c 65536，OpenCode 挂上去直接写代码。

Migdał 的文末有一句话，是他整篇评测最值得琢磨的判断："花了 100 美元订阅，换来的是价值数千美元的 token，这就是 API 定价里的大规模补贴。但本地模型不会被收回。"他指的是 Claude Fable 5 被下线的事，本地模型跑在自己的硬盘上，没人能拿走。

这条 27B 密集模型的意义确实值得想一下。当跑在消费级笔记本上的开源模型，智力水平对等到了一年前的付费 API，再往下算的不只是钱——是你在谁的计算机上运行代码。

参考来源：

Quesma: Qwen 3.6 27B is the sweet spot for local development

微信关注我们

原文链接：https://www.oschina.net/news/470261/qwen-36-is-awesome

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

谷歌限制 Meta 访问 Gemini AI 模型

由于全球云计算能力持续短缺，谷歌正式限制了Meta对其顶级AI模型Gemini的访问权限。作为Meta自动化安全工作流程的核心，Gemini此前被广泛应用于诈骗检测和有害内容过滤等大规模审核任务，其效率曾一度优于Meta自身的开源Llama系统。然而，随着AI推理工作负载的激增，谷歌即使在第一季度创下200亿美元的云业务营收，其物理基础设施建设速度仍难以追赶算力需求的爆炸式增长。此次谷歌对Meta实施的算力配给，导致Meta多个内部人工智能项目遭到延误。面对这一突发的基础设施瓶颈，Meta 管理层已紧急要求员工提升 AI Tokens 的使用效率。同时，这一受制于竞争对手的局面也加速了Me...

2026-06-30

0

非侵入式脑机接口一直卡在两个问题上：要么准确率高但得开颅植入电极，要么不用手术但准确率低到没法用。此前非侵入方案的最佳成绩是约 8% 的词准确率——十个字里认不出一个。6 月 29 日，Meta 在 Nature Neuroscience 上发表的研究，把这个数字推到了 78%。这套系统叫 Brain2Qwerty，目前已迭代到 v2。与需要植入电极的侵入式方案（如 stereotactic EEG）不同，Brain2Qwerty 完全在头皮外部采集信号。9 名志愿者每人戴着 MEG 头盔打字约 10 小时，累计产生了约 22000 个句子的训练数据。系统采用端到端的...

2026-06-30

1

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。