AI 推理运行时 Windows ML 正式 GA
微软宣布 Windows ML 现已面向生产环境正式 GA,Windows ML 最早在 Build 2025 大会上推出,是内置的 AI 推理运行时,针对设备上的模型推理进行了优化,并简化了模型依赖管理,支持 CPU、GPU 和 NPU。
Windows ML 让 C#、C++ 和 Python 开发者能够通过 ONNX 运行时在本地 Windows 电脑上运行 ONNX AI 模型,并为不同的硬件(CPU、GPU、NPU)自动执行提供程序管理。 ONNX 运行时可用于 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架中的模型。
Windows ML 具备以下主要优势:
-
Windows ML 架构 API 支持多种硬件架构,开发者可利用设备已安装的执行提供程序或动态下载相关组件,无需为不同设备反复打包应用。同时,开发者还可预编译模型(AOT),为终端用户提供流畅体验。
-
Windows ML 能根据 PC 硬件自动下载所需执行组件,开发者无需在应用内捆绑运行时或执行程序。
-
Windows ML 持续兼容并适配硬件升级,开发者不必为未来设备的变化担忧。
-
开发者可根据需要指定设备策略,对低功耗(NPU)、高性能(GPU)进行优化或设置特定芯片用于模型运行。
微软强调,Windows ML 保持一致性与兼容性,支持硬件和软件的持续升级。开发者可在不同设备上指定策略,如低功耗模式优先使用 NPU,高性能模式调用 GPU,或精确指定运行模型所用的芯片,满足不同应用场景的性能需求。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
蚂蚁数科提出隐私保护 AI 新算法,可将推理效率提升超过 100 倍
全球安全顶级会议ACM CCS以及顶刊IEEETDSC近日发布获选论文名单,蚂蚁数科的两项隐私计算创新技术成果入选。这两项研究聚焦当前跨机构联合建模中应用最广泛的梯度提升决策树(GBDT)模型,通过创新的隐私保护算法,解决了联合建模和联合推理中如何在保障数据隐私前提下实现高性能计算的技术难题。 分别是被ACM CCS2025收录的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》(长臂猿:更快的2方安全GBDT训练框架)与被IEEE TDSC录用的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》(基于同态查找表的隐私保护决策图推理) GBDT类模型(包括XGBoost、LightGBM等)是一种基于梯度提升的决策树算法,可解释性强,预测速度快,广泛应用于营销、风控等场景,是跨机构联合建模中最流行最常用的算法。然而,在多方协作训练与推理过程中,如何在保障数据隐私的前提下实现高性能计算,...
-
下一篇
Qwen3-Coder Plus 更新发布,支持项目级代码理解
阿里通义团队旗下开源 Agentic 编程模型宣布 Qwen3-Coder Plus 更新,迎来能力升级: 通过 Agentic Coding 联合训练优化,TerminalBench 分数大幅上涨,在 OpenRouter 平台一度成为全球第二流行的 Coder 模型(仅次于 Claude Sonnet 4)。 支持 256K 上下文,可一次性理解并修复整个项目级代码库 推理速度更快、Token 消耗更少、安全性更高 本次升级核心亮点 Agentic Coding 联合训练:与 Qwen Code 或 Claude Code 联合优化,在 CLI 应用场景效果显著提升; 项目级代码理解:256K 上下文支持,可处理跨文件、多语言的复杂项目; 推理效率优化:相比上代模型,推理速度更快,用更少 Token 达成更优效果; 代码安全性提升:强化漏洞检测与恶意代码过滤,迈向“负责任的 AI”; 多模态输入支持:搭配 Qwen Code 系统,支持上传截图+自然语言指令生成代码,全球领先。 Qwen3-Coder Plus 代码能力对比图
相关文章
文章评论
共有0条评论来说两句吧...