首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/4169309/blog/18403236

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hugging Face 牵头推动 Transformers 库模型架构标准化

Hugging Face 宣布联合多家机构推动将transformers库作为模型架构标准,提升 AI 生态兼容性。 Hugging Face 表示正与 vLLM、LlamaCPP、SGLang、Mlx、Qwen、Glm、Unsloth、Axoloth、Deepspeed、IBM、Gemma、Llama、Deepseek、Microsoft、Nvidia、InternLM、Llava、AllenAI、Cohere、TogetherAI 等众多生态系统参与者共同努力,将transformers库中的模型定义代码作为标准,旨在为所有模型提供一个统一的真实来源。 Hugging Face 目前正在与最流行的推理引擎(vLLM、SGLang、TGI、...)紧密合作,让它们使用transformers作为后端:只要模型被添加到transformers,便支持在这些推理引擎中使用,同时利用每个引擎的优势:推理优化、专用内核、动态批处理等。 这项联合工作将极大地提高不同模型架构在整个 AI 生态系统中的兼容性和互操作性。

Windsurf 发布 Wave 9 模型家族

Windsurf (原 Codeium) 发布了 Wave 9 模型家族,包括 SWE-1、SWE-1-Lite 和 SWE-1-Mini。 SWE-1 是一个前沿模型,专门为软件工程任务设计,在内部评估和产品使用中,其性能接近甚至超越现有前沿模型。 SWE-1-Lite 是一个更强大的新模型,将取代原有的 Cascade Base,对所有用户免费。SWE-1-Mini 是用于 Windsurf 中 tab 补全的改进模型。SWE-1 目前对 Pro 用户限时免费。 据 Windsurf 介绍,SWE-1 是其中最大、能力最强的 AI 模型,旨在突破现有大模型在软件工程实际需求上的局限。 相比只关注代码生成和单元测试的传统模型,SWE-1 更强调对开发流程中多种状态和上下文的感知能力(flow awareness),它能够在人机协作、任务未完成等复杂场景下持续推进工作。 根据基准测试,SWE-1 在 “对话式 SWE 任务基准” 和 “端到端 SWE 任务基准” 这两项核心指标上,都已经接近目前行业最强的前沿模型。特别是独立的端到端任务中,它的表现几乎和 Claude 系列最新模型能力...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。