红帽 AI 推理服务器正式发布
红帽公司宣布推出红帽AI推理服务器(Red Hat AI Inference Server),由vLLM驱动,并通过Neural Magic技术进一步增强,可在混合云环境中提供速度更快、性能更优且成本效益更高的AI推理。
公告称,红帽AI推理服务器是一款专为高性能设计的开放推理解决方案,配备先进的模型压缩和优化工具。将vLLM的前沿创新整合进自身的企业级能力中,可以作为独立的容器化产品交付,也可以作为RHEL AI和红帽OpenShift AI的一部分提供。
无论在何种部署环境中,红帽AI推理服务器均向用户提供经过加固且具备支持的vLLM发行版,并包含以下功能:
- 智能LLM压缩工具,可大幅缩减基础AI模型与微调AI模型大小,在保持甚至可能进一步提升模型准确性的同时,最小化计算资源消耗。
- 优化的模型存储库,托管在红帽AI组织的Hugging Face中,提供对经过验证和优化的前沿AI模型集合的即时访问,这些模型已准备好用于推理部署,可助力效率提升2-4倍,同时不影响模型准确性。
- 红帽的企业支持,以及在将社区项目带入生产环境方面数十年的专业经验。
- 第三方支持,实现更大的部署灵活性,支持红帽AI推理服务器在非红帽Linux和Kubernetes平台上部署,具体遵循红帽第三方支持政策。
红帽AI业务部门副总裁兼总经理Joe Fernandes表示,“推理是生成式AI的真正价值所在,即在用户进行交互时,特定模型会迅速给出准确回复,但这必须以高效和具有成本效益的方式实现。红帽AI推理服务器旨在满足大规模高性能、快速响应的推理需求,同时保持低资源需求,提供一个通用推理层,支持任意模型在任意环境中的任意加速器上运行。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
智元机器人开源具身世界模型EVAC与评测基准EWMBench
近日,智元机器人重磅发布具身智能领域双重里程碑式突破:在去年发布的机器人4D世界模型基础上,推出动作序列驱动的世界模型框架 EVAC(EnerVerse-AC),同时配套提出全球首个具身世界模型评测基准 EWMBench,构建从世界模型从训练到评测的全链路闭环。 这两大创新成果现已全面开源,EVAC也成为全球顶尖机器人赛事 AgiBot World Challenge @ IROS 2025 的baseline之一。 EVAC arxiv:https://arxiv.org/abs/2505.09723 EVAC 开源代码:https://github.com/AgibotTech/EnerVerse-AC EWMBench arxiv: https://arxiv.org/abs/2505.09694 EWMBench 开源代码:https://github.com/AgibotTech/EWMBench 智元机器人这一动作,打破当前具身智能演进面临的两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制于虚实偏差;在数据层面,海量真机数据尚未构建基于轨迹扩增的高效利用机制...
- 下一篇
荣耀宣布将投入超 700 亿元进军 AI 终端生态
在2025全球人工智能终端展暨第六届深圳国际人工智能展览期间,荣耀在国内首发阿尔法战略,宣布从智能手机制造商向全球领先的AI终端生态公司全面转型,计划未来五年投入100亿美元(约合人民币720亿元)构建覆盖全场景的AI生态体系。 荣耀终端有限公司产品线总裁方飞介绍:“荣耀将通过打造真正智慧的手机,构筑智慧生态和拥抱智慧世界的三步走战略。” 第一步,从开发打造真正智慧的手机开始。在AI智能体时代,荣耀将与合作伙伴打开技术的边界,共创AI终端的新范式; 第二步,在物理AI时代,将打开产业的边界,共创AI生态的新范式; 第三步,在通用人工智能(AGI)时代,荣耀将打开人类潜能的边界,共创人类文明的新范式。
相关文章
文章评论
共有0条评论来说两句吧...