京东开源基于国产芯片自研的 xLLM 大模型推理引擎
京东宣布开源基于国产芯片自研的一款大模型推理引擎 xLLM,能让企业部署AI应用时,性能更高、成本更低。
此次开源的核心功能包括:
- 基于请求优先级的动态调度器;
- 动态自适应的 PD 分离架构,可根据负载实时调整PD实例的比例;
- 面向多模态场景的 EPD 混合分离调度器;
- 基于硬件特性的多级流水线的执行引擎;
- 涵盖图融合、投机推理、动态负载均衡的计算优化套件;
- 基于Mooncake的多级 KV 缓存的全局管理;
公告称,xLLM大模型推理引擎源自京东零售核心业务。目前,该技术服务了京东AI助手京言、智能客服、风控、供应链助手、广告等场景,效率提升5倍以上,机器成本降低90%。
“我们始终坚信,AI Infra生态建设离不开每一位开发者。开源,只是第一步。接下来,京东零售AI Infra团队会根据社区需求,继续开放更多高级能力,并和清华、北大、中科大、北航等产学研生态伙伴一起,推动国产AI Infra技术生态的协同创新,推动行业智能化升级。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
“光镊”技术构建出最大量子比特阵列,包含 6100 个超冷中性铯原子
美国加州理工学院科学家在新一期《自然》杂志发表论文称,他们利用高度聚焦的激光束——“光镊”技术,控制了6100个超冷中性铯原子,构建出目前规模最大的量子比特阵列。专家指出,这一突破表明中性原子量子计算机具备大规模扩展潜力,但距离实现成熟可用的量子计算机仍有很长的路要走。 “光镊”捕获的6100个铯原子阵列。图片来源:美国加州理工学院 量子比特是量子计算的基本单元,与传统计算机中的比特有本质区别。传统比特只能表示0或1中的一种状态,而量子比特可同时处于0和1的叠加态,借助量子纠缠实现并行计算,从而在解决特定问题上实现指数级加速。 目前,全球量子计算技术路线多样,包括超导、光量子、离子阱、半导体量子点及中性原子等。本研究采用的正是在真空中用“光镊”捕获中性原子作为量子比特的技术。 研究团队将激光束分割为12000个高度聚焦的“光镊”,在真空腔内捕获了6100个铯原子,排列成规整阵列,构建出迄今最大量子比特阵列——此前纪录为包含1180个中性原子的量子比特阵列。 实验显示,在规模大幅扩展的同时,量子比特质量并未下降:其叠加状态可持续约13秒,比以往类似阵列延长近10倍,单量子比特操控精度达9...
-
下一篇
特斯拉技术员被机器人打成重伤,索赔 5100 万
一名特斯拉(Tesla)技术员在工作期间被有故障的机器人袭击,身受重伤。目前医疗费用已达100万美元,后续治疗至少还需要600万美元。他在近日将特斯拉及其供货商告上法庭,提出5100万美元的赔偿。 50岁的彼得·亨特多布勒(Peter Hinterdobler)是特斯拉公司的技术员。2023年7月,他在美国加州佛利蒙工厂协助工程师拆卸机器人时受到袭击。 根据法庭文件,这台机器人原本放置在“非指定区域”,不符合设备设计要求。事故发生时,工程师试图移除机器人底部的电机以查看内部组件,但机器人臂“突然且毫无警告地释放”,以相当于“约8000磅配重”的巨大力量击中亨特多布勒的身体,把他“扔到地上”并导致其“失去意识”。他遭受了严重身体伤害,包括物理创伤、情绪困扰和财务损失,已累计医疗费用达100万美元,预计未来还将额外产生600万美元费用。 亨特多布勒把特斯拉和机器人发那科美国公司告上法庭,后者是一家日本公司,是肇事机器人生产商。他要求赔偿5100万美元,包括工资损失、精神损害、疼痛折磨以及收入能力下降。 诉状显示,亨特多布勒指控特斯拉未能确保机器人的机械装置安全,使他在未能在“安全断电、固定...
相关文章
文章评论
共有0条评论来说两句吧...