首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/5170379/blog/18693226

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

快速指南:在 Kubernetes 上扩展 AI/ML 工作负载

​原文作者:Ilya Krutov - F5 NGINX 产品营销经理 原文链接: 快速指南:在 Kubernetes 上扩展 AI/ML 工作负载 原文来源: NGINX 中文官网 NGINX 唯一中文官方社区 ,尽在nginx.org.cn 在 Kubernetes 上运行人工智能 (AI) 和机器学习 (ML) 模型训练与推理时,动态扩展是一个关键要素。除了需要高带宽存储和网络来接收数据以外,AI 模型训练还需要大量(且昂贵)的算力,其中大部分来自于 GPU 或其他专用处理器。即使利用预训练的模型,生产环境中的模型服务和微调等任务仍比大多数企业工作负载更耗费算力。 云原生 Kubernetes 专为实现快速扩展而设计,支持混合多云环境中的动态工作负载更灵活、更经济高效地使用资源。 本文介绍了在 Kubernetes 上扩展 AI/ML 工作负载的三种最常见方法,以便您在不同环境中实现最佳性能、成本节省及动态扩展。 在 Kubernetes 上扩展 AI/ML 工作负载的三种方法 Kubernetes 扩展工作负载的三种常用方法是 Horizontal Pod Autoscaler...

DeepFlow 携手保险巨头亮相 SIGCOMM,展示 AI 可观测性赋能金融系统

在美国计算机协会(ACM)旗舰会议 SIGCOMM 2025 的首届 Next-Generation Network Observability (NGNO) Workshop 上,云杉网络与中国某头部保险集团展示“基于 DeepFlow 智能体的IT健康评估和故障诊断平台”,成为全球产学研关注的焦点。作为保险行业首个实现 “可视 — 维稳 — 智能” 全阶段落地的标杆项目,其不仅印证了AI时代下智能体和可观测性技术相结合的应用价值,更为此保险科技公司践行 “科技资源整合、服务能力支撑、运营共享服务、价值创造” 四大战略定位提供了核心技术支撑,为金融行业 IT 转型输出了可复制的实践路径。 01|行业共性挑战:复杂金融IT架构下的稳定性之困 在金融数字化转型进入深水区的当下,保险行业 IT 系统正面临 “监管合规高压” 与 “技术架构复杂” 的双重夹击。保险科技公司肩负着为全集团提供全方位数字化支撑,全力承接集团科技底座建设。其算力底座云平台承载着寿险、财险、健康险等多业务线的核心交易,日均保单处理量超百万笔,支付网关峰值 QPS 突破 10 万。由于各子公司业务场景差异,上云架构呈...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册