首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/3874284/blog/17233640

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

作者:王建伟(正己) 12 月 11 日,OpenAI 旗下 AI 聊天机器人平台 ChatGPT、视频生成工具 Sora 及其面向开发人员的 API 自太平洋时间下午 3 点左右起发生严重中断,耗费约三个小时才顺利恢复所有服务。 OpenAI 在事后报告中写道,"该问题源自新部署的遥测服务,此项服务无意间压垮了 Kubernetes 控制平面,导致关键系统发生连锁故障。引发事故的根本原因就是新的遥测服务配置意外在大规模集群中产生了大量 Kubernetes API 负载,导致控制平面不堪重负并破坏了基于 DNS 的服务发现能力。" 可见,即使如实力强大的 OpenAI,面对复杂 Kubernetes 架构,也不能很好处理 Kubernetes 服务发现和控制面解耦的问题。造成这个问题的关键原因在于容器调度和业务关键服务发现链路耦合在一起,互相干扰,Kubernetes 控制面故障影响了业务服务发现链路。那么,Kubernetes 体系下应如何选择服务发现系统,进一步提升业务稳定性呢? 笔者认为,大型业务的服务发现系统应该具备高可靠性,高可伸缩性,高性能及高可维护性等特点,采用独立服务...

海外玩家开山立派,中国软件出海怎么赢得用户青睐?

12 月 26 日,开源中国邀请观测云 CEO 蒋烁淼将、亚马逊云科技 SA Manager 梁风飚、OceanBase CEO杨冰、AutoMQ 联合创始人兼 CEO 王小瑞、Bytebase 联合创始⼈兼 CEO 陈天舟等企业家做客【开源漫谈】直播间,探讨我国基础软件如何出海。 期间,大家聊到了中国软件要怎么在全球市场赢得客户青睐。 扫码查看直播回放: 以下内容根据直播整理: 蒋烁淼:小瑞,你们的产品在GitHub上的表现显然已经远超过国外的竞争对手。从技术上来看,是这样的吗?在市场这块,你们有什么策略来赢得全球用户的青睐? 王小瑞:先说说我们为什么要开发 AutoMQ这个软件?因为 Apache Kafka,已经是一个十年前设计的产物了。如今,当我们从云的角度重新审视这个产品时,发现它并不是那么适应云基础设施的需求。所以说,在云环境下,我们绝对是领先的。 然而,在开展海外业务的过程中,我们也遇到了不少挑战。海外玩家在数仓、可观测性等很多领域已经实现开山立派,成为了足以定义该技术的角色。 云给了我们在全球市场跟海外产品公平竞争的机会。当然了,在云上,用户考量的维度就很多了,而不仅仅...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

用户登录
用户注册