首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/72386

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何从SLB故障中快速恢复

背景 3月14日17:32-19:10时段,阿里云杭州区可用区E的大量slb出现服务不可用的问题,疑似健康检查系统出现故障,所有后端节点不论是否监控都一律都被标记为"异常",导致TCP SLB的服务connection failed, HTTP SLB出现502错误。 小博无线线上业务系统完全基于阿里云搭建,在杭州区E可用区也部署了多个SLB作为流量接入点,在阿里云出现故障超过90分钟的情况,小博无线技术团队却只用了不到20分钟就完全恢复了业务接入,我们是如何做到的? 过程 17:38 运维团队收到某关键服务不可用的告警。登入阿里云控制台查看发现该业务对应的SLB的所有后端节点均为"异常"状态,但是我们自己内部的监控系统显示这些节点都是健康的,同时,还有多个SLB存在类似的情况并且都位于可用区E,于是怀疑该可用区的健康检查系统出现故障。 17:50 配置DNS,停止到出故障的SLB的IP解析。几分钟后观察到故障SLB上的流量已几乎全部漂移到正常的SLB上,业务全面恢复正常。 方法 完整的业务监控告警系统 对关键服务的接入点的服务质量每隔两分钟检查一次,如果连续3次不可用,推送告警到开发...

【阿里聚安全技术公开课】业务安全及防护(数据风控)

阿里云·云栖社区携手阿里聚安全打造阿里安全技术公开课,带你一探互联网安全的风采 关于互联网业务安全 互联网账号泄露事件频发,脱库、洗库、撞库,形成了一条完善的黑灰产业链,盗刷信用卡、“羊毛党”猖獗、刷单炒信等业务风险背后,如何去防范,阿里聚安全专家笙华为你支招。 ​ ​ 讲师:笙华阿里聚安全产品专家 课程简介: 本课程主要介绍互联网常见业务风险,比如账号泄露、垃圾注册、刷库撞库、黑灰产业链等。 第1讲:互联网常见业务风险 课程地址:https://yq.aliyun.com/edu/lesson/play/646 第2讲:互联网常见业务风险防控建设 课程地址:https://yq.aliyun.com/edu/lesson/play/647 第3讲:互联网业务安全防护实践 课程地址:https://yq.aliyun.com/edu/lesson/play

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册