滴滴史上最严重服务故障,罪魁祸首是底层软件 or “降本增笑”?
2023年11月27日晚间,滴滴因系统故障导致App服务异常,不显示定位且无法打车。11月27日晚,滴滴出行进行了回复:非常抱歉,由于系统故障。
2023年11月28日早间,滴滴出行消息称,网约车等服务已恢复,骑车等在陆续修复中。11月28日,在滴滴发出公告的同时,记者在上海、深圳等地使用滴滴呼叫网约车,发现网约车功能并未恢复使用,网络加载异常,仍无法打车。11月28日,滴滴向记者回应称,网约车服务已恢复,司机乘客权益陆续恢复补发。
11月29日,滴滴再次发文致歉,称初步确定事故起因是底层系统软件发生故障。
在滴滴官方发布这份公告之前,已经有资深IT技术人士分析:“从表现上看,打车、共享单车全挂,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施。攻击者一般只能访问到应用层,基础设施访问不到。要么是被攻击者打穿,要么是自己系统操作不慎挂了。即便是前者,也算是一种系统缺陷,才会被打穿。”
360安全专家认为,滴滴闪崩背后的技术原因可能有六种:
第一,系统更新升级过程中出现了编程错误、逻辑错误或未处理的异常情况:一般情况下,互联网厂商发布更新都会在晚上,与滴滴发生故障的时间也能对应,当然业务升级维护是放量更新,但现在滴滴全平台、全业务都故障了,说明肯定是他“家里”的问题。
第二,服务器故障:比如滴滴的核心机房,可能恒温恒湿环境出了问题,导致服务器过热、CPU烧了,或者核心机房所在地发生了自然灾害如地震、洪水、海啸等,这种情况下,硬件需要重新更换,里面的服务软件也需要重新配置,恢复周期相对较长,但这个可能性比较小。
第三,第三方服务故障:滴滴的后台架构可能使用了第三方服务或者组件。如果第三方出了问题,也可能会影响滴滴的正常运行。但出于安全性考虑,滴滴可能不会将核心业务托管给第三方,不过这个可能性也较小。
第四,DDOS攻击:黑客采用分布式拒绝服务的方式,抢占了大量的服务器资源,导致用户无法访问,但这个不太可能,因为DDos不会导致数据出错,而且滴滴从体量上来说,有足够的成本和能力去对抗。
第五,其他网络攻击:某些黑灰产团伙可能会通过拖库盗取数据,然后在暗网上售卖,在这个过程中不排除会有误操作,破坏了数据库。
第六,勒索病毒:网络攻击黑客对滴滴的底层数据、业务代码进行了加密。据披露现象,用户的账单和打车数据都算错了,存在一定可能是滴滴为了避免更大损失主动暂停了业务。近期勒索攻击事件屡屡发生,月初,某金融机构就是因为遭遇勒索病毒攻击造成了业务停摆。
不过也有网络安全公司专家认为,如果是来自外部的黑客攻击,公司一般会在第一时间进行声明。他猜测更集中于滴滴发生了内部重大业务调整,或有新业务接入原系统,但没有做好预案,导致关联业务或关联系统出现重大故障,这是大公司系统故障最常见的原因。
因此对于滴滴此次大规模的长时间故障,有行业人士认为,降本增效可能也是原因之一。
该人士认为,互联网公司核心业务频繁宕机,且长时间宕机,是降本增效的附属品之一。系统投资少了,维护资源少了,程序员更换频繁了,BUG就多。
他举例称,一般在业务上行阶段都有冗余,为了迎接随时爆发的订单,上行阶段要维持负载的上限不能过大,比如平时70%,这样遇到一个小爆发不用担心会出问题,足以应对小高峰;但是下行期的逻辑就不同了,负载很高的时候抗一抗就行了,虽然后面遇到小高峰可能会难受,但是随着时间的推移总体负载会下降。
最后来看一下网传的消息,有同行说滴滴这次严重故障是K8S的问题导致,当时SRE工程师定位了三个小时没定位到。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
周鸿祎:“360 无法卸载”是彻底的谣言
俞敏洪在公众号更新了与周鸿祎的采访对话。对话中双方聊到了大众对360的误解,周鸿祎表示,360不能卸载是一个彻底的谣言。 来源:https://mp.weixin.qq.com/s/pd2R8Y5Q6HtYODNfRvcbnA 周鸿祎称,因为360提供了完整的卸载过程。有的小朋友总是试图用一个Windows的删除想把360的目录删掉,这样其实是删不掉的,所以大家就会有一个错误的印象,好像360删不掉。 但是你想,360在电脑上是起保护作用的,最恨360的是什么?是各种黑产、黑客,现在无论是国外的网军做攻击,还是国内的勒索软件做攻击,因为360装的太广,所以他们很重要的一个任务就是想办法让360失效,要不然360一报警他们就出问题了,所以你随便用一个Windows做一个拖拽,把它移垃圾箱里肯定是不行的。 甚至现在很多国外的攻击软件试图调动360自己删自己的过程,因为360提供了自己卸载自己的能力,所以在用户卸载的时候,我们要区别是用户真的在卸载,还是被攻击了模拟用户在卸载,因为很多软件可以模拟用户的操作。 我们为了做自我保护,可能有一个比较烦琐的提示过程,就是这样以讹传讹,好像就变成了3...
- 下一篇
Java 8 仍被广泛使用,占比 50%
JetBrains最新发布的 2023 年度开发者生态系统调查报告指出,在面向 Java 开发者的调查中,更多的开发人员选择在生产中使用 Java 17,而不是 Java 11。Docker 逐渐成为打包 Web 应用程序的首选,且 Spring 和 Spring Boot 的使用率遥遥领先。 具体而言,开发者最常使用的Java 版本是Java 8,占比高达50%;其次分别是Java 17 (45%)、Java 11(38%) 以及Java 20 (11%)。 “很遗憾看到这么多人仍在使用 Java 8(及更旧的版本)。我想知道是什么阻碍了他们升级到更新的版本并获得强大的新语言功能,以及我们如何帮助他们将代码迁移到更新的 Java 版本。” 其他一些发现包括: 58% 的受访者表示,他们打包 Web 应用程序的方式是Docker,还有 56% 使用的是嵌入式服务器。 最常用的是单元测试框架是JUnit,以 84% 的占比稳居首位。 Web 框架方面,72% 开发者正在使用Spring Boot。 Java EE 8 / Jakarta EE 8 使用率为 33%,Jakarta EE ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路