年中盘点:2020年10大云故障
仅仅几个月前,新冠病毒就以人们无法预测的方式对云提供商进行了一轮测试。大多数情况下,云计算产业已经能够在全球突然开始极大地依赖云服务以继续工作、学习和娱乐的时候、保持云服务的可用性和稳定性。
在面对前所未有的压力测试时,公有云已经被证明具有极强的弹性,但今年上半年也还是有一些例外。虽然今年到目前为止,只有少数几起中断故障是由于新冠病毒让云服务使用激增所导致的,但还有一些是由于某些常见的故障引发的,即使是在特殊时期,这些故障在某些程度上也是不可避免的。
下面就让我们来看看今年到目前为止给用户带来影响的10大云故障。
1. Twitter,2月7日
今年2月Twitter发生部分服务中断,导致一些用户无法发送推文。
“推文无法发送,我们正在努力修复,”社交媒体巨头Twitter的产品经理Patrick Traughber发推文表示。
根据Downdetector.com的报道,美国东部时间下午5点之前,有关服务中断的投诉激增至12000起,主要发生在美国和欧洲。
Twitter支持团队在推文中说:“我们对这次服务中断感到抱歉,我们会在恢复正常之后通知您。”
Twitter很快发现,这次服务中断的罪魁祸首,是最近的一次更新中包含的错误代码,随后取消了这次更新。美国东部时间下午5:07之前,Twitter支持团队向用户发送通知称:“您可以继续使用Twitter了,问题已经得到解决!感谢您继续使用。”
2. 微软Azure,3月3日
从美国东部时间上午9:30开始,微软位于美国东部数据中心发生了6个小时的服务中断,从而导致美国北部的一些客户无法使用Azure云服务。
几天后,微软称这次故障应归咎于冷却系统故障。微软解释说,楼宇自动化控制功能故障导致气流减少,随后整个数据中心达到峰值,从而影响了网络设备的性能,使计算和存储实例无法使用。
微软最终重置了冷却系统控制器,一旦温度降下来,工程师就可以关闭电源,重启硬件,恢复服务。
3. 微软Teams,3月16日
在新冠病毒大爆发之际,微软Teams平台涌入了大量新用户,导致该服务在欧洲地区出现了持续2个小时的宕机,此次事件也突显了Teams服务的支持能力问题。
微软在推特上称,截至美国东部时间上午4:50,“微软一直在调查Teams中与通信相关的功能问题”。有报道称,对欧洲用户来说,Teams应用程序套件已经完全无法使用。
微软在一份声明中表示:“我们已经采取措施解决部分客户可能遇到的问题,工程团队将继续积极监控性能和使用情况。”
而就在两周前,微软刚刚承诺向目前尚无Teams许可的企业和教育机构免费提供6个月的Office 365 E1订阅服务。
4. 微软Azure,3月24日至26日
今年3月微软证实,新冠病毒大爆发给微软多项云服务带来极大的压力,这导致了欧洲地区发生一系列宕机。
这次故障给开发者带来的影响特别大,因为3月24日首先“阵亡”的是Azure Pipelines,DevOps团队使用的持续交付服务。接下来的几天里,微软的软件开发管道发生严重的延迟。
微软后来解释说:“此次事件是由全球新冠病毒大爆发引起虚拟机容量受限所导致的,使得设备重新映像的时间增加,可用代理的等待时间也随之增加。”
当周晚些时候,微软接受了关于没能及时解决故障的指责。
微软工程总监Chad Kimes说:“第一天影响最严重的时候,我们有大约5个小时都没有意识到故障的发生,这比我们设定的10分钟要糟糕得多。”
5. Google Cloud Platform,3月26日
谷歌用户从3月26日上午11点开始报告有多项云服务无法访问的问题。
用户发推特称,他们遇到了Google 500和502错误代码——500代码代表因内部错误导致请求失败;502代码则代表网关出现故障。
Google最终将这次故障归咎于“基础设施组件”问题。
据Downdetector称,美国东部沿海地区的谷歌客户受到影响似乎最大。
6. Zoom,4月3日
新冠病毒大流行迫使全球开始转向远程办公和远程学习模式,Zoom作为全球最重要的视频服务提供商之一,遭遇了平台需求的激增。
这种压力似乎导致了4月3日的服务中断,使得美国东海岸和部分欧洲地区的Zoom用户对于无法使用Zoom服务感到震惊。根据DownDetector.com的报道,美国加利福尼亚州、佛罗里达州、中西部和马来西亚的部分地区都出现了的宕机。
登录尝试时报告的错误消息表明Zoom Web客户端出现了问题,Zoom的状态页面称正在维护中。
Zoom在自己的开发者论坛页面上表示:“在这个艰难的时期,我们看到人们对Zoom服务的需求出现激增。为了继续为客户和开发者提供卓越的服务,我们可能会迅速实施一些变更措施。”
此前Zoom一直在为教育机构免费提供视频服务,为企业和消费者提供40分钟的免费视频会议,这导致3月日活用户数量同比增长了151%。
7. Google Cloud Platform,4月8日
这次涉及Google Cloud身份和访问管理(IAM)API的故障,导致用户被锁定在Google Gmail帐户之外,并影响了其他基于Google Cloud的主流服务。
这次故障从美国东部时间上午10:35开始,持续了不到90分钟,导致多个Google服务中断,包括App Engine、Cloud Functions、BigQuery及其核心Compute Engine IaaS。
Google的姊妹公司Nest不得不向客户解释为什么他们的安全摄像机暂时无法使用。而作为Google Cloud的重要客户,Snapchat完全瘫痪了一个多小时。
8. GitHub,4月21日
微软旗下的源代码存储库GitHub在4月底发生了多次宕机。
首先是在4月21日,GitHub苦苦挣扎了一个多小时;第二天,GitHub又发生了两次背靠背的宕机,再次让依赖GitHub平台的开发者工作停滞,然后又一次影响了多个GitHub服务一个多小时;第二天又是如此。
软件工程师在日常工作中所依赖的Git Operations、API请求、拉取请求等功能都出现了级。随着整周持续不断的宕机,开发者们开始在Twitter抨击微软缺乏透明度。
9. Adobe Creative Cloud,5月28日
今年5月,Adobe云平台(包括Photoshop、InDesign和Premier Pro等备受欢迎的产品)发生宕机一整天的时间,让创意专业人士的工作完全停滞。
Adobe Creative Cloud的故障在数字设计社区引发了有关云服务缺点的讨论,很多人在Twitter上开始思考,他们是否应该倾向于这些产品的本地化版本。
从美国东部时间上午9点开始,Adobe客户报告称他们无法登录Adobe Creative Cloud平台并使用相关服务,有客户称,他们因为无法登陆帐户而无法联系到支持人员。
问题曝光的7个多小时之后,Adobe在推特上发布了该问题的解决方法,但未详细说明根本原因。
10. IBM Cloud,6月9日
IBM将这次导致很多客户(包括一些备受欢迎的网站)宕机的云故障归咎于第三方网络故障。IBM的一家商业合作伙伴公司首席执行官称,客户无法访问IBM的环境、状态屏幕和控制台,“根本不知道发生了什么”。
他说:“这带来了广泛的影响,整个环境都停滞了。”
IBM Cloud状态页面也在故障发生期间短暂关闭,然后在下午6:30之后报告称一系列问题已经得以解决。
IBM状态页面解释说:“网络运营团队调整了路由策略,解决了第三方提供商引入的问题,从而解决了这次故障。”
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
三分钟看懂,什么是边缘计算
什么是边缘计算呢?其实关于边缘计算的定义,目前国内还没有一个严格统一的定义。今天小编就给大家整理三个关于边缘计算的说法,帮助大家快速理解什么是边缘计算。 1、维基百科说 维基百科上说,边缘计算是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘计算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。我们认为边缘计算是在靠近数据源头的地方提供智能分析处理服务,减少时延,提升效率,提高安全隐私保护。这个概念可能比较抽象,接下来再举两个生动的例子给大家说明。 2、章鱼说 2016年4月,新西兰国家水族馆一只名为“Inky”的章鱼偷偷从水族缸里爬了出来,穿过房间并钻入一个排水口,通过50米长的水管逃回了外海中。Inky的成功向我们证明:章鱼是地球上非常聪明的生物之一。 那么,章鱼跟边缘计算有什么关系?其实,章鱼就是用“边缘计算”来解决实际问题的。作为无脊椎动物,章鱼拥有巨量的神经元,但60%分布在章鱼的八条腿(腕足)上,脑部仅...
- 下一篇
首席信息官通过公共云迁移重新激活IT基础设施的活力
TC Energy公司首席信息官Chris Foster表示,企业向公共云的迁移削减了成本(但不包括员工),提供了对机器学习和人工智能等先进技术的访问,并加快了在家远程工作的步伐。 早在今年3月,冠状病毒疫情迫使各国政府发布居家命令时,许多公司都在为员工配备笔记本电脑和台式机,以便他们可以在家远程工作。他们需要设置VPN和其他安全性,并需要配置台式机和笔记本电脑。而Chris Foster表示为此已经做好了准备。 TC Energy公司是一家位于加拿大阿尔伯塔省卡尔加里的能源基础设施开发商,包括加拿大、美国和墨西哥的管道和存储,已经从现场服务器和数据中心向公共云提供商进行了战略性的数字转型。Foster表示,该公司90%的企业和商业应用程序现在都在云端,因此向需要在家办公的员工部署虚拟桌面相对容易。 这并不意味着随着项目的进行,让企业参与这一巨大的变化并不是一件容易的事。例如,有很多IT工作者在硬件和服务器应用上方面存在一些阻力。TC Energy公司还将其SAP实施移至云端,另一位副总裁表示这将永远不会发生。尽管存在抵制,但Foster仍将大多数内容迁移到了单个公共云提供商AWS云平...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- MySQL8.0.19开启GTID主从同步CentOS8
- Red5直播服务器,属于Java语言的直播服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 设置Eclipse缩进为4个空格,增强代码规范
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长