Google发出道歉,数小时的云中断事件报告


Google Cloud首席执行官托马斯·库里安(Thomas Kurian)在该公司于2019年举行的一次云计算会议上发表讲话。

迈克尔·肖特|彭博|盖蒂图像

谷歌 为该公司所说的重大停电而道歉是由多层有缺陷的最近更新引起的。

该公司周五晚些时候发布了一份事件报告,该报告解释了周四的停机时间。超过70个Google Cloud Services停止在全球范围内正常工作,击倒或破坏了数十个第三方服务,包括 Cloudflare,Openai和 购物。 Gmail,Google日历,Google Drive,Google Meet和其他第一方产品也出现了故障。

Google在事件报告中写道:“对于这种停电的影响,我们深表歉意。” “ Google Cloud客户及其用户对Google的业务信任,我们会做得更好。我们为这种影响不仅对我们的客户的业务和他们的用户产生了影响,还对我们系统的信任产生了。我们致力于进行改进,以帮助避免像这样的中断。”

Google云部门首席执行官托马斯·库里安(Thomas Kurian)也在周四的X帖子中发布了有关中断的信息,他说:“我们后悔这造成了客户的破坏。”

该公司在事件报告中写道,Google于5月在其“配额策略检查”中添加了一项新功能,用于评估自动传入请求,但新功能并未在现实情况下立即测试。结果,该公司的系统不知道如何正确处理新功能中的数据,其中包括空白条目。该公司写道,这些空白条目随后被发送到所有Google Cloud Data Center区域,这促使坠机事故。

该公司表示,工程师在10分钟内弄清楚了这一问题。但是,在此之后,整个事件持续了七个小时,撞车事故导致了一些较大地区的超负荷。

当它发布该功能时,Google没有使用功能标志,这是一种越来越常见的行业实践,可以缓慢实施,以最大程度地减少出现问题的影响。 Google说,在功能广泛使用之前,功能标志会遇到问题。

该公司表示,谷歌将改变其体系结构,因此,如果一个系统失败,它仍然可以在不会崩溃的情况下运行。 Google表示,它还将审核所有系统并改善其通信“自动化和人类,因此我们的客户获得了尽快对问题做出反应的信息。”

– CNBC的Jordan Novet为这份报告做出了贡献。

手表: Google收购重点介绍了AI Capex繁荣的Tech削减成本

(tagstotranslate)Cloudflare Inc(T)Shopify Inc(T)Shopify Inc(T)字母C类C(T)技术(T)突发新闻:技术(T)Google(T)Alphabet Int(T)Internet(T)Internet(T)商业新闻



关键词:

Google发出道歉数小时的云中断事件报告
Comments (0)
Add Comment