作為云基礎(chǔ)設(shè)施市場的領(lǐng)軍企業(yè),亞馬遜云服務(wù)(AWS)于周一報(bào)告發(fā)生重大服務(wù)中斷,導(dǎo)致眾多主流網(wǎng)站陷入癱瘓。
盡管部分網(wǎng)站在數(shù)小時(shí)內(nèi)恢復(fù)訪問,但故障監(jiān)測平臺(tái) Downdetector 顯示,美國東部時(shí)間中午前后,關(guān)于亞馬遜、AWS 及 Alexa(亞馬遜智能語音助手)的故障報(bào)告再次激增。
亞馬遜在美國東部時(shí)間下午 4 點(diǎn) 52 分發(fā)布的最新更新中表示,目前正處理任務(wù)積壓,預(yù)計(jì)約兩小時(shí)內(nèi)完成處理。
亞馬遜在周一下午的博客文章中指出,AWS 客戶在嘗試啟動(dòng)旗下熱門云服務(wù) EC2的新實(shí)例時(shí),遭遇 “錯(cuò)誤率上升” 問題。公司在文中寫道:“我們正以最快速度全力恢復(fù)服務(wù)。”
美國東部時(shí)間下午 1 點(diǎn) 30 分左右,AWS 表示在部分區(qū)域已觀察到 EC2 服務(wù)恢復(fù)的 “初步跡象”,且正針對(duì)剩余區(qū)域?qū)嵤┬迯?fù)措施,“預(yù)計(jì)修復(fù)完成后,實(shí)例啟動(dòng)錯(cuò)誤及網(wǎng)絡(luò)連接問題將得到緩解”。
亞馬遜同時(shí)確認(rèn),此次中斷影響了亞馬遜官網(wǎng)、部分子公司業(yè)務(wù)以及 AWS 客戶支持服務(wù)。
此次故障最早于美國東部時(shí)間凌晨 3 點(diǎn) 11 分在 AWS 位于弗吉尼亞州北部的主要區(qū)域 ——US-East-1 區(qū)域被報(bào)告。AWS 狀態(tài)頁面的通知顯示,其數(shù)據(jù)庫服務(wù) DynamoDB 出現(xiàn)域名系統(tǒng)(DNS)問題,而 DynamoDB 是支撐眾多其他 AWS 應(yīng)用的核心服務(wù)。
域名系統(tǒng)的作用是將網(wǎng)站域名轉(zhuǎn)換為 IP 地址,使瀏覽器及其他應(yīng)用程序能夠加載內(nèi)容。
AWS 在美國東部時(shí)間凌晨 5 點(diǎn) 01 分的更新中提到,此次 “運(yùn)營問題” 影響了 “多項(xiàng)服務(wù)”,并表示正 “通過多條并行路徑加快恢復(fù)進(jìn)度”。此次故障共影響了 AWS 自身超 70 項(xiàng)服務(wù)。
美國東部時(shí)間早上 6 點(diǎn) 35 分,AWS 在更新中稱 DNS 問題已 “完全解決”,AWS 各項(xiàng)服務(wù)運(yùn)營 “恢復(fù)正常”。
根據(jù)Synergy Research Group的數(shù)據(jù),AWS 是云基礎(chǔ)設(shè)施技術(shù)領(lǐng)域的龍頭企業(yè),約占據(jù)三分之一的市場份額,領(lǐng)先于微軟和谷歌。數(shù)百萬企業(yè)及機(jī)構(gòu)依賴 AWS 提供的云計(jì)算服務(wù),例如服務(wù)器和存儲(chǔ)服務(wù)。