【コラム】フェイスブック、Instagram、WhatsAppはなぜダウンしたのか?

次の記事

米国アマゾン、プライム会員はメールアドレスや電話番号だけでギフトを送れるように

Facebookの1日にわたるサービス停止は、ここ数年で最も長く、最も極端なものだった。ソーシャルジャイアントの本社がある米国西海岸では、現地午前9時頃、Facebook、WhatsApp、Instagram、Facebook Messengerがインターネット上から消えたように見えた。

この障害は市場終了まで続き、同社の株価は米国時間10月4日の初値から約5%下落した。Facebookがサンタクララのデータセンターにチームを派遣し、同社のサーバーを「手動でリセット」したことが報じられた後、午後の初めにはサービスが再開された。

関連記事
フェイスブック、Messenger、Instagram、WhatsAppなどすべてがダウン中、DNS障害が原因か
世界的な障害が続く中、フェイスブックの株価も下落を続ける

今回の障害の特徴は、Facebookが非常に長い時間オフライン状態にあったということだ。

午前中、Facebookは「一部のユーザーが、当社アプリやプロダクトへのアクセスに支障がある」ことを謝罪するツイートをした。その後、この障害がユーザーだけでなく、同社自体にも影響を与えていることが報告された。従業員はオフィスビルに入ることができず、スタッフは「スノーデイ」と呼んでいたが、この障害は社内のコラボレーションアプリにも影響を与えたため、仕事をすることができなかった

Facebookは、障害の原因についてコメントしていないが、セキュリティの専門家によると、同社のネットワークに問題があり、インターネットとFacebook全体が遮断されたことを示す証拠があるとのことだ。

ネットワーク大手CloudflareのCTOであるJohn Graham-Cumming(ジョン・グラハム-カミング)氏によると、最初の兆候が観測されたのはカリフォルニア州では午前8時50分頃で、Facebookは2分間に渡って「BGPのアップデートが嵐のように続く中、インターネットから消えた」という。BGP(Border Gateway Protocol)とは、ネットワークがインターネット上のデータを他のネットワークに送信する際の最速方法を決定するために使用するシステムのことだ。

具体的には、アップデートはBGPルートの取り消しだった。つまり、Facebookは、城の橋を閉鎖するように「ビジネスを終了する」というメッセージをインターネットに送ったのだ。その構造上、FacebookのネットワークはWhatsApp、Instagram、Facebook Messengerなど、デジタルの壁の内側にあるすべてのものが閉鎖されることになった。

BGPルートが取り消しから数分後、ユーザーは問題に気づき始めた。Errata Securityの創業者であるRob Graham(ロブ・グラハム)氏は「Facebookに送られるべきインターネットトラフィックが、インターネット上で迷子になり、どこにも行かなくなってしまったのです」とツイートしている。

ユーザーは、Facebookアプリが動かなくなったことやウェブサイトが読み込まれないことに気づき始め、インターネットの仕組みのもう1つの重要な部分であるDNS(Domain Name System)に問題が生じたことを報告した。DNSは、人間が読めるウェブアドレスを機械が読めるIPアドレスに変換し、ウェブページがインターネット上のどこにあるのかを見つけ出す。Facebookのサーバーにアクセスする手段がなければ、アプリやブラウザはDNSエラーのようなものを返し続けることになる。

BGPルートが取り消された理由は、はっきりとはわかっていません。インターネットが登場したときから存在しているBGPが、悪意を持って操作され、大規模な障害につながった可能性がある。

それよりも可能性が高いのは、Facebookの設定更新がひどい失敗をし、その失敗がインターネット全体に連鎖したということだ。現在は削除されているが、Facebookのエンジニアが投稿したRedditのスレッドには、広く知られるようになるずっと前に、BGPの設定ミスについて書かれていた。

修正は簡単かもしれないが、インターネットの仕組み上、復旧には数時間から数日かかる可能性がある。インターネットプロバイダーは通常、数時間ごとにDNSレコードを更新するが、完全に伝搬するまでには数日かかることがある。

Facebookは、現地時間午後3時30分頃「私たちを頼りにしてくれている世界中の人々や企業の巨大なコミュニティへ:申し訳ありません」とツイートした。「アプリやサービスへのアクセスを回復するために懸命に取り組んできましたが、現在はオンラインに戻っていることを報告します。ご理解いただきありがとうございます」。

画像クレジット:TechCrunch

原文へ

(文:Zack Whittaker、翻訳:Katsuyuki Yasui)