今日のGmailのダウンの原因はこれだ

次の記事

[CG]Ars TechnicaによるSnow Leopardの徹底的レビュー

今日(米国時間9/1)Gmailがダウンしたときのパニックははんぱじゃなかった。ぼくみたいに主にGmailでメールしている人は、仕事がほとんどできなくなる。仕事が特定のサービスに依存しているときは、そのサービスのダウンはほとんど命取りだ。

でも、いったい何が起きたのだろう? Gmailにはフェイルセーフがあるはずだろ? もちろん、ある。Gmailは何千台もの多重化サーバを使っているから、一台がダウンしてもすぐに、同じデータが複写されて乗っている別のサーバに切り換える。ただし、それらとは別にリクエストサーバというものがあって、それはメールのリクエストを本体サーバのどれか…リクエストに合致するメールがあり今使えるサーバ…にルーティングする仕事だけをする。

そして分かったことは、Googleはメールサーバの一部を定期的なメンテナンスのためにときどき停止している。そのやり方が最近すこし変わったために、リクエストサーバに過負荷が生じた。Googleの技術担当副社長Ben TreynorがGmailのブログでこう説明している:

太平洋時間の午後0時半ごろ、数台のリクエストルータが過負荷になり、システムのほかの部分に対して”今とても遅くなってるから、しばらくこっちへトラフィックを送るな”と信号した。それによって負荷がほかのリクエストルータに送られるようになり、今度はそれらの一部が過負荷になった。そうやって、数分後にはほとんどすべてのリクエストルータが過負荷になった。リクエストがGmailのサーバにルーティングされなくなったので、ユーザはWebからGmailを使えなくなった。IMAP/POPによるアクセスとメールの処理は、Webからのリクエストを扱うのとは別のリクエストルータを使っているので、正常に動作を続けた。

つまり、システムの冗長性の大きさが不十分だった、ということ。

Gmailは最近AOLを抜いて合衆国で第三位のWebメールになったが、人も企業も大きくなるときには成長痛がある。数時間のダウンはこの世の終わりではないが、仕事の手足を奪われた人は目の前が真っ暗になったかもしれない。これを、Gmailの習慣にしないでほしいね。

[原文へ]

(翻訳:iwatani(a.k.a. hiwa))