
ビジネス向けソーシャルサービスのLinkedInは収益を上げ、急成長を遂げているようではある。しかし本日(米国時間2/3)は何か調子が非常に悪くなっているようだ。少なくともヨーロッパから見るとアクセスできたりできなかったりということが続き、ここ55分間はエラーページが表示される(中央ヨーロッパ標準時4:30 PM)。
Update: 修復したようだ。動作停止時間はちょうど1時間だった。
Update 2: また落ちてしまった(中央ヨーロッパ標準時4:45 PM)。深刻な技術的問題が発生していると思われる。
Update 3: アクセスできたりできなかったりだったが、ようやく安定したようだ(中央ヨーロッパ標準時 4:52 PM)。
メールを頂いたり、記事へのコメントを頂いたり、あるいはTwitterでメッセージを頂いてわかったのだが、LinkedInはここ1週間技術的問題への対応を続けているようだ。早急にLinkedInに問い合わせて、記事を更新したいと思う。
これまではサービスが非常に安定しており、LinkedInには珍しい事態だと言える。LinkedIn Blogなどでの公式発表はない(こちらは落ちていない)。Twitterでは今回のサービス障害について多くの発言が為されている。
Pingdomを見ると、以下のように書いてある。
LinkedInでは5:30 a.m.(米国東部標準時)より断続的に問題が発生している。発生しているエラーはHTTP 500エラー(internal server error)。米国東部標準時9:36 a.m.にサーバは停止し、再起動後もエラー(HTTP 500エラー)は継続している。本記事作成中、障害は55分に渡っている。
Update 4: 問題の原因はメッセージの処理が追いつかなかったことにあるようだ。具体的にはLinkedInのメッセージキューが溢れてしまったらしい。説明がLinkedIn Blogに掲載されている。
米国太平洋標準時の本日2:18amから4:08amに渡ってLinkedInを利用しようとしたほとんどの人々、および6:10amから7:43amの間に利用しようとしたすべての人々にサービスを提供することができませんでした。このようなことはあってはならないことで、利用者の皆様にご不便をおかけして大変申し訳なく感じております。投稿記事やメッセージについてはきちんと処理されておりますのでご安心ください。
障害の理由についても、ご説明申し上げます。LinkedInでは種々のサービス(Network Update Service、inMail等)間で非同期通信を実現するために「メッセージキュー」というものを利用しています。非同期通信を利用することにより、一部での負荷増大が他部分に影響を及ぼさないようにすることができます。本日早朝に発生した問題は、このメッセージキューに関わるもので、キューのバックアップを行わざるを得ない状況となってしまいました。
[原文へ]
(翻訳:Maeda, H)




