Parascale
Hadoop

ParaScaleが夢のデータセンター:社内ネットワークストレージが1ギガ1ドル

次の記事

みなさん冷静になっていただきたい

Webアプリケーションは大量のデータストレージが必要だ。たとえばYouTubeにアップロードされたビデオは全体で500テラバイト以上のストレージを占めると推計されている。Googleのサーバは全体で毎時間1ペタバイトぐらいのデータを処理している。Googleは、今のWeb全体という巨大なスケールでデータを処理したり保存するために、独自のファイルシステムを作らざるをえなかった。しかしWebスケールのコンピューティングとふつうの昔ながらのストレージのニーズの両方が成長するに伴って、Googleのようなファイルシステムを使いたいと願う企業も多くなっている。

月曜日に、ParaScaleというスタートアップがGoogleの内製システムと似た方式で、品質は商用級というストレージソフトウェアの非公開ベータを始める(ParaScaleは今年のTechCrunch50に出そうだったが、今では隠密企業ではないという理由で出場を取り止めた)。それは、そこらの適当なLinuxサーバのクラスタの上で動くファイルシステムだ。

ユーザはサーバをいくつでも追加でき、それぞれのサーバが冗長ノードとして働く。全体としてのソフトはクラスタの上で動き、それを一つの巨大なファイルシステムとして扱う。そこでユーザ企業はファイアウォールの内部に自社自身をホストとする非公開ネットワークストレージを作れる。ParaScaleのCEO、Sajai Krishnanによると、サーバの費用にもよるが、ユーザ企業の期待費用は1ギガバイト当たり1ドル程度だ。

これと対照的にAmazonのS3のWebストレージサービスは、月額で1ギガバイト当たり15セントだ…送受信にかかわるネットワーク費用は別途で。約6か月でAmazon S3の費用のほうが高くなる。

ただしParaScaleの非公開ベータは誰もが使えるわけではなく、ベータテスターとして深刻なストレージニーズを抱える約20の企業に使ってもらう予定だ(アルファテスターは5社で、すでにソトフを18か月使いつづけている)。Krishnanが求めるベータテスター企業は:

…30テラバイトぐらいのストレージを使っていて、今後毎年10から20テラバイト増えるところ。それ以下のところなら、NetAppで十分だ。

ベータテスターになりたい企業は、ここに申し込む。最初の4テラバイトに関しては、ストレージ管理が無料だ。

ParaScaleを使ってもおかしくないWebアプリケーションは、ビデオのホスティング、Webをクロウル(crawl、這い回る)して巨大なログファイルを作るサイト、企業のばかでかくなりすぎたデータベース、などだ。Webアプリのサイトでなく一般企業ユーザは、ParaScaleを使ってS3と比肩するような自社独自のストレージネットワークサービスをセットアップするだろう。ネットワークストレージをホストするという部分では、ParaScaleはAmazonやRackSpaceと競合し、データセンター的な部分ではNetAppやEMCのようなストレージ機器のベンダと競合する。

アーキテクチャとしては、GoogleのMapReduceファイルシステムや、そのオープンソースバージョンであるHadoopに近い。しかしKrishnanはこの点を競争上不利とは見なしていない。彼曰く:

スタンフォードを出た連中がごろごろいるような、能力の高いエリート企業は、それはそれで結構。Googleの社員でも、並の技術者ならMapReduceの仕組みを理解するのに半年はかかるんだ。

ParaScaleなら、ParaScaleのソフトウェアが動いている何百台ものサーバノードを一人のITアドミニストレータが管理できる。ParaScaleは今年の5月に、$M11.4(1千140万ドル)をCharles River VenturesとMenlo VenturesからシリーズAで調達した。

[原文へ]
(翻訳:hiwa)