データ圧縮

マイクロソフトがクラウド用データ圧縮アルゴリズムとハードウェアをオープンソース化

次の記事

全米一と評価されるアクセラレーターに参加の最新スタートアップ19社

現在、大手のクラウドコンピューティングのプロバイダが保管しているデータ量は驚愕すべきレベルに達している。そのため、ほとんどの場合、情報はなんらかの方法によって圧縮された状態で保存されているはずだ。それはフロッピーやCD-ROM、低速通信の時代に、ユーザー自身がファイルをzip圧縮していたのと同じようなもの。通常、そのようなシステムは、厳重に秘密のベールで守られている。しかし米国時間3月14日、Microsoft(マイクロソフト)はAzureクラウドで実際に使われている圧縮アルゴリズム、ハードウェア仕様、そしてその回路図を記述するVerilogのソースコードをオープンソース化した。それらすべてをOpen Compute Project(OCP)に寄託したのだ。

Project ZiplineとMicrosoftが呼ぶこのプロジェクトでは、標準的なZlib-L4 64KBモデルと比較して、2倍もの高圧縮率を達成することができる。それを実現するため、Microsoftが実際にクラウド内で扱っている大きなデータセットの性質に合わせて、アルゴリズムと、そのハードウェア実装を念入りにチューンしてある。この仕組みは、システムレベルで動作するため、実質的なオーバーヘッドはない。Microsoftによれば、現在利用可能な他のアルゴリズムと比べても、実際に高いスループットと低いレイテンシを実現できているという。

Microsoftは、これらすべてを機能させるために必要な、レジスタ転送言語(RTL)用のVerilogソースコードも寄託している点を力説する。「これだけ詳細なレベルでRTLをオープンソースとしてOCPに寄託するのは、業界を先導するものです」と、Azureハードウェアインフラストラクチャのゼネラルマネージャ、Kushagra Vaid氏は述べる。「OCPのエコシステム内の新技術に関するスムーズなコラボレーションを推進し、シリコンレベルのハードウェア革新への扉を開く、新たな先例となるものです」。

Microsoftは現在、このシステムを自らのAzureクラウドで使用しているが、Open Compute Projectに参加する他社との提携も始めている。 そうしたパートナーとしては、Intel、AMD、Ampere、Arm、Marvell、SiFive、Broadcom、Fungible、Mellanox、NGD System、Pure Storage、Synopsys、それにCadenceが挙げられる。

「そのうちに、Project Ziplineの圧縮技術が、さまざまな市場セグメントに浸透するものと期待しています。ネットワークデータ処理、スマートSSD、アーカイブシステム、クラウドアプライアンス、汎用マイクロプロセッサ、IoT、エッジデバイスなど、幅広い用途が考えられます」と、Vaid氏は述べている。

画像クレジット:JLPH/Getty Images

原文へ

(翻訳:Fumihiko Shibata)