もう「ビッグデータ」はやめよう

次の記事

ドローンネットは「物体のインターネット」

新年にあたり、健康的なものを食べ、人に優しくし、もっと運動することを誓うとともに、もう一つ加えたい項目がある。「ビッグデータ」という用語を、ピボットやクラウドその他意味のない流行語と共に追放しようではないか。

実はしごく正直に言えば・・・私は記事の中で最もこの用語を乱用してきた一人だ。ここここここでも。最近あらゆる企業向けスタートアップが「ビッグデータ」を扱っているように見える。「ビッグデータ」のスタートアップに特化したベンチャーファンドまである。

なぜ私は「ビッグデータ」という言葉を嫌うようになったのか。それは、この用語自体が時代遅れで、あまりにも一般的単語の組み合わせであるために、実際今データに起きていることを反映していないからだ。今や重要なのはビッグデータではなく、データを使って何が出来るかだ。重要なのは保存されているデータの上に重ねられたアプリであり、そのアプリが提供する洞察である。そしてこの単語に飽き飽きしているのは私だけではない。同じように感じている投資家やデータ専門家や起業家と何人も会った。

Vincent McBurneyによると、「ビッグデータ」の起源は、ペンシルバニア大学のFrancis Dieboldが、2000年7月に財務モデルに関連してこの用語を使ったのが最初だ。もう10年以上前のことだ。一方こうした膨大なデータセットの使い方もこれを使ってできることも、それ以来大きく変わっている。

そしてビッグデータは、大企業に限らない。実際にはあらゆる会社、消費者向けサービスの巨人であるFacebookやTwitterから急成長中の大企業向けスタートアップのCloudera、Box、Okta、およびGood Dataも、この単語の定義からすればビッグデータ会社だ。一定の固定ユーザーを持つあらゆるテクノロジー企業が大量のデータを収集しており、それが「ビッグデータ」だ。製品に関する殆どのイノベーションでデータが鍵となる世界で、「ビッグデータ」スタートアップでいることは、さほどユニークでもなく、実際のところ何ら会社の説明になっていない。

IBMによると、ビッグデータは、次の4つの要素に分けられる。データ量、速度、多様性、および正確性だ。今日、ソーシャルネットワークやEコマース、さらには企業のデータストレージの世界でも、これらの要素は実に数多い分野にわたって関わってくる。大規模なデータセットは当たり前だ。こうした膨大な量のデータを扱う方法がこれだけ多様になってくると、ビッグデータには大して意味がない。

これは巨大なデータを整理、分析、分類する上での革新を軽視しているのではない。むしろ、Eコマースや広告を含め多くの業界の未来は、こうしたデータの有効利用にかかっている。GoodData、Infochimps、Cloudera、Moatその他多くのスタートアップは、これらのデータを活用するための説得力ある方法を模索している。

もう一点指摘しておくべき事実は、IBMや大型小売業、大手金融サービス等、大企業を相手にしている会社の多くは、この用語が提唱されるずっと以前から、膨大な量のデータを扱ってきていることだ。今は扱っているデータの種類が異なっているのと、オンサイトのデータセンター経由でこうしたデータ分析システムを使う必要がないというだけの話だ。

というわけで、大量のデータを取扱うスタートアップを説明する別の表現を考えてみよう。おそらく重要なのは、アプリがデータに対して行う機能そのものだ。新年でもあることだし、「命名されるべきでなかった用語」を回避するアイディアを引き出すには良い時期だ。

[原文へ]

(翻訳:Nob Takahashi)