data scientist
bad data

ビッグデータ分析の現場実践本がやっと出た–O’ReillyのBad Data Handbook

次の記事

Groupon株、CEO離任発表後に時間外取引で12%上昇(ただし後に下落)

datacenter

ビッグデータはまだまだ難しくてよく分からない、と一般には受け取られているが、それも当然だ。その複雑さをシンプルに抽象化するやり方の例はいくつかあるが、しかしデータサイエンティストたちの話を聞いても、彼らですら、スプレッドシートに毛の生えた程度のものを見るだけのために、いまだにツールの勉強に苦労している、と言う。

フリーのデータサイエンティストMarck Vaismanが、あるインタビューで言っていたが、多くの人にとってビッグデータが難解なのは、技術の複雑さのせいだけではなく、人間の側の取り組み姿勢にもその原因がある。多くの場合、そのデータの使い方を理解している人は、ほんの少ししかいない。しかも、その人たちの説明能力は高くない。また、データ分析に総合的な視野から取り組んでいる企業はほとんどなく、複数の小さな断片的なプロジェクトがそこらに散乱していて、その方式に標準性がなく、互いに重複していたり、企業や部門にもたらす価値が何もなかったりする。

陥穽(落とし穴)は至るところにあり、重要な基本が忘れられている。Vaismanは最近O’ReilyからThe Bad Data Handbookと題する本を出版し、その中でビッグデータ分析の十戒ならぬ五戒を述べている。

この混乱の中で、ベンダたちは自分のプロダクトやサービスの速さや能力を自慢している。でも企業が本当に必要としているのは、目の前のデータ量と、分析結果がフィードされるアプリケーションの速さをマッチさせられるような、調整能力のある分析アプローチだ。データ分析のベストプラクティスを構築したAccentureの役員たちは、上のビデオと同じくStrataの会場で、短いインタビューに応じてくれた。

データは、戦略的な資産として活かす必要がある。Strataのようなカンファレンスにコンサルタントの姿が多いことは、まだかんじんの顧客企業側が、ビッグデータ分析ベンダたちの語る美辞麗句を、よく理解していないことを、物語っているようだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))