ビッグデータの描く未来
2011年11月29日 情報・コミュニケーション部 鈴木 隆弘
最近、大手ITベンダーやシンクタンクのレポートでビッグデータに関する記事を見かけることが多い。本稿ではビッグデータの定義、体系化、活用、未来について考えてみたい。
ビッグデータとは
そもそも、ビッグデータとは何であろうか。広義には、漠然とではあるが巨大かつ複雑なデータとして説明されたり、更にはその活用ビジネスまで含めて定義される。また、狭義には、膨大なデータ量を意味するVolume(量)、リアルタイムで高頻度にデータ取得することを意味するVelocity(速度)、多種多様なデータを意味するVariety(多様性)の3つのVの要件を同時に満たす概念として定義されることもある。ここでは、広義の概念に沿って論を進めたい。
ビッグデータの活用による成功事例としては、Google社による検索・広告サービスやAmazon社のECサイトでも利用されているレコメンドサービスがよく知られている。では、ビッグデータをどのように活用すれば、競争力を向上させることができるのであろうか。マネジメントや経営の分野の父と呼ばれるP.F.ドラッカーは、“整理して体系化しない限り、データは情報とならず、データのままである(*1)”と述べている。この考えに立てば、ビッグデータもデータのままでは有用なものとはいえず、体系化してはじめて、競争力の源泉となるということであろう。
ビッグデータの体系化
筆者は、ビッグデータの体系化は次の3つの方法で実現できるのではないかと考えている。
(1)ビッグデータの一元化
ビッグデータは、テキスト、画像、音声、センサー情報など“多種多様なデータ”から構成される。各データは独立して管理されることが多く、データを体系化することは極めて困難である。しかしながら、クラウド化によって各データをサーバーへ集約し、一元管理化することができるならば、ビッグデータがどのようなデータで構成されているかを容易に把握することができ、体系化が可能になる。
(2)ビッグデータのリアルタイム集計
ビッグデータは、“膨大な量のデータ”であり、かつ“リアルタイムという高頻度で取得されるデータ”であるため、データの収集・蓄積・分析にかかる処理時間は計り知れない。並列処理基盤(*2)を構築して、並列分散処理(データ処理の高速化)を行うことにより、データをリアルタイムで集計することが可能になる。
(3)ビッグデータのセマンティック化
ビッグデータは、単に集約・蓄積された状態では、知見を得ることができない。しかしながら、データマイニングやBIツール(*3)などを用いた分析を行うことで、データ間における関連性や相関関係などの意味を含めたデータにより知見が得られる。
このような体系化により、ビッグデータは重要な情報となり、我々に未知なる可能性を示唆するものになるだろう。
ビッグデータの描く未来
今後、世界規模で加速するビッグデータ活用の動きがもたらす経済規模はどの程度のものとなるのであろうか。マッキンゼーの調査部門であるマッキンゼー・グローバル・インスティテュートが作成した調査報告書(*4)では、ビッグデータが積極的に活用される有望な5分野として、USヘルスケア、製造業、US小売業、EU公共部門、個人位置情報を挙げている。本報告では、“製造業における最大50%の商品開発や組み立てコストの削減”や、“US小売業での60%超の営業利益率向上”などの効果が、ビッグデータにより創出されると予測されている。
また、先進的なビッグデータの活用事例としては、Google社が取り組んでいる「インフル・トレンド」や「アース・エンジン」などのプロジェクトが興味深い。インフル・トレンドとは、インフルエンザ関連のWeb検索の集計データを追跡し、一定の地域でインフルエンザがどの程度流行しているのかを推定するもので、複数の国や地域で感染症が流行するパンデミックの早期発見や予防対策が期待される。また、アース・エンジンとは、人工衛星による画像や分析を利用して、気候変動の主な原因の一つとなっている森林破壊を追跡するプロジェクトで、気候変動の原因分析や兆候把握に役に立つと考えられる。
ビッグデータの活用は、従来のパラダイムでは解決が困難であると思われていた問題に、ブレイクスルーをもたらしはじめている。ビッグデータの体系化を通じて、そう遠くない未来にビジネスのパラダイムシフトが実現されることを期待したい。
- *1テキスト「明日を支配するもの~21世紀のマネジメント革命~」
(ダイヤモンド社、P.F.Drucker[原著]、上田惇生[翻訳]、1999年) - *2並列処理基盤とは、一般に並列分散コンピューティング技術およびその 基盤等をいうが、ここではGoogle社が並列分散処理を行うために自社開 発したMapReduce/Google File Systemといった大規模データ処理を行う ソフトウェアを指す。
- *3BIツールとは、企業が蓄積したデータを収集・蓄積・分析して経営判断 に役立てるBusiness Intelligenceを行うためのツールを指す。
- *4Big data: The next frontier for innovation,competition, and productivity(McKinsey & Company、May 2011)


