-4分類に応じた方法論を-
ITが生んだ情報洪水と「さがす技術」の進化
- *本稿は、2007年11月1日付のフジサンケイビジネスアイの「シンクタンクi」に掲載された記事を、同編集部の了承を受けて掲載しております。
みずほ情報総研 コンサルティング部 シニアマネジャー 吉川 日出行
IT(情報技術)化の進展に伴い、大量のデジタルデータが整理・分類されないままに蓄積され続けた結果、どこの企業も「情報洪水」に見舞われている。情報洪水におぼれることなく、経営、マーケット戦略に欠かせない情報収集・分析力を強化するためには、「情報をさがす技術」の精度を高めることが重要だ。一方、「さがす技術」の方も多様化・進化を遂げている。そこで、「さがす」行為について考察したうえで、最新の「さがす技術」の現状を分析、理想的な使い方を提言したい。
<ポイント>
- IT(情報技術)化の進展は、大量のデジタルデータが整理・分類されぬまま蓄積される「情報洪水」をもたらした。そこで、「情報をさがす技術」に対する関心が急速に高まっている
- さがす行為は「わき目もふらず一直線にさがす」「試行錯誤しながらさがす」「順に見て回る」「ブラブラとながめる」に分類される。各特性に応じた技術・方法論が求められる
- 「さがす技術」も多様化・進化を遂げている。汎用性の高い「検索エンジン」を軸に据えつつ、弱い部分を他のツールによって補完する取り組みが必要である
整理・分類されずに蓄積
近年、「検索」への関心が高まっている。検索に関する新製品・新サービスの発表が日々報じられているほか、経済産業省も2006年に「情報大航海プロジェクト・コンソーシアム」を立ち上げ、情報検索・解析等に関する技術研究開発の促進に取り組んでいる。書店に足を運べば、検索エンジンで有名な Google(グーグル)のサービスやビジネスモデルを紹介した書籍を簡単に目にすることができる。
「検索」に関心が高まっている背景として、IT化の進展がもたらした「情報洪水」が上げられる。米IDCの調査によると、全世界のデジタルデータは03年の5EB(用語解説参照)から06年には161EBまで増加し、10年には988EBに達すると見込まれている。企業内の情報も例外ではない。米ザインフォプロ社によると、米国で「フォーチュン1000」に名を連ねる企業の平均的なデジタルデータ保有量は、過去3年間で190TBから1PBへと約5倍に拡大したとされる。
増加したデジタルデータは、当然、再利用されるべきである。しかし、かつては十分に整理・分類され、保管・再利用されていた情報も、デジタルデータの爆発的増加に伴い一覧性・アクセス性が損なわれつつある。企業等の組織内で作られた情報の大半は二度と使われることなく捨てられている-このような統計さえある。
そこで注目を集めているのが、「情報をさがす技術」である。整理・分類という工程を経ることなく蓄積されている情報の山から、求める情報をさがし出し活用する。さらに、有益な情報を相互に関連づけ、そこに新しい知見や分析を加えることができれば、ビジネスの発展や技術の進歩にとって強力な武器となるであろう。
検索エンジンを軸に
情報を「さがす技術」の最たるものが、検索エンジンである。Yahoo!(ヤフー)やGoogleなどの検索サイト、通販サイトにおける商品検索、各種ソフトウエアに組み込まれた検索機能などの背後には、いずれも検索エンジンが存在している。テレビCM等でも見かけるように、検索窓に任意の語句を入力してボタンを押すという行為は、すでに日常生活で一般的なものとなっている。
しかし、検索エンジンがあればそれで十分なのだろうか。「どこかにあるはずなのに」「さがしてばかりいるような気がする」--検索窓と格闘しながら、このような不満を解消しきれずにいる人も多いのではなかろうか。米IDCが05年に行った調査では、企業内の情報労働者は1週間に平均9.5時間を検索に費やしているが、そのうち3.5時間は「さがしたけれども見つからなかった」無駄な時間だとしている。「さがす」行為は、単純に見えて意外と奥が深く、一筋縄ではいかないのである。
当社では、さまざまな企業へのコンサルティングやアンケート調査を通じて、ビジネスシーンにおける「さがす」行為が、その目的や方法の明確さによって4種類に分類可能であると考えている。
- (1)既知情報検索/再入手
「さがす」行為の目的や対象を明確にイメージでき、その答えが確実に存在することを意識しながら、対象に向かって一直線に検索するシーン。例えば「旅費規程を捜す」場合など、目的となる情報の目星がついており、さがす方法がある程度明確になっているケースが多い。 - (2)探求検索
「さがす」目的は明確なのだが、どこからどうやって探せばよいかが分かっていないシーン。「新しいビジネスを探す」場合などが該当し、「人に聞く」「思いつく限りのキーワードを検索エンジンに入力する」など手がかりを探すことから着手するが、目的が明確なため答えに出合った瞬間にそれがゴールだと分かるケースも多い。 - (3)巡回/捜索
情報の入手方法は漠然と分かっているものの、目的があいまいなシーン。例えば「ライバル企業の最近の動向を探る」場合などが該当し、プレスリリースや新聞記事などの1次情報を入手するがそれらはゴールではなく、1次情報を組み合わせることにより仮説を立てるという手順を踏むことが多い。 - (4)散策
目的・方法ともにあいまいなシーン。例えば、「自分の好みにあった音楽を探す」場合が該当する。ゴールは主観的・刹那(せつな)的であり、実際に答えがあるのか否か本人にも分からないことが多いが、探しているうちに自分が欲しがっているもののイメージが明確になり、(1)や(2)に移るケースもある
図1 「さがす」行為の4分類

ビジネスシーンにおける「さがす」行為には、4種類がそれぞれ一定のボリュームで混在しているようだ。当社が行った調査では、「わき目もふらずさがす」「試行錯誤しながらさがす」「とりあえず順に見て回る」が3割前後で並び、15%程度が「ブラブラとながめる」という結果が得られている。
図2 4つの検索シーンの割合

出典:みずほ情報総研「ビジネスシーンにおける情報探索行動に関するアンケート調査 2007.4」
多様化・進化を遂げる
「さがす」行為の性質によって、それを支える技術・方法論も多様である。検索エンジンが代表的なポジションを獲得しているのは、それが4種類のいずれにおいても相応の効果を発揮しているからであろう。しかし、検索エンジンも日々進化を遂げているほか、「さがす」シーンによっては検索エンジンよりも優れた技術がある。多様化・進化を遂げている「さがす技術」の最前線を少しご紹介しよう。
「エンタープライズサーチ」
企業内には、受発注システム、経理システム、ナレッジマネジメントシステム、グループウェアなど数多くのシステムが構築されており、データの保存形式も多様化している。また、企業内システムは機密情報のかたまりであり、部外者はもとより同じ企業内であっても「見えても良い」情報は部署や職位によって異なってくる。
そこで、検索エンジンをベースとしつつも、各種システムの横断的な検索を実現するとともにアクセス権限を反映できる「エンタープライズサーチ・プラットフォーム(ESP)」を構築する動きが現れている。
「メニュー」
前述した検索シーンのうち(3)のような場合には、やみくもにではなく、一定のルールに基づいて体系的に調べたほうが効率的なことが多い。組織内に蓄えられた知識の多くには体系や順序があり、これに応じたメニューを整備し、それに沿ってアクセスをしたほうが理解は進みやすい。学習の目的が強い場合は、情報を上手に陳列することに力を注ぐべきである。
メニューの実現には、情報の整理・分類が必要だ。インターネットのような膨大な空間ですべての情報の整理・分類を行うことは不可能だが、組織の中であればボリュームを絞ることである程度実現可能だ。情報の種類によっては、コストをかけてでもメニューを整備すべきである。
「フォークソノミー」
従来、情報の整理は専門家や情報作成者によりトップダウン方式で行われることが多かった。しかし近年は、情報の利用者が分類を行うボトムアップ方式の「フォークソノミー」アプローチが注目されている。タクソノミー(Taxonomy=分類学)はあらかじめ分類体系や分類語を決めておく方法であり、これに対してフォークソノミー(Folksonomy=群衆による分類)はあるコンテンツに関係する分類語を都度付与してグループ化する方法である。具体的には、利用者が情報にタグを付け(タギング)、それらが集合知として分類を構成する方式をとる。
タギングはインターネット上のソーシャルブックマーク、あるいは「Flicker」や「ニコニコ動画」などで用いられている。膨大な情報から興味分野の記事や趣味嗜好に合致した写真・コンテンツを入手する際には、タギングやフォークソノミーが威力を発揮する。
メニューやフォークソノミーは本来、人手によっても可能な方法論であるが、ITを用いることで一段と効率的な実践が可能となっている。「知っている人に聞く」という古典的な方法論さえも、「人力検索(Q&Aコミュニケーション)」の登場で飛躍的に可能性を広げている。IT化の進展が「情報洪水」とともにもたらした「さがす技術」の進化にも目を向けるべきであろう。情報洪水社会においては、汎用性の高い「検索エンジン」を軸に据えつつ、弱い部分を他のツールによって補完する取り組みが重要である。
- *EB
情報量を示す単位で、Exabyte(エクサバイト)の略。エクサは10の18乗(100京)。1EBは1024PB(ペタ=1000兆=バイト)、 104万8576TB(テラ=1兆=バイト)、10億7374万1824GB(ギガ=10億=バイト)になる。
お問い合わせ
担当:広報室
電話:03-5281-7548


