ページの先頭です

技術動向レポート

人工知能の応用へ向けた筋道を探る(1/2)

サイエンスソリューション部 シニアマネジャー 稲垣 祐一郎

人工知能に対する研究開発が活発化し、音声認識や画像認識をはじめとしていくつかの実用化事例も散見される様になっている。しかし、現状で実用化されている範囲は、人工知能の最終的な形態(=人間と同程度以上の知能)のうちの一部分である。本論では、人工知能の現状において何が達成されていて何が未達成なのか、未達成の部分を実現するためにクリアすべき課題は何かについて整理するとともに、今後それらの課題が解決され実用化されていく筋道について、試論を提出する。

はじめに

人工知能の研究開発に対する投資が世界的に加速している。Google、Microsoft、FacebookなどのIT企業はもとより、トヨタ自動車の米国での研究センターの設立1など、大きな注目を集めている。日本政府による「日本再興戦略」においても、IoT、ビッグデータと並び人工知能による今後の産業構造の変革に対応していくとしている2

この様な人工知能の盛り上がりは、技術的な面においては、機械学習(1)の分野で深層学習(deep learning)と呼ばれる大きなブレークスルーがあったことに起因している3。深層学習は、従来からも技術的には存在したニューラルネットワークと呼ばれる手法の一種であるが、従来よりも格段に複雑な構造を学習可能としたことにより、高度に抽象化した概念を表現できる様になった。これにより、音声認識、画像処理、機械翻訳などの機械学習の応用分野の様々なベンチマークの記録を次々に塗り替え、人工知能実現のための中核的な技術と目される様になった4

「人工知能」という単語から普通イメージされるのは、「2001年宇宙の旅」におけるHAL、「ターミネーター」におけるスカイネットの様な人間の知能に匹敵もしくは凌駕する様な知能であるかもしれない。このような人間レベルの汎用的な人工知能は「汎用人工知能(ArtificialGeneral Intelligence、AGI)」5と呼ばれるが、当然のことながら現在そのレベルに達している訳ではない。では、現状の人工知能のレベルはどの程度で、ビジネス的な応用はどの程度考えられるのか? AGIに至るまでにどのような技術的ハードルがあるのか?それらのハードルを越えるとどの様なビジネスが生じるか?これらの疑問に答えるヒントを提示したいというのが本論の目的である。

もちろんこの様な未来予測の試みは相当程度の不確実性を伴わざるを得ないが、実現したい技術的目標としてAGIを設定し、その目標を実現するために解決すべき課題をリストアップし、主要な課題の解決がどの様な手順、時間でなされるかを分析することにより、現在から目標までの見通しに関する仮説を得ることができる。

以下1節では、深層学習により何が可能になったのかに関する簡単な説明と、今後何が可能となっていくのかについてまとめる。2節において、AGIの実現のために要求される機能のリストアップを行い、取り扱うデータの種類を評価軸としたマップ上で各々の機能を整理する。3節では、上記マップ上の各象限が技術のどの様な発展段階にあるかについてイノベーション理論における概念を援用しながら整理するとともに、それぞれの課題が解決した段階でどの様なビジネスシーンで実用化可能となるか、その対応表を整理する。最後に4節では、その他の主要な技術的課題などについて述べる。

1. 深層学習の現状

深層学習とは、ニューラルネットワークと呼ばれる、脳を模擬した機械学習の手法の一つである。脳による情報処理は、神経細胞が互いに接続し、電気刺激をやり取りすることで行われている。ニューラルネットワークはこの神経細胞の機能をモデル化した演算ユニットをネットワーク状に接続したものである。深層学習が可能となる前のニューラルネットワークは、通常ネットワーク構成が入力層、隠れ層、出力層の3層で構成されるという単純なものであった。学習とは、外部世界のモデルを内部の表現に変換することと言えるが、3層の構成しか使えないということは、入力→1回の変換→出力という構成しか使えないということを意味する。これに対し、深層学習では、この層を多数積み重ねても学習が可能になった(2)。これにより、入力→変換→変換→...→出力という多段の変換を積み重ね、特徴抽出、カテゴリー分け、抽象化などの機能を個々の変換として分散して学習させることが出来るようになった。また、後述する様に、多段の構造だけではなく、ループを含む様な構造においても効率的な学習が可能となった。ネットワークの構造と、ある構造上でどのような種類の情報処理が実現可能かについては相互に密接に関係しているため、様々な構造のネットワークで学習が可能になったことは、様々な種類の情報処理が可能になったことを意味する。

従って、現在の人工知能研究では、様々なネットワーク構造が提案され、その上で所望の情報処理が実現されるかを試すことのできる状況となっている。以下の議論の見通しを良くするため、ここでネットワークの構造(及びその上で可能となる情報処理)に関して類型化を試みたい。類型化のための一つ目の軸は、浅い構造(層が少ない)か深い構造(層が多い)かの軸であり、従来のニューラルネットワークと深層学習を区別する軸である。もう一つの分類軸は、ネットワークの構造に、ループを含むか含まないかという軸である。ループを含むネットワークでは、データ処理の流れが一方向に進むだけではなく、一度処理されたデータが元の入力に戻され、時間的に後から来るデータと合わさって再び情報処理に供されるということを意味しており、時系列データや文章など時間的順序を含むデータを取り扱うこととなる。この様なループを含むネットワーク構造は、再帰的な処理を可能にするという意味でRecurrent Neural Network(RNN)と呼ばれている。

以上の2軸でネットワーク構造を整理すると下表の様になる。非RNNで、層の浅い(3層)のネットワークは従来のニューラルネットワークである(表の左上)。非RNNで層が深いものが、静的なデータを取り扱う深層学習である(表の右上)。RNNで、層が浅く比較的単純な構造を持つものは(表の左下)、時系列データから、動的なパターンを抽出することを可能にする。具体的には、システムの挙動から異常のパターンを検出する場合などに使用可能である。最後に、RNNで層が深いものは(表の右下)、時系列データから抽出された概念が更に相互作用をする様な場合であり、自然言語処理などが代表的な適用分野となる。

図表1 ネットワークの構造の類型と、可能となる情報処理、代表的適用分野
図表1

2. AGI 実現に必要な機能と深層学習の対応

前節で、深層学習によって可能となったアーキテクチャと情報処理の類型化を行った。これは技術的側面から深層学習の適用先を整理したものである。本節では、逆に技術に対して要求されることという側面から、人間レベルの認知にはどの様な機能が必要とされるのかについて簡単に整理する。

人間の知能にどの様な機能が含まれ、個々の機能がどの様な関係性を持っているかという問題に関しては、子供の認知発達の過程などを参考にしつつモデルを構成して研究する立場がある。そのモデルのことを認知アーキテクチャと言い(3)、多くの種類のものが提案されている。例えば、その一つCogPrime6では、乳幼児から成人までの発達段階に対応した認知機能に対する要求レベルがまとめられている。CogPrimeの中で言及されている認知機能の中で主要なものとして、知覚、記憶、言語、推論、計画、自己認識などがある。このうち静的な知覚については、前節の整理で言えば【非RNN×深い】に対応する部分であり、静止画像処理の場合など既に深層学習が人間と同等の認識率を達成しているため、大きな技術的課題は残っていないと思われる。

その他の認知機能、すなわち記憶、自然言語、推論、計画、自己認識等は、全てRNNによる時間的順序を持ったデータに対する再帰的な処理で無ければ実現しない機能である。記憶は、過去に得られた情報を格納し、必要に応じて情報を取り出す機能であり、時間を前提として成立する機能である。自然言語は、一次元的な表現が時間軸上に展開されるものであり、またいくつかの概念が相互作用を行って文意が展開するものであるから、【RNN×深い】に属する構造を必要とする。推論、計画なども自然言語と同様である。自己認識も、再帰的な構造をもって初めて実現可能なものである。

この様に、AGIを実現するための認知機能は、浅いか深いかはともかくとして、そのほとんどが、RNNを必要とするものであることが理解される。

3. 人工知能の実現時期―専門家による予測―

それでは、RNNの構造とその上での情報処理の原理が解明され、AGIが実現するのはいつ頃になるのか、という問いが当然生じる。AGIの実現時期に関する最も有名な予測は、レイ・カーツワイルによる2045年に人工知能のレベルが人間を越える技術的特異点(シンギュラリティ)が到来するという予測であろう7。カーツワイルの予測は現在あまりに有名であり、ここでは立ち入らない。

他に、AGIの国際会議で専門家にアンケートを取った結果がある(図表2)8。このアンケートでは、チューリングテスト(4)、小学校3年生レベル、ノーベル賞級の研究が可能な程度の知能、人間を超越した知能の4段階に分けて、その実現時期の予想を専門家に聞いているものである。2020年代までに実現すると予想している専門家も3分の1から半分程度居る中、2100年以降あるいは決して実現しないという専門家も少なからず居ることが分かる(5)

図表2 専門家アンケートによるAGI 実現時期予想
図表1

  • 本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。
  • レポートに掲載されているあらゆる内容の無断転載・複製を禁じます。全ての内容は日本の著作権法及び国際条約により保護されています。
ページの先頭へ