ページの先頭です

注目されるIoT、人工知能、ロボティクス、セキュリティ関連技術

デジタルテクノロジーの最新動向(1/5)

  • *本稿は、『みずほ産業調査』 Vol.57(みずほ銀行、2017年9月28日発行)に掲載されたものを、同社の承諾のもと掲載しております。

みずほ情報総研
経営・IT コンサルティング部
情報通信研究部

要約

  • センサやネットワーク性能向上、利用コストの低下、コンピューティング性能の大幅な向上を背景にモノ、ヒト、サービスを巻き込むIoTが進展している。人工知能(AI)の進展は、デジタル化に伴う膨大なデータからの付加価値を創出し、ロボティクスの進展は、デジタル化のリアルな社会への実装を加速させ、イノベーションの対象領域を拡大させている。また、昨今のデジタルテクノロジーの特徴として、あらゆる領域でのインテリジェント化と、サイバーとヒトやモノが実在するフィジカルとの融合深化が進展している。
  • IoT活用のためのICT基盤(IoT基盤)の技術開発が進展している。IoTの活用領域の広がりを受けて、IoTデバイスの増加に伴うネットワーク負荷の低減化やリアルタイム性を確保するためエッジコンピューティングを導入したIoT基盤のアーキテクチャが主流となりつつある。
  • サイバーとフィジカルとの接点となるスマートフォンや自動車など、様々なモノにカメラやマイクなどのセンサが実装され、対象や状況を同定・分類する画像認識技術や音声認識技術が実用化されている。ディープラーニングの登場により、認識精度が大きく向上し、適用範囲の広がりをみせている。また、サイバーとヒトのインタフェースとしてVR/ARを実現する端末が廉価で市場に登場するなど、製品開発の苛烈な競争が始まっている。また、現実環境と仮想世界をミックスさせるMRの実用化の技術開発も活発化している。
  • IoTの実装にはモノ、ヒト、サービスをつなぐ無線通信技術の進展が不可欠である。次世代通信技術として、高速化・大容量化を目指す5G通信の実用化が近づいている。また、IoTにおける通信利用のデバイスの数的な拡大を見据え、低容量ながら低価格・省電力による通信を実現するLPWA技術が進展しつつある。
  • インテリジェント化の中核技術であるAI分野では、画像処理等のパターン認識において実用化が進展するとともに、世界の最先端の研究は、サイバーとフィジカルをAIを媒介にして融合することを目指すアルゴリズム開発に向かっている。また、脳を模擬した計算デバイスや、さらには量子コンピューティングも近い将来の実用化が見込まれる。
  • 人の能力(運動、五感、思考)の拡張やロボット同士の協調動作といった次世代のロボット/ロボティクスの技術開発が進展しており、新しいサービスや価値の創出の可能性が広がっている。また、自動運転車・ドローンは、実現に向けた認知・判断・制御に関わる技術が活発化している。加えて、安全に利用するための技術にも注目が集まっている。
  • セキュリティ技術の重要性が認識されている分野にIoTとブロックチェーンがある。IoTでは、モノとモノ、モノとサービスがインターネットを介してつながり、得られたデータを収集、分析してモノやサービスを制御するため、モノから得られたデータが改ざんされていないかが重要となる。また、ブロックチェーンでは、仮想通貨の二重利用防止や取引情報などの改ざん検知等を満たすためにセキュリティ技術の重要性が認識されている。

1. デジタルイノベーション進展の鍵を握るテクノロジー

インターネットやスマートフォンの普及、センサやネットワーク性能の向上、利用コストの低下、クラウドコンピューティングの進展によるコンピューティング性能の大幅な向上等を背景にモノ、ヒト、サービスを巻き込むIoT(Internet of Things)が進展している。また、人工知能(AI: Artificial Intelligence)の進展は、デジタル化に伴う膨大なデータからの付加価値を創出し、ロボティクスの進展は、デジタル化のリアルな社会への実装を加速させ、イノベーションの対象領域を拡大させている。

これらを中心とするデジタルテクノロジーは、イノベーションを引き起こしているICT技術の組合せを指すもので、特定の技術を指すものではない1。しかしながら、デジタルイノベーションの事例を見れば、ここ数年で急速に進展、あるいは新たに登場したテクノロジーがイノベーション実現の鍵となっていることは間違いない。また、新たなビジネスモデルの創出がデジタルテクノロジーの需要を生み出す、イノベーションの相乗サイクルが形成されている。

昨今のデジタルテクノロジーの進展がもたらす変化として、下記の3点が注目される。1点目は、IoT関連技術の進展によるデジタル化の対象範囲の拡大である。IoT関連技術の進展は、ヒト、モノを広範に含む、これまでとは次元の異なるデジタル化を進展させている。また、デジタル化の対象範囲が拡大することで、膨大なビッグデータが生み出され、AI等を含めたデータの分析技術の進展がそれらのデータから新たな付加価値を創出している。2点目は、モノとして捉えられてきた機械等へのデジタルテクノロジーの実装である。ロボットや自動運転、ドローン等のロボティクス関連技術は、様々なサービスとの融合により、従来のメカトロニクスの進展を超えて進化しつつある。そして3点目は、セキュリティ関連技術の進展である。モノ、ヒト、サービスが繋がるデジタル化の進展においては、安全・安心の観点から、従来にも増してセキュリティの確保が不可欠となっている。そうした中で、ブロックチェーンは、セキュリティへの対処を提示すると同時にビジネス上のイノベーションを引き起こしている。

本章では、上記に概説したデジタル化による変化を牽引するデジタルテクノロジーとして注目されるIoT、AI、ロボティクス、セキュリティの4つのテクノロジーの関連技術を取り上げ、最新動向と今後の展望を概観する。

2. IoT関連技術

(1)IoT基盤

[1] IoT基盤の構成

IoT基盤は、モノ、ヒト、サービスを繋ぎ、新たな付加価値を生み出すためのICT基盤である。IoT基盤は、実空間との接点となるセンサやデバイス等の端末層、フィールドエリアからバックフォールまでのネットワーク層、ユーザにサービスを提供するアプリケーション層とその基盤となるプラットフォーム層から構成される。プラットフォーム層は、接続及びデバイス管理、セキュリティ管理の機能に加え、データ管理、データ分析機能から構成される2(図表1)。データ分析機能は、分析目的に応じた様々な分析機能から構成され、AIによる分析機能等も含まれる。

図表1 IoT基盤の階層と主な機能
図表1

(出所)IoT基盤提供企業等の資料をもとにみずほ情報総研作成

[2] IoT基盤のアーキテクチャ(エッジコンピューティング)

IoTの活用領域の広がりを受けて、IoT基盤のアーキテクチャに関する技術開発が進展している。比較的限られた範囲でのモニタリング等、取扱うデータ量が限定される場合や、迅速なレスポンスが求められない場合、シンプルにクラウド側にデータを集約し処理することが可能である。しかし、収集したデータを即時に処理し、機器のコントロールやリアルタイムな制御が必要な場合やネットワークに接続される端末の数や処理するデータが膨大な場合、クラウド側のサーバにデータを集約して一括処理する方法では、ネットワークトラフィックと処理速度の観点から問題が生じる可能性がある。こうした課題に対応するため、端末やIoTゲートウェイ等のエッジサーバで一部の処理を行う分散処理(エッジコンピューティング)とクラウドを組み合わせたアーキテクチャを持つIoT基盤が注目されている(図表2)。例えば、産業用ロボット大手メーカーのファナックは、エッジコンピューティング(Preferred Networkによる分散協調型の強化学習を導入)とクラウドを組み合わせた工場向けプラットフォーム「Field system」を公表しているほか、産業機器用IoT基盤で先行する米GEも、2016年にクラウドとエッジコンピューティングのアーキテクチャを持つ「Predix Edge System」3を発表している。エッジコンピューティングのアーキテクチャは、工場や産業機器制御の用途に限らない。自動運転分野では、ダイナミックマップ4を活用した自動運転支援を目指している。そこでは、詳細な地図や交通情報などのリアルタイム情報を、クラウドによる全体管理とエッジサーバによるローカル(地域)単位で管理するアーキテクチャ上に構築し、全体管理とリアルタイム性が必要な情報収集・提供を実現しようとしている。

エッジやフォグコンピューティングの優位性として、セキュリティ確保の観点も挙げられる。IoT活用の対象がバイタルデータ等のプライバシー情報を含む場合や機密情報を取り扱う場合に、漏洩機会を低減するために必要最低限のデータをクラウドに転送する方式は有効である。また、データを国境・地域を越えて転送した場合、セキュリティ保護に関する規制への対応が課題となる可能性もある。こうしたセキュリティの課題に対して、エッジやフォグコンピューティングの活用が有効に機能する可能性が高いと考えられる。

エッジコンピューティングとクラウドコンピューティングの組合せは、最近のIoT基盤のアーキテクチャの主流となりつつあり、定義や技術の標準化等5を通じてハードウェア・ソフトウェアの相互運用性等が高まることが期待される。エッジコンピューティングの実効性を高めるには、クラウドによる全体最適機能とエッジやエッジサーバによる部分最適機能の連携、及びエッジとクラウドの機能分担の最適化等が必要になる。そのため、IoT活用の目的に応じたエッジサーバの階層化や負荷変動に応じたリソースの動的最適化等、エッジコンピューティングの最適化を図るための技術が進展すると予想される。

図表2 IoT基盤のアーキテクチャ
図表2

(出所)IoT基盤提供企業等の資料をもとにみずほ情報総研作成

(2)認識関連技術

[1] 画像・音声データから対象や状況を同定、分類する画像・音声認識技術

近年、様々なモノに、GPS、加速度センサ、感圧センサ等のリアルな世界をデジタルデータとして取得するセンサが実装されている。特に、画像センサであるカメラや音声センサであるマイクは、スマートフォンや自動車等の我々に身近なモノに実装され、日々、大量の画像データ、音声データを取得している。これらを、人が直接、見て、聞くことで、楽しむ、理解するといった従来の使い方を超え、コンピュータによる人の判断や行動の支援あるいは代替に活用するためには、人手を介することなく、画像データ、音声データから対象や状況を同定、分類する画像認識技術、音声認識技術が必要となる。

[2] ディープラーニングの導入により人の認識率を超えた画像認識技術

画像認識技術は、画像データから、文字や顔等のオブジェクトを認識し検出するパターン認識技術であり、特定物体認識と一般物体認識の2つに大別される。特定物体認識は、顔等の特定のオブジェクトを検出する技術であり、一般物体認識は、対象を特定せずに、画像中のオブジェクトをカテゴリーに分類する技術で、より難易度が高い。これらの技術は、人が行っていた作業を自動化し、コンピュータが大量の画像を一定の精度で処理できるため、様々な分野で応用が進んでいる。

画像認識技術が、先行して応用が進められた領域の一つとしてファクトリーオートメーションが挙げられる。黎明期には、古典的なパターンマッチングから実利用が始まり、部品のピッキングや仕分け、欠陥検査等に利用され、産業用ロボットの目となった。しかし、パターンマッチング等、人が決定したルールでは、想定外の画像には対応できない6。また、検出対象や撮影条件が変わる度に、人がルールを変更・調整しなければならず、多大な工数がかかってしまう。

こうしたルールベースの限界を超えるのが、機械学習である。機械学習では、コンピュータが、大量の教師データ7を学習して検出ルールを求める。人が決めるのは学習アルゴリズムである。そのため、検出対象が変わっても学習アルゴリズムを変更・調整すれば済むため、ルールベースの場合と比較して、工数が削減でき、汎用性が高く、かつ精度も向上する場合が多い。さらに、画像認識を行いながら、教師データを収集し、継続的に性能を改善できるというメリットもある。2001年に、高速かつ高精度な顔認識を実現する機械学習アルゴリズムがViola-Jonesにより発表され、これがブレークスルーとなり、機械学習の導入が一気に進んだ。同時に、撮影条件の変動に強い画像特徴量の研究開発が活発に行われ、画像から特徴量を抽出し機械学習で認識するという手法が画像認識の主流となっていった。

次のブレークスルーとなったのが、ディープラーニングの登場である。それまでの機械学習では、画像特徴量の計算ルールは人が決定していた。つまり、画像特徴量の計算方法自体は、機械学習によるものではなくルールベースで与えられたものであった。ディープラーニングでは、画像特徴量についても、人手を介さずに計算ルールを決定するため、特徴量の計算から機械学習までの一連の処理全体が、データに合わせて最適化される。一般物体認識技術の国際的なコンペティションであるILSVRC8において、2012年にディープラーニングを用いた研究グループが圧勝し大きな注目を浴びた。その後も精度は向上し、現在では、人間の認識率を超える精度を達成している(図表3)。

既に、スマートフォンでは、これらの技術を応用した、カメラ撮影時に顔にオートフォーカスするための顔認識機能や、パスワードの代わりにロックを解除するための指紋認証機能が搭載されている。また、撮影した写真からリアルタイムで文字を認識するOCR9機能を持つアプリケーションも登場している。自動車では、車線を認識することで車線逸脱を警告する機能や、障害物や歩行者を検知して自動でブレーキをかける機能等も実用化されている。

今後も、画像認識技術は精度が向上し、適用範囲も広がっていくことが予想される。また、既に様々な分野で導入が始まっている三次元センサ(デプスセンサ)の普及や、取得できる波長の高解像度化、広帯域化をもたらすハイパースペクトルカメラ等の実用化により、人の目では捉えることができない、広い意味での新たな画像データを活用するための画像認識技術も発展していくことが期待される。

図表3 画像認識コンペティションILSVRCにおける認識精度の変遷
図表3

(出所)ILSVRCの資料をもとにみずほ情報総研作成

[3] 認識性能が向上しつつある音声認識技術

AmazonやGoogleが、人が対話形式で操作することができるAIスピーカーを発売し、注目を集めているが、これらのデバイスには音声認識技術が使われている。音声認識技術は、音声データから、発話内容や発話人数等を推定する技術である。ノイズ除去、話者分離(話者ごとの音声に分離する技術)、話者認識(個人認識)、発話内容認識、といった技術から構成される。画像認識同様、音声認識についても、人が考えたルールベースの認識から始まり、様々な統計処理手法が検討され、機械学習に置き換わってきた。

画像と音声で決定的に異なるのは、画像の場合、複数のオブジェクトが1つの画素に映りこむことがないのに対して、音声には様々なノイズや対象外の話者音声が混入するという点である。そのため、音声認識は、画像認識と比較すると、難易度が高くなることが多く、主にヘッドセットを利用し、ノイズの混入がない状況、かつ一定のテンポで、単語を区切って発話するようなケースから実利用が始まった。しかし、それもスマートフォンとディープラーニングの登場により変わりつつある。

スマートフォンに話しかけて命令する、あるいはテキスト化する行為は日常的な光景となりつつあるが、そうした音声には様々なノイズが混入している。このため、音声認識は失敗するケースが多々あるが、人が訂正した内容を教師データとして収集し、学習する仕組みを持つことで、認識性能は日々向上させることができる。今後は話者分離等にも適用されていくものと考えられ、画像認識と同様に、人に匹敵あるいは超越するような認識性能を示すことも期待される。

ページの先頭へ