ページの先頭です

AIは人の「創造」の翼を広げるか

2017年11月21日 情報通信研究部 橋本 大樹

AIは、絵を描くことはできるだろうか。詩を詠み、曲を書き、小説を綴ることはできるだろうか。

近年、AIはさまざまな分野で注目を集めている。いまやAIは将棋やチェスのチャンピオンに勝利する。DeepMind社が開発した囲碁AIである「AlphaGo」(*1)が、世界最強とされる中国の囲碁棋士に3連勝したニュースは記憶に新しい。スマートフォンの中に入ったAIは人の話す言葉を理解し、使用者の顔を見分けることができる。画像上に写っているものが例えば犬なのか猫なのかを判断する画像物体認識の性能も上がり続け、人の認識結果を上回る性能が得られることもあるという。

このようにコンピュータに判断・認識させる技術の発達と同時に、コンピュータに新しいものを生成させる、「創造」の分野においても大きな進化を遂げている。AIによる「創造」分野の技術として、最近注目を集めている手法の1つが、2014年にイアン・グッドフェロー(Ian Goodfellow)氏らによって発表された敵対的生成ネットワーク(Generative Adversarial Networks, 以降「GAN」と記述)である(*2)。

GANの構造と性能

GANは、AIの発展を支える技術の1つであるディープラーニングを応用した手法である。GANは「生成」と「評価」の2つの機能をもち、それぞれの機能は生物の神経回路網を模倣したニューラルネットワークによって実現されている。

1つ目の機能である「生成」は、ランダムな値を入力として、訓練データに似た新しいデータを生成する。例えば人の顔写真を訓練データとして学習をさせると、訓練データを模した人の顔写真風の画像を生成することができる。

もう1つの機能である「評価」は、与えられたデータが本物のデータとどれだけ類似しているか評価を行う。先ほどと同様に人の顔写真を対象とした場合を考えると、与えられた画像がどれだけ人の顔写真らしいかを評価することができる。

GANでは、この2つのニューラルネットワークを交互に学習させる。すなわち生成機能をもつニューラルネットワークは評価機能で高い評価を得られるようにデータの生成方法に関して学習を行い、評価機能をもつニューラルネットワークは生成機能で生成された偽物のデータと本物のデータを見分けられるように学習を行う。学習が進むと、どちらの機能の精度も上がっていく。GANの名称を構成する「敵対的(Adversarial)」という単語の由来は、この2つの機能が互いに競い合う構造によるものである。

GANは一般的に学習の調節が困難である一方で、生成されるデータの質が高い傾向にある。筆者も、このGANを検証するにあたって、その生成されるデータの質の高さに非常に驚かされた。インターネットの画像検索等で、「Generative Adversarial Networks」をキーワードとして検索し、作成された人の顔写真の合成画像等の実例を確認してみてほしい。

GANの生成機能の応用

多くの研究者が、GANのデータ生成機能に着目して、画像や動画、文章、音楽等のさまざまなデータに応用する研究を行っている。

当初発表されたGANの生成機能は、ランダムな値を入力としてランダムにデータを生成するものであった。現在では、入力と出力との関係に条件を加え、入力にふさわしい出力データを自動生成する研究も行われている。例えば、一部分を塗りつぶした画像から塗りつぶした部分を補完する「画像補完」や、低解像度画像(粗い画像)から高解像度画像(きめ細かい画像)を推定する「超解像」に応用する研究が行われている。また、コードと直前の小節のメロディから、次の小節のメロディを生成するといった自動作曲の研究もある。

より工業分野に近い例では、新薬の発見にGANを利用する研究も行われている。2017年9月にも、GANを応用して抗がん(anti-cancer)作用を持つ分子構造を発見する手法がInSilico Medicine, Inc.から発表された(*3)。

新薬創造においては数百万以上といわれる莫大な種類の化合物の中から、各疾患に適した構造を発見する必要がある。従来は、既存の化合物を総当りで試して効果を確認する方法や、疾患関連のたんぱく質構造を研究し、試行錯誤を繰り返しながらその機能を阻害する化合物を設計する方法によって、新薬の成分となる化合物の探索が行われてきた。より効率よく、より多くの種類の新薬を開発するために、候補となる化合物を発見する新しい方法として、GANを含むAIを用いた探索の研究が進められている。

AIによる人の創造性の拡張

GANをはじめとするAIの発展により「創造」の分野においてコンピュータの担う役割は大きくなりつつある。現在のAIの生成技術はあくまで学習させた訓練データをもとに類似のデータを作成する技術であり、ゼロから新しいものを生み出すことはできない。例えば、ゴッホの絵を学習することで、ゴッホ風の絵を描くことはできるが、ゴッホの絵を学習させずに、あの作風を生み出すことは難しい。しかし、AIにより生成されたデータは、認識していなかった新たな気付きを人に与え、人の創造の幅を広げるきっかけにはなりうる。AIによる生成技術は、人の創造を支援する強力なツールとなって、人の創造をもう一段上の領域へと連れて行ってくれる可能性を秘めている。

  1. *1https://deepmind.com/research/alphago/
  2. *2I. J. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville , Y. Bengio, “Generative Adversarial Networks,” arXiv:1406.2661, 2014.
  3. *3A. Kadurin, S. Nikolenko, K. Khrabrov, A. Aliper , A. Zhavoronkov, “druGAN: An Advanced Generative Adversarial Autoencoder Model for de Novo Generation of New Molecules with Desired Molecular Properties in Silico,” Mol. Pharmaceutics, 14 (9), pp 3098?3104, 2017.
ページの先頭へ