新春特別企画

人工知能技術のこれまでとこれから

この記事を読むのに必要な時間:およそ 3 分

自然言語処理の世界

自然言語処理(以下,言語処理)とは,英語や日本語などの人間が話す言葉を機械に処理させる技術の総称です。有名な例では,機械翻訳などがこの分野のタスクです。

言語処理でここ数年で大きな話題になった成果が,IBMのワトソンプロジェクトでしょう。アメリカの有名なクイズ番組に自動回答するコンピュータのシステムが出演し,人間のチャンピオンに見事勝利しました。この研究は,質問応答と呼ばれ言語処理の中でも有名な研究分野の1つを応用したものです。質問応答というのは自然文で出された質問に対して回答するタスクです。単なる検索とは違い,質問が何を意図しているのか推定したり,回答を正しく構築する必要があります。この技術は,医療の自動診断などへの応用に向けて製品化を進めていると報道されています。

代わって国内で今注目されているのが,国立情報学研究所の行っている「ロボットは東大に入れるか」プロジェクト(以下,東ロボ)です。2021年度までに東京大学入試を突破することを目標にしています。クイズに答えられるのだから,大学入試はその延長で突破できるのではないか? そのように考えられがちですが,そう簡単にはいきません。まず,問題の質が多様です。クイズの場合,回答は単語でした。入試の場合,回答は単語に限らず,数値や文だったりします。問われる能力も知識のみならず,論理展開や文書構成力などが必要です。それ以上に,一般常識が備わっていないと,問題文も読めない可能性があります。例えば,⁠お釣りはいくらでしょう」という問題を解くには,⁠モノを買ったときに渡したお金との差分が支払われる」という常識を知っている必要があります。これを数式で表現して初めて問題に取り組めます。こうした常識は曖昧な上に膨大であり,単に複雑な計算ができるだけでは回答できません。一方で,人工知能が人間社会で活躍するためには必要な機能であることもまた事実でしょう。

このような知能に直接関わりそうな研究プロジェクトが次々に行われていることは,注目に値します。ワトソンが良い成果を上げたことが研究者を触発した面はあるのではないかと考えています。ワトソンプロジェクトの開始当初,研究員たちは成功に対して懐疑的であったそうです2。筆者も難しいだろうと思っていました。消極的だと思われるかもしれませんが,何年も自然言語を扱っていると,人間の言葉に対する能力があまりにも高く愕然とすることが多いです。商業的に成功している言語処理の技術の大半は,直接的に人間と比較するのではなく,大量の情報をさばいたり高速に処理するなど,機械に得意な面をうまく活かすことで価値を出しています。検索エンジンの価値が,高度な言語処理よりも,大量の文書から高速に情報を引き出せる部分にあることに注目してください。東ロボはより知識,論理,常識といった知能に近い能力を必要とするタスクです。このプロジェクトが成功するのであれば,人工知能研究に一層の弾みになるのは間違いないでしょう。

言語処理においても,知能的なプロジェクトで次の成功を収めるのに,深層学習が鍵を握っている可能性は高いです。実は,現状では深層学習の技術は,言語処理の世界ではそこまで大きな成果は現れていません。筆者が特に注目するのは,常識や論理といった,今まで扱いに困っていた⁠もやっとした⁠領域にこの技術が使われるのではないかということです。これらの領域は,どのように知識を表現して処理すればいいのかが根本的によくわかりません。そのため,深層学習の高い表現力が,ピッタリと適合するのではないかと考えています。

※2
スティーヴン・ベイカー(著), 土屋政雄(翻訳), 金山博, 武田浩一(解説). IBM 奇跡の⁠ワトソン⁠プロジェクト: 人工知能はクイズ王の夢をみる. 早川書房.

終わりに

一口に「知能」といっても,知能によって実現する機能は多岐にわたります。筆者は「弱いAI」の立場なので偏った見方かもしれませんが,汎用的な「強いAI」の出現の前に,専門特化型の「知能」によって狭い範囲の仕事が効率的に解かれる可能性が高いです。狭い領域で知性的な処理を自動化することによって成功してきた分野はすでにたくさんあります。Googleは広告の自動配信に,Amazonは製品の自動推薦に,それぞれ人工知能の一分野である機械学習を適用して多大な利益を上げてきました。ですから,商業的な意味で人工知能を実現するのであれば,知性的な判断が必要な領域・アプリケーションを見定め,その範囲で必要な技術に研究開発を集中させるのが近道だと考えています。Googleの地図データを利用した自動運転車,Facebookの自社サービス内の写真の解析,IBMの音声による自動応答技術。一口に人工知能応用といっても,各社が既存ビジネスと知性との高い親和性のある領域に的を絞っているように感じます。

この中で深層学習の技術は強力な1つの武器となるでしょう。すでにいくつかのタスクで明らかになってきたとおり,従来難しいと思われていたタスクに対しても劇的な性能改善が見られました。今まで精度面で不可能だと思われていたタスクは,深層学習を応用することで解決できないか,再検証する必要があるでしょう。その先には,今まで不可能と思われていた知的なアプリケーションの出現が待っているかもしれません。

昨年1年だけでも大量の新しい発見と,様々な成果が報告されました。2015年,今年も沢山の発明が生まれることになるでしょう。

著者プロフィール

海野裕也(うんのゆうや)

(株)Preferred Infrastructure 知的情報処理事業部

2008年,東京大学大学院修士課程修了。同年,日本アイ・ビー・エム(株)入社,東京基礎研究所配属。2011年,(株)Preferred Infrastructure入社。自然言語処理や機械学習の研究開発,OSSの機械学習エンジンJubatusの開発に従事。2014年から自然言語処理研究者の若手で作る,NLP若手の会の共同委員長。

Twitter:@unnonouno