NTT R&Dではさまざまな研究が進められているが、東中竜一郎率いるチームでは、とある対話システムの研究が進められている。
「我々は日常会話ができる対話システムの研究をしています」(東中)
日常会話ができる対話システムとはなんだろうか。これまで日本のみならず世界各地でさまざまな対話システムが開発されてきた。しかしそれらは基本的に、自分に与えられた特定の仕事しかできないタスク指向型対話システムである。現在、コミュニケーションロボットとして普及しているものも、それはパターン化された対応を選択するだけのものである。そうではなく、対話システム自身がユーザの意図を解釈し、最適な対応を見出し、そしてそれを表現する。そうした日常会話という名の「対話」を可能にする対話システムが、東中らの研究対象である。
「日常会話は生活のすべてを前提にしますから、それに必要とされる知識量は圧倒的に膨大です。ユーザの感情や気持ちを推し量り、言っていることを理解した上で、最新の知識をもとに自分の発言を選択しなければなりません」
そんな対話システムを実現するために10人程のコアメンバーが活躍する東中のチームでは、ユーザの表情を読む、発話を理解する、話すための知識や知恵をつけさせるなど、さまざまな機能をメンバーが役割分担して研究にあたっている。
世間話を楽しむことのできる
対話システムを実現します
- #Iot/AI
- #機械読解
- #人間情報研究所
人間情報研究所
東中 竜一郎、小林 のぞみ、石井 亮、
大塚 淳史、光田 航
対話技術
昔も今も、SF映画やアニメ、マンガにさまざまな対話システムが登場する、
人間のパートナーとして会話する名キャラクターも数多い。
人間情報研究所では、まるで意思や感情を持っているように人間と日常会話を行い私たちのパートナーになってくれる、そんな対話システムの実現に向けての研究が盛んに進められている。
01.日常会話ができる対話システムをつくる
02.さまざまな先端技術が集積
石井亮は「対話システムがユーザの身振り手振りから感情や態度を理解したり、対話システムが身振り手振りを行ってユーザに感情や態度を自然に伝達できるようにする研究をしています」と話す。技術の鍵を握るのはマルチモーダル情報処理だ。従来の対話システムは聴覚に頼って情報を入力することが多かったが、今後は視覚も含めたさまざまなマルチモーダル情報を活用してユーザを理解していくことが求められる。
言葉からユーザを理解する研究を進めているのが光田航だ。
「人間であれば『授業参観に行ってきたんだよ』と言われれば、『子育てしてるんだな』とユーザの社会的背景を理解できます。が、今のコンピュータにそれはできません」
そうした「ユーザが言外に伝えている情報を理解する能力」をいかにして向上させていくかの研究が光田の手で進められている。
大塚淳史は対話システムの話す内容を自動で用意できるようにする技術の確立に励んでいる。
「対話システムは、ユーザがこんなことを話すだろうなという内容について、その応答を事前に考えておくことでより適切な応答をすることが可能です。そこで私は、ユーザがどのようなことを話すかを予測する技術の研究を行っています」
対話システムが「好きな食べものは?」と質問したときに、「ハンバーグ」「カレーライス」といった答えは誰でも想像がつく。しかし、例えば「ビーフストロガノフ」「エッグベネディクト」といったマニアックな回答の類はなかなか事前に用意しておくことはむずかしい。そこで大塚が開発する技術で「好きな食べものは?」に対する適切な答えを自動的に用意することで、日常会話には大きな幅が生まれてくる。
そして、ユーザとの関係性を構築する上で、コンピュータに「言ってはいけないこと」を教えているのが小林のぞみだ。
「例えば誹謗中傷など、人間が一般的なコミュニケーションにおいて避ける内容をコンピュータが理解できるようにすることが私の研究です」
こうした一人ひとりが向き合う技術の集積として、日常会話ができる対話システムが一歩ずつ実現に近づいていく。
03.5~10年で会話が楽しめる対話システムを
2016年頃から一般家庭にも普及し始めたAIスピーカーは、「音楽をかけて」「明日の天気は?」などに反応することはできるが、それは与えられたシンプルなタスクをこなしている状態にすぎない。そうではなく「知性の究極体」として、世間話から政治的な議論まで、さまざまなテーマについて話せる対話システムが東中達の目標だ。現状でも、文脈レベルの理解は着実に進んでおり、「かわいいね」と言われたときに直前に猫の話をしていれば、それは猫がかわいいんだろうと対話システムが想像できるところまでには至っている。しかし複数の文章が重なり合った問いかけなどには、まだまだシステムの理解が及んでいないという。
また対話というのは、人によって快適になるポイントが違う。例えば直接「かわいいね」と声をかけても、喜ぶ人と不愉快になる人がいる。どうすればユーザが喜ぶかというのも、大きな課題の一つであり、石井は「場の空気を理解して話せるようになるのが理想」だと将来の目標を口にする。
「NTTには言語解析や音声認識を始め、さまざまな関連分野の研究所がそろっています。基礎から応用まで幅の広い他分野の方々と協力しやすいというのはNTT R&Dの大きな強みです」(東中)
我々の気持ちを察し、そして楽しませてくれる対話システムの実現は『究極の目標』だが、「あと5~10年で会話すること自体が楽しくなるような対話システムを完成させたい」と目標を口にする。世界に名だたるライバルに先んじてNTTがそのような対話システムを実現する日も遠くない。
PROFILE
- 東中 竜一郎
- 2001年入社。入社後、タスク指向型対話システムの研究の後、英国シェフィールド大学客員研究員を経て、現在の研究に。しゃべってコンシェル、雑談対話API、マツコロイド、ロボットは東大に入れるかなど、さまざまなプロジェクトにも参画している。
- 小林 のぞみ
- 2007年入社。入社以来、自然言語処理の研究開発に従事。現在は、雑談対話システムの研究開発に取り組んでいる。
- 石井 亮
- 2008年入社。言語・非言語行動のマルチモーダル情報を利用した、コミュニケーションの理解・モデル化やインタラクションの研究に従事。人同士、人と対話システムのコミュニケーションをより豊かにする技術の創出に挑んでいる。
- 大塚 淳史
- 2013年入社。入社以来、対話処理や情報検索技術などのAIに関する研究開発に従事。社会のさまざまな場面で活躍できる対話システムの実現に向けて研究を続けている。
- 光田 航
- 2015年入社。学生時代に参加した学会でNTTの先輩社員に出会い、インパクトの高い研究を行うその姿に憧れNTTへ入社。
※記事本文中の研究所名や社員の所属組織などは取材時のものであり、
旧研究所名の場合がございます。