国立研究開発法人情報通信研究機構
2017年10月24日
ポイント
- 40億件以上のWebページ情報を用いユーザの多様な音声入力に応答する音声対話システム
- ユーザの音声入力に応じて質問を自動生成し、Webページから発見した回答を用いて応答を合成
- 既存の対話システムと異なり、ルールやシナリオを使わずに、Webと深層学習を使い対話が可能
NICT ユニバーサルコミュニケーション研究所 データ駆動知能システム研究センターは、NICTが一般に試験公開している大規模Web情報分析システムWISDOM Xを用いて、40億件以上のWebページの情報をベースに、ユーザの多様な音声入力に応答する次世代音声対話システム「WEKDA(ウェクダ)」(WEb-based Knowledge Disseminating dialog Agent)の開発に取り組んでおります。
WEKDAは、従来型の対話システムとは異なり、「もしユーザがXXと言ったら、XXと答える」といった対話のルールやシナリオをあらかじめシステムに教えることなく、先端技術から日常生活の話題まで多種多様なトピックに関する入力に対し、40億件以上のWebページに書かれている知識を提供しつつ、対話を行います。
本システム開発の最終目的は、お年寄りからビジネスマン、エンジニア、子供まで多様なユーザに対して、Webから得られる多様な知識を何気ない雑談を介して提供し、高齢者のケア、教育、仕事上の気付きを与えることによるイノベーションの創発まで、様々な価値を提供することです。NICTはそれらの目的を実現するため、今後もWEKDAの研究開発を推進いたします。
なお、10月26日(木)~28日(土)に開催される「けいはんな情報通信フェア2017」において、WEKDAを公開いたします。http://khn-fair.nict.go.jp/
なお、10月26日(木)~28日(土)に開催される「けいはんな情報通信フェア2017」において、WEKDAを公開いたします。http://khn-fair.nict.go.jp/
背景
近年、音声対話システムが大きな注目を集めていますが、そのほとんどは、「もしユーザがXXと言ったら、XXと答える」といった対話のルールをあらかじめ多数用意して、ユーザの入力に応答するものです。こうした方式のシステムは、音声認識等の進歩により、比較的容易に実現が可能になった一方で、あらかじめ想定されたトピックに対してしか、意味の通る応答ができないという問題があります。
既に、Webをはじめ、本来、対話の応答の際に参考になる膨大な情報にアクセス可能になっている一方で、対話ルールに書かれたタイプの入力に対してしか応答できないというのは、対話システムが持つ本来の可能性を大きく損なうことになります。次世代音声対話システムWEKDAはそうした問題を解決し、多様な入力、トピックに対して価値ある情報を提供することを目的として開発が進められています。
今回の成果
NICTは、ユーザの音声入力に応じて、大規模Web情報分析システムWISDOM X(http://wisdom-nict.jpにて試験公開中)用の質問を自動生成し、WISDOM Xが40億件以上のWebページから発見する回答を用いて応答を行う会話するAI、次世代音声対話システムWEKDAの開発に取り組んでいます。
このシステムでは、例えば「iPS細胞ってすごいよね」「煮物が食べたい」といったユーザの音声入力に対して、「iPS細胞で何を見る?」「煮物に何が良い?」といった質問を自動生成し、その質問に対してWISDOM Xが提供する回答(「治療薬候補」「和風な朝御飯」等)を基に、「iPS細胞で肥大型心筋症の治療薬候補を見つけた」「焼き魚に玉子に煮物で和風な朝御飯も良し」といった応答を生成します。ユーザは、こうした応答によって、価値ある知識を取得したり、近々の生活を豊かにするヒントを得ることが可能になります(補足資料参照)。
今後の展望
今後は、高齢者ケア、教育、仕事上のヒント等に、よりフォーカスした対話を行えるよう、目的やユーザに関する知識を持たせ、それに基づいて対話を行えるようWEKDAを拡張していきます。
NICTでは、WEKDAの技術を、各個人の置かれた状況や好みに応じて、様々な活動に役立つ知識や、新しい可能性を開くヒントを何気ない雑談を介してわかりやすく提供し、各個人の潜在的能力を最大限に発揮してもらうための全く新しい技術へと進化させていくことを目指します。
なお、WEKDAは10月26日(木)~28日(土)に開催される「けいはんな情報通信フェア2017」において公開します。
補足資料
WEKDAの概要
WEKDAは、利用者が自然な文を入力すると、入力文の意図を解析し、40億件のWebページからNICTの大規模Web情報分析システムWISDOM Xが提供する知識を基に、様々な話題やトピックに関して対話を展開できるシステムです。「煮物が食べたい」といった日常に関する雑談から、「臓器移植って難しいね」といった学術的な話まで幅広く応答することができます。図1に「煮物が食べたい」と入力された場合のWEKDAの応答を示します。
従来の対話システムでは、例えば「臓器移植って難しいね」という発話(入力文)に対して、「臓器移植は高度な技術ですね」というような、当たり前の情報を基にした応答がなされがちでした。WEKDAは、大規模Web情報分析システムWISDOM Xを活用することにより、「臓器移植で最大の壁となるのが、人体の免疫機構による拒絶反応だ」というような、ユーザが知らない可能性の高い情報も応答として返すことができます。
また、回答を生成する際に基にした情報のURLを「情報源」として表示するとともに、URLをクリックすることにより、回答が抽出されたページや元のテキストを確認できます。
技術的な新規性
WEKDAがユーザの入力に応じて、応答を作成する処理にはいくつかのタイプがありますが、代表的なものは、以下の3ステップからなります。
ステップ1. ユーザの入力が質問でなかったとしても、その入力からユーザの興味を引きそうな知識を問う質問を深層学習等によって自動生成する。
ステップ2. WISDOM Xから質問への回答として提供された複数の回答及び回答が抽出されたオリジナルの文を深層学習によってランキングし、応答として適切な回答及び回答が抽出されたオリジナルの文を選択する。
ステップ3. ステップ2で選択した回答と回答が抽出されたオリジナルの文を使って応答を作成する。
このように、ユーザの入力に応じて質問を自動生成して、その回答に基づいて対話を行うシステムは前例がなく、また、この質問の自動生成により、多様なトピックに対して、ユーザの興味を引く可能性の高い知識を含む応答を合成することができます。
図2は、「iPS細胞ってすごいね」という入力に対するWEKDAの応答生成方法の概要を示しています。WEKDAは、ユーザの「iPS細胞ってすごいね」という入力から、まず「iPS細胞で何を見る?」「iPS細胞が何に使われる?」といった複数の質問を深層学習等によって生成します。そして、これらの質問に対する回答をWISDOM Xから取得します。取得した回答が複数の場合は、その中から入力に対して最も適切と思われるものを選択するため、深層学習を用いてランキングを行います。その結果選択された回答を取得したオリジナルの文から、入力文に対する応答文を自動で生成します。WEKDAが幅広いトピックに適切に回答できるのは、ステップ1でユーザの興味を引きそうな知識を問う質問を生成できていること、及びWISDOM Xの提供する豊富な知識があるためです。図3に、「iPS細胞ってすごいね」に対するWEKDAの応答と、そこから対話を続けた場合の対話例を示します。
今後、ユーザの入力に対して、どういった質問を生成するかをコントロールすることで、例えば、高齢者ケアから教育、あるいはビジネスといった幅広い用途の対話が実現すると期待しています。
その他の対話例
図4及び図5には、入力として質問が与えられた際のWEKDAの応答例を記載しています。図4の例では、「人工光合成で何が作れるの?」という質問が入力され、それに対してWEKDAが「エネルギー」や「水素」「有機物」といった回答を挙げています。このように入力が質問文の場合は、必要に応じて入力された質問文をWISDOM Xで回答可能な形に自動で変形し、直接WISDOM Xへ送り回答を取得して、ユーザに提供します。
図6には、対話を続けて、話題を深掘りしていく例を記載しています。「奈良に住んでいます」というユーザの発話に対して、WEKDAは奈良の大仏殿の情報を用いて応答します。ユーザは、大仏殿の話題から「大仏を作ったのは誰ですか?」という質問をWEKDAに投げ掛けます。WEKDAは、ユーザの質問に「聖武天皇」と答えたため、ユーザの興味は聖武天皇へと移り、「聖武天皇が作ったものは何?」と質問しています。このように、雑談と質問を織り交ぜながらWEKDAと会話することで、あるトピックを掘り下げたり、話題を変えながら情報を得ることができます。
おことわり
WEKDAの応答は、WISDOM Xの回答によって内容が変化します。WISDOM Xのデータは日々更新され、また、アルゴリズムにも適宜修正が入ります。したがいまして、本プレスリリースでご紹介した様々な応答は、デモの際にはWEKDAで回答されない可能性がありますことをご承知ください。
※ WEKDAは、NICTの商標です。WISDOMは、NICTの登録商標です。
本件に関する問い合わせ先
ユニバーサルコミュニケーション研究所
データ駆動知能システム研究センター
データ駆動知能システム研究センター
鳥澤 健太郎
Tel: 0774-98-6847
E-mail:
広報
広報部 報道担当
廣田 幸子
Tel: 042-327-6923
Fax: 042-327-7587
E-mail: