国立研究開発法人情報通信研究機構
2016年10月18日
ポイント
- Twitter上の災害関連の投稿をリアルタイムに自動分析し、要約できるシステムを公開
- 「救助」と「火災」など異なる種類の情報を地図上で同時に確認可能
- D-SUMM公開アドレス http://disaana.jp/d-summ/
NICTは、耐災害ICT研究センター及びユニバーサルコミュニケーション研究所において開発している災害状況要約システム「D-SUMM(ディーサム)」(Disaster-information SUMMarizer)を10月18日(火)からWeb上に試験公開しました。
D-SUMMは、人工知能を用いて、Twitterに投稿された災害関連情報をリアルタイムに分析し、都道府県単位又は市区町村単位でエリアを指定すると、指定エリア内の被災報告を瞬時に要約し、そのエリアの被災状況の概要が一目でわかるように、コンパクトかつ、わかりやすく提示し、各種救援、避難等を支援します。D-SUMMは、パソコンのWebブラウザ又はタブレット端末からhttp://disaana.jp/d-summ/にてご利用いただけます。
なお、本研究の一部は、内閣府総合科学技術・イノベーション会議の戦略的イノベーション創造プログラム(SIP)「レジリエントな防災・減災機能の強化」(管理法人・JST)の支援を受けて実施したものです。
背景
NICTは、既に、対災害SNS情報分析システムDISAANA(ディサーナ)のリアルタイム版を2015年4月8日から試験公開し、2016年の熊本地震をはじめとする災害において、Twitter上の災害関連情報へ素早くアクセスできる手段として、ご活用いただいております。しかしながら、DISAANAでは、大規模災害の発生時に膨大な被災報告が出力され、被災状況の概要を一目で把握することは困難でした。そこで、この課題を解決すべく、災害状況要約システムの研究開発を進めてきました。
今回の成果
災害状況要約システムD-SUMMは、Twitter上の膨大な災害関連報告をわかりやすく整理し、要約するシステムです。NICTが既に公開しているDISAANAでは、「火災が発生している」「火事が起きている」など、意味的に類似する被災報告が別々に出力されていました。D-SUMMでは、これらの報告を一まとめにすることで、よりコンパクトに被災報告を要約して提示します。また、被災報告をそのタイプ(地震、道路やインフラの被害、物資の不足等)毎に分類して、必要とする情報へのアクセスを容易にします。さらに、指定エリアの下位のエリア(指定エリアが県の場合は、県下の市町村)単位毎に被災報告を整理し、重大な被災報告が多く挙がっているエリアから順に表示することで、どのエリアの被害が大きいかをわかりやすく提示します。
今後の展望
今後は、DISAANA同様、実際に救援活動等を行う組織と協力して、実証実験等を行い、更なる機能追加や使い勝手の向上を図ってまいります。
D-SUMMが展示されるイベント
● NICTオープンハウス2016 (本部)
日時: 2016年10月27日(木)・28日(金) 9:30-17:00 (28日は16:30まで)
場所: 国立研究開発法人情報通信研究機構(本部) 東京都小金井市貫井北町4-2-1
● けいはんな情報通信フェア2016 (NICTオープンハウス2016 in けいはんな)
日時: 2016年11月10日(木)(13:00-17:00)、11日(金)(10:00-17:00)、
12日(土)(10:00-16:30)
場所: けいはんなプラザ 京都府相楽郡精華町光台1-7
* Twitterは、Twitter,Inc.の商標又は登録商標です。
* その他、各会社名、各製品名及びサービス名などは、各社の商標又は登録商標です。
用語解説
140文字以内の「ツイート」と称する短文を投稿できる情報サービスで、Twitter社により提供されている。
対災害SNS情報分析システムDISAANA(ディサーナ)は、NICTがこれまでに培ってきた情報分析技術を活用し、質問応答モード、エリア検索モードの2つの機能を提供するシステムである。2015年4月8日から、現在投稿されているツイート(日本語ツイートの10%ランダムサンプルを対象とする。これは、D-SUMMも同様である。)をリアルタイムに分析し、回答候補を出力するシステムとして試験公開を開始した。2016年熊本地震においては、内閣官房のツイッター分析班において実際に使用され、熊本県の災害対策本部に分析結果が提供された。
単語に対して意味的カテゴリーを付与した辞書で、例えば、「地震」という単語に対して【災害】というカテゴリーが付与してある。DISAANAでは、このような辞書を2,800万単語について整備しており、回答候補を提示する際に、意味的カテゴリー毎に整理して出力するために使用している。D-SUMMでは、この意味的カテゴリーを2階層にし、「地震」に対しては【災害-地震】のような意味的カテゴリーを持つように拡張した。これにより、「地震が発生した」「余震が起きている」などの表現については、「地震」、「余震」の単語の意味的カテゴリーが【災害-地震】であることから、これらをまとめて、「地震が起きる」という表現へ要約する。
熊本地震時(2016年4月14日から4月21日までの8日間)のツイート(日本語ツイートの10%ランダムサンプルを対象とする)を用いたシステム。熊本地震時の投稿に基づいて、D-SUMMやDISAANAがどのように動作するかを試すことができる。ただし、元の投稿が削除されている場合には、その投稿から抽出された回答の候補は出力されるが、元の投稿を確認することができなくなる。
補足資料
今回試験公開したD-SUMMの説明
【目的】
今回試験公開を開始したD-SUMMの目的は、大規模災害が発生した際に、Twitterに発信される膨大な被災報告を瞬時に、そのタイプ毎、地域毎に整理、要約してわかりやすく提示することです。これによって、被災状況の全体像の把握を短時間で行い、適切な避難や効果的な救援活動を行うためにご活用いただきたいと考えております。
D-SUMMの出力の具体例として、2016年4月の熊本地震の際のD-SUMM(熊本地震試用版)の出力例を図1、2に示します。図1では、被災報告が熊本県内の自治体毎に提示されており、また、「建物」「ライフライン」「救助」といった被災報告のタイプ毎に整理して提示されています。図2では、そうした情報を地図上に整理して表示しています。こうした要約によって、被害が深刻なエリアの特定や、大きな問題の特定を含めて、被災状況の全ぼうの把握が容易になります。これらの情報は、熊本地震本震が発生してから12時間の間に、被災者を中心としてTwitter上に発信された数千件に上る被災報告を瞬時に要約、整理して得られたものです。
以下では、このD-SUMMの使い方や、要約の見方について解説します。
【基本的な使い方】
まず、災害状況要約システムD-SUMMの基本的な使い方を説明します。具体的には、以下の図3に示すように、4ステップの手順になります。
① パソコン又はタブレットのブラウザに、以下のいずれかのURLを入力し、D-SUMMのサイトを開く。
http://disaana.jp/d-summ/ (今現在のツイートを要約するリアルタイム版。要約の対象となるツイートは利用する日の3日前から利用日までの最長4日間から選択可能)
http://disaana.jp/d-summ-km/ (熊本地震の際のツイートを要約する熊本地震試用版。要約の対象となるツイートは2016年4月14日から4月21日までの8日間から選択可能)
http://disaana.jp/d-summ-km/ (熊本地震の際のツイートを要約する熊本地震試用版。要約の対象となるツイートは2016年4月14日から4月21日までの8日間から選択可能)
② Twitter上の被災情報について要約の対象としたい自治体(都道府県又は市区町村)をメニューから選択する。
③ 要約の対象としたいツイートの発信時間帯を指定する。
④ 「エリア毎に要約」「カテゴリー毎に要約」「地図表示」のいずれかのボタンをクリックして、被災状況の要約を表示する。
【要約の見方】
次に、先の手順を踏んで表示された要約の見方について説明します。
先の手順では、「エリア毎に要約」「カテゴリー毎に要約」「地図表示」のボタンのいずれかを押すことで要約が表示されますが、ボタン毎に要約の表示が異なりますので、各ボタンの解説を以下にします。
「エリア毎に要約」のボタンを押した場合
図4は、エリア毎に要約した場合の表示例です。この表示は、熊本地震試用版のサイトを開いて、「熊本県」をまず選択し、熊本地震の本震から12時間後までに(4月16日1:30から13:30まで)発信されたツイートを対象として要約した場合です。D-SUMMのサイトを開いて、最初に指定した自治体が都道府県の場合は、その都道府県下の市区町村毎に被災状況を要約して表示します。図2の場合は、最初に「熊本県」を指定していますので、熊本県下の自治体、つまり、熊本市、阿蘇市、南阿蘇村等の市町村毎に被災状況を要約しています。
また、最初に指定した自治体が市区町村の場合は、その中にある地域毎(字、集落毎)に被災状況を要約します。
自治体、字、集落等は、重要な被災報告が多い方から順に並べて表示されます。図4の場合は、熊本県全体を最初に指定して要約しているので、重要な被災報告の多い、熊本市、阿蘇市、南阿蘇村、益城町が順に並びます。また、各エリアの要約としては、被災報告のカテゴリー毎(災害、ライフライン、救助、建物等)に被災報告が整理されて表示されます。こうした表示法により、どのエリアの被害が相対的に深刻であるか、また、どのエリアで、どのような被災報告が出ているかを短時間で把握することができます。
要約に表示された「建造物が崩落する(38)」のような各項目は、「熊本城の石垣が崩れた」といったツイートからその意味が似通ったものをまとめることで表示されます。括弧の中の数字は、その項目の情報源となったツイートの数を表しています。更に例を挙げると、「電気トラブルが相次ぐ」といった項目は「今、停電中」「停電が起きている」といったツイートから得られており、「治療・予防・サービスが危うい」といった項目は、「人工透析ができない」「消毒ができない」といったツイートが基になって表示されます。また、各項目をクリックすると、図5に示すように、その情報の基となったツイートを表示したり、それに関係する質問を、NICTが公開している災害に関する質問応答システムであるDISAANAに問い合わせて、更に情報を取得することができます。DISAANAは、D-SUMMよりも確度の低い情報も発見するように設計されており、D-SUMMが発見していない情報をDISAANAでは発見できる可能性があります。
なお、D-SUMMで用いている日本語解析技術は完全とはいえず、要約の表示が元のツイートの意味を正しく反映しているという保証はありません。実際に避難や救援活動でこうした情報を利用される場合には、元のツイートを参照し、提示されている情報が正しいかどうかをご判断の上、ご利用ください。
また、D-SUMMで要約された項目には、図6の左側の「水を貰わない」の場合のように、「対策」の「対」の字をマルで囲ったマークが付いていることがありますが、これは、報告された被災情報「水を貰わない」に対して、事態が沈静化した、もしくはその事態に対して対策が取られたことを報告するツイートが存在する可能性を示します。例えば、図6の右側は、左側の「水を貰わない」をクリックして表示したツイートですが、上半分が「熊本の友達が水が買えないと言っている」と被災状況の報告であるのに対して、下半分があるスーパーで水が無料配布されていること、つまり、水がない、という事態に対する対策が講じられていることを報告しています。こうした対策に関する報告をチェックすることで、救援活動のフォーカスを決定したり、あるいは被災者側からすれば、避難生活で有用な情報を取得することが可能になります。また、同様に、「矛盾」の「矛」をマルで囲ったマークが付いた被災報告もありますが、これは、被災報告と矛盾している報告がツイートされている可能性を示しており、この報告をクリックすることで、矛盾している可能性のあるオリジナルのツイートを見ることができます。仮に、矛盾した報告がツイートされていれば、元々の情報がデマである可能性がわかりますので、情報の信憑性を判断する際にご利用ください。
なお、D-SUMMで用いている各種の日本語解析技術は必ずしも完全ではありません。実際に避難や救援活動で利用される場合は、元のツイートまで表示して、D-SUMMの解析が正しいかどうかをご判断の上、ご利用ください。
「カテゴリー毎に要約」のボタンを押した場合
図7は、最初に熊本県を指定して、熊本地震本震発生直後12時間を時間帯として設定し、「カテゴリー毎に要約」した場合の要約の表示です。「エリア毎に要約」ボタンを押した場合には、画面左側には自治体の名前が並びましたが、「カテゴリー毎に要約」した場合には、被災報告のカテゴリー(「災害」「トラブル」「怪我」「救助」等)が並びます。例えば、「救助」の項を見ると、「救助・救出ください」という項目が表示されており、その横にそのタイプの被災報告が発信されているエリアが「熊本市(49)」「南阿蘇村(9)」「阿蘇市(7)」「益城町(6)」のように、該当する被災報告の数が多い順にリストアップされます。
「エリア毎に要約」の場合と同様に、要約の中の各項目をクリックすると、元のツイートやDISAANAへの質問等が表示されます。図7では、実際に南阿蘇村で緊急の救助を求めているツイートを表示している例を示していますが、このような重要な情報をD-SUMMでは数クリックで表示することができます。通常の検索エンジンで、「救助」等のキーワードを入れても、大量の有用でないツイートが表示されます。その中から、こうした有用なツイートを発見するには、大量のツイートを読む必要があり、短時間での作業は非常に難しくなりますが、D-SUMMでは、必要な情報に短時間でアクセスすることが可能になります。
「地図表示」のボタンを押した場合
図8は、「地図表示」ボタンを押した際の要約の例を示しています。地図表示ボタンを押すと、これまで操作していた画面では、カテゴリー毎の要約が表示され、さらに、新たにタブが開かれて、そこに地図を表示する画面が表示されます。なお、新規タブはポップアップとして扱われることが多く、また、ポップアップが制限されていることも多いので、地図表示を実行するためにポップアップを許可してください。この例の対象ツイートは、これまでと同様、熊本地震の本震から12時間分、つまり、4月16日1:30から13:30までに発信されたものです。画面左側には、被災報告のカテゴリー(「災害」、「トラブル」、「怪我」、「救助」等)がリストアップされています。各々のカテゴリーには、チェックボックス(白い四角)が左横に付いていますが、それをクリックすると、該当するツイートに関係しているエリア毎に、地図上にツイート件数の大小を表すグラフと、ツイートの件数そのものが表示されます。チェックボックスをもう一度クリックすると、地図上の表示は消えます。グラフは、カテゴリー毎に色分けされて表示されます。どのカテゴリーにどの色が割り振られるかはチェックボックスをクリックした順序で決まります。例えば、図8では、画面左上に表示されているように、「災害:火災」に赤色、「救助」にオレンジ、「道路(の被害)」に黄色、「建物(の被害)」に緑色が割り当てられており、例えば、南阿蘇村周辺では救助要請(オレンジ)が出ているものの、道路の被害(黄色)や建物、インフラの被害(緑色)も出ているため、救援活動を行うには通行可能な道路を確認するなど、入念な準備が必要なことがわかります。また、広い範囲で建物の被害が報告されていますが、火災の報告は一部地域に集中していることも分かります。
また、図9は、地図中のグラフの一つをクリックした直後の画像であり、吹き出しで、グラフでカウントされているカテゴリーが表示されています。それらのカテゴリーをクリックすると、被災報告の抽出元のツイートが表示されます。
なお、地図表示ボタンを押した直後は、「災害」というカテゴリーのチェックボックスがクリックされた状態で地図が表示され、地震、水害等の自然災害そのものに関する報告の件数等が赤いグラフで表示されます(図3右下参照)。上で説明した例を表示するためには、まず、「災害」というカテゴリーのチェックボックスをクリックして一旦表示を消し、上で述べたカテゴリーのチェックボックスを一つずつクリックする必要があります。
また、各カテゴリーには+の記号がチェックボックスの横にあります(図8左側参照)。これをクリックすると、カテゴリーの更に詳細な分類がリスト中に表示されます。例えば、「災害」の横の記号をクリックすると、「災害」カテゴリー内の更に詳細な分類(例えば、「地震」「津波・高潮」「氾濫・決壊」「土砂災害」「火災」)等がリストアップされます。図8では、「災害:火災」を赤色で地図中に表示しましたが、これは、「災害」カテゴリーの表示を一旦消去した後、その詳細な分類の一つである「火災」に関してチェックボックスをクリックして、地図中に表示しております。また、+の記号をクリックすると、-の記号に変化します。この-の記号をクリックすると、表示された詳細な分類が閉じられ、元の表示に戻ります。
【検索オプションについて】
図10はD-SUMMのサイトを開いた直後の画面ですが、「エリア毎に要約」などの要約を実行するボタンの下部で各種の検索オプションを設定することできます。設定が可能なのは、要約対象となるツイートに関する条件です。例えば、「最近の災害のみ表示&冗談・宣伝等を非表示」をチェックした場合には、過去の災害、例えば、東日本大震災のみに関係すると思われるツイートや、各種の宣伝となるツイート等を要約の対象から除外することが可能になります。また、「予報と識別されたツイートも含める」をチェックした場合には、「余震が続くおそれがある」等、予報と思われるツイートも要約したり、表示したりするようになります。これらの処理は完全ではありませんので、誤った結果が表示されたり、表示すべき内容が表示されなかったりすることはあります。
【要約の対象となるツイートと、位置情報について】
D-SUMMでは特に断らない限り、全日本語ツイートの10%のサンプルを要約対象とします。したがって、10%のサンプルにない被災報告は、リツイート等がサンプルに含まれない限り、D-SUMMでは表示することができません。災害時に重要と思われるツイートをリツイートしていただければ、D-SUMMの要約の対象となる可能性は高まります。
また、地図で表示する際の緯度経度情報は、ツイートに付いたGPS情報によるのではなく、あくまでツイートの本文に書かれた地名を用いております。これは、GPS情報が付いたツイートが現状、極めて少ないことと、報告されている被災状況の発生地点とツイートが発信された場所が異なることによります。したがって、被災状況をツイッターで報告する際には、GPS情報を付けなくても、正確な地名を本文に記載いただければ、地図上に表示されます。なお、「熊本県」「熊本市」のように広い範囲を指す地名が記載されている場合には、県庁、市役所等の所在地に関連する情報が表示されます。
【DISAANAとD-SUMMの違い】
図11は、NICT が2015年に試験公開を開始した対災害SNS情報分析システムDISAANAと、今回試験公開するD-SUMMの違いを説明しています。熊本地震のような規模の災害になると、DISAANAのエリア検索モードでは、膨大な被災報告が出力されます。しかも、それらの被災報告は、場所毎に整理されていないため、例えば、各市区町村等を一つずつ指定して調べる必要がありました。D-SUMMでは、このような煩わしさを解消し、ボタン一つで、県下の市区町村毎に要約を作成することができます。これにより、どこで何が起きているかを把握することが短時間で可能になります。また、カテゴリー毎に要約することで、要救助者等の発見も非常に容易に行えます。
一方で、DISAANAは、特に、質問応答モードで「熊本県で何が不足していますか?」のように質問を入力した場合、D-SUMMの提示する情報より、確度の低い情報まで発見するように作られており、特に重要な情報はDISAANAでも質問を入力され、検索されることをお勧めします。また、D-SUMMで提示された情報をクリックすると、DISAANAへの問い合わせができるリンクが提示されますが、それらも、そうした目的でのご活用を考え、提供しているものです。
【被災報告の要約方法概要】
図12 は、D-SUMMにおける被災報告の要約方法の概要を示しています。D-SUMMでは、まず、DISAANAのエリア検索モードにおける被災報告の自動抽出の仕組みを使って、被災報告を集めます。次に、これらの被災報告のうち、同一の意味カテゴリーに所属し、ほぼ同じ意味を表している被災報告を集約し、一つの被災報告の要約としてまとめます。また、それと同時に、各被災報告と関係する場所情報を整理し、要約と対応付けます。このように作成したデータをユーザの要求に合わせて、地図表示、あるいは、エリア毎、カテゴリー毎に整理して提供します。
【免責事項について】
D-SUMMのご利用に際しては、以下の免責事項をご承諾いただく必要があります。初めてサイトにアクセスすると、図13に示すように免責事項をご承諾したことをお尋ねしますので、ご承諾いただける場合には、「承諾してシステムを利用する」というボタンをクリックしてご使用ください。
【免責事項】
災害状況要約システムD-SUMMは、指定されたエリア及び時間の条件のもと、Twitter情報(日本語による全ての投稿の10%程度)から、自動的に災害関連情報を抽出し、機械的に要約を作成します。従いまして、そもそも不正確なTwitter情報や、自動抽出の誤りによって、デマや誤り、その他不適切な要約結果が出力される場合もございます。これらすべての出力は、機械処理によるもので国立研究開発法人情報通信研究機構(NICT)の主体的な判断を示すものではありません。また、NICTは、本システムの使用に関連して生ずる損失等について、いかなる場合においても一切責任を負いません。以上の自動要約の性質をご理解いただくこと、ならびに入力頂いた内容や操作の記録をアクセス元のIPアドレスとともに、NICTにおける今後の研究において活用させていただくことへの同意をシステム使用の条件とさせて頂きます。また、本システムは、研究中のものであり、事前の通知無く停止することがあります。さらに、本免責事項についても事前の通知なく、いつでも変更することが出来るものとします。
本件に関する問い合わせ先
耐災害ICT研究センター
応用領域研究室
応用領域研究室
大竹 清敬
Tel: 0774-98-6329
E-mail:
広報
広報部 報道室
廣田 幸子
Tel: 042-327-6923
Fax: 042-327-7587
E-mail: