本文へ
文字サイズ:小文字サイズ:標準文字サイズ:大
  • English Top

単一光子を用いた意思決定の実証に成功

~光の粒子性と確率性により、速く正確な判断を実現~

  • English
  • 印刷
2015年8月19日

国立研究開発法人情報通信研究機構
国立研究開発法人物質・材料研究機構
フランス国立科学研究センター Institut NEEL/ジョセフ・フーリエ大学

ポイント

    • 単一の光子が持つ粒子性と確率性を活用することで、MAB(多本腕バンディット問題、Multi-armed Bandit Problem)と呼ばれる意思決定問題の正解を効率的に探し当てる物理的システムを実験的に実証した。
    • MABは情報通信技術における周波数割当ての効率化、ウェブ広告の最適化などに応用できる。これらを新しい原理で実現する「知的フォトニックシステム」の開発が期待される。

要旨

NICT、国立研究開発法人物質・材料研究機構(NIMS、理事長: 潮田 資勝)、フランス国立科学研究センター(CNRS)及びジョセフ・フーリエ大学のInstitut NEEL(ディレクター: Hervé Courtois)は、単一光子を用いて、高効率に意思決定をする全く新しい概念の知的フォトニックシステムを、ダイヤモンド中の窒素欠陥(NV)を単一光子源とし、偏光制御装置、単一光子検出器及び独自のシステムを用いた実験により実証しました。これは、NICT光ネットワーク研究所 成瀬 誠主任研究員、NIMS国際ナノアーキテクトニクス研究拠点 金 成主NIMS特別研究員、CNRS及びジョセフ・フーリエ大学 Institut NEELのSerge Huant教授、東京工業大学地球生命研究所 青野 真士准主任研究者、山梨大学大学院総合研究部 堀 裕和教授らの共同研究グループによる成果です。
報酬確率が最も高い選択肢を速く正確に判断することを求められる意思決定問題は、機械学習の分野では「多本腕バンディット問題(Multi-armed Bandit Problem; MAB)」と呼ばれる問題として定式化されています。MABは、情報通信技術における周波数割当ての効率化、ウェブ広告の最適化、コンピュータ囲碁などで使われるモンテカルロ木探索の高速化など、様々な応用と密接に関連しています。したがって、効率的なMABソルバーの開発は、情報通信における新たな重要なコア技術の創成につながります。
今回、共同研究グループは、MAB解探索アルゴリズムとして独自に定式化した「綱引きアルゴリズム」と呼ぶ数理モデルの特徴を、単一の光子の持つ粒子性と確率性を用いて表現できることに着目し、それを利用して効率的なMAB解決マシンとして機能する物理的なシステムを実験的に実証しました。
今回の成果は、単一光子の物理的特性を、社会的重要性の高い様々な意思決定の局面で威力を発揮するコア技術に利用可能であることを世界に先駆けて示したものであり、新しい原理で動作する「知的フォトニックシステム」が開発できることを示唆します。
 本研究成果は、英国Nature Publishing Groupが発刊しているオープンアクセス科学雑誌『Scientific Reports』(8月17日付け)に掲載されました。

背景

動的に変化する不確実な環境において効率的な意思決定を実現するには、複数の選択肢の中から報酬が得られる確率が最も高いものをできるだけ速く正確に探索しなければなりません。このとき、すべての選択肢の報酬確率を正確に見積もるためには、十分な検証が必要になります。正確さを追求し過ぎると、この検証に要する「探索コスト」がかさみ、利益を損ねてしまいます。しかし、探索を早急に打ち切り過ぎると、報酬確率の低い選択肢に投資して損をするリスクが高くなってしまいます。このような探索の「正確さ」と「速さ」とのトレードオフは、効率的な意思決定を要求される現実社会の様々な局面において普遍的に存在する課題として知られており、「探索と搾取のジレンマ」と呼ばれています。MABは、異なる確率で報酬が得られる複数のスロットマシンの中から、獲得報酬を最大化できるものを探り当てる課題であり、機械学習の分野で詳しく研究され、情報通信技術における周波数割当ての効率化、ウェブ広告の最適化などの多くの応用と密接に関連しています。
2009年に金 成主NIMS特別研究員らは、「綱引きアルゴリズム」と呼ばれる独自のMAB解探索アルゴリズムを定式化しました。この効率的な意思決定は「綱引き原理」としてまとめられています(参考文献1)。綱引きアルゴリズムは、運動ダイナミクスとして記述されているため、従来のデジタル計算機のソフトウェアとして実現できるのはもちろんのこと、類似したダイナミクスを持つ様々な物理過程を用いて物理的に直接に実現可能という顕著な特徴を持っています。
共同研究グループは、2013年にナノ寸法における光と物質の相互作用(近接場光)を利用することによって、綱引きアルゴリズムを物理的に実装してMABの解を探索できることを理論的に示し、参考文献2を発表しました。この成果を2013年8月9日にプレスリリースし、さらに、2014年には、量子ドットと近接場光を利用してMABの解を探索できることを実験的に実証し、参考文献3を発表しました。そして今回、共同研究グループは単一光子を用いた綱引きアルゴリズムの物理的実装を試み、自然界の揺らぎを活用した意思決定問題の解決に、世界で初めて実験的に成功しました。

研究手法と成果

今回、単一光子の粒子的性質と確率的性質を用いて、2台のスロットマシン(L、R)のうちで報酬確率の高いものを判断する問題(2本腕バンディット問題)を解決する原理とシステムアーキテクチャを示し、その実験に成功しました。

図1 単一光子を用いた意思決定の原理の概要図
図1 単一光子を用いた意思決定の原理の概要図 [画像クリックで拡大表示]

偏光ビームスプリッタ(PBS)に対して45度傾いた偏光を有する単一光子が入射したとします(図1(i))。光子はPBSにより、確率1/2でチャンネル0又はチャンネル1に向かいます。このとき、チャンネル0で単一光子が検出されたときには、チャンネル1で単一光子が観測される確率は0となります。このような確率的でありかつ粒子的であるという単一光子の物理的性質を意思決定問題の解決に応用します。PBSに対してほとんど水平の偏光を有する単一光子が入射したとき(図1(ii))は、PBSにより、ほとんど1の確率で光子はチャンネル0に向かいます。ただし、わずかな確率で、チャンネル1で光子が検出されることもあります。同様に、PBSに対してほとんど垂直の偏光を有する単一光子が入射したとき(図1 (iii))は、ほとんど1の確率で光子はチャンネル1に向かいますが、わずかな確率でチャンネル0で光子が検出されます。このように、単一光子の行き先は偏光に依存して確率的に異なってきますが、個々のイベントは光の粒子性のため確実に決まります。本研究では、チャンネル0で光子が検出されたら、ただちに、スロットマシンLを選ぶ意思が決定されたと見なし、チャンネル1での光子検出を、マシンRを選択する意思の決定と対応付けます。このように単一光子の検出と意思決定を対応させ、綱引きアルゴリズムを単一光子の偏光の制御として実現しました。

図2 単一光子を用いた意思決定システムのアーキテクチャ
図2 単一光子を用いた意思決定システムのアーキテクチャ [画像クリックで拡大表示]

実験では、単一光子源としてダイヤモンド中の窒素欠陥を用い、偏光子、半波長板、PBS通過後の光子を2チャンネルの単一光子検出器で計測し、時間相関単一光子計数システムにより、到着タイミングを検出し、これを意思決定に用います。そして、選択したスロットマシンからの報酬に基づいて半波長板の回転角を調節し、単一光子の偏光状態を制御します(図2)。
 

図3 意思決定の実験デモンストレーション
図3 意思決定の実験デモンストレーション [画像クリックで拡大表示]

代表的な結果を図3に示します。横軸はスロットマシンの試行回数、縦軸は「正解率(報酬確率が高い方のスロットマシンを選択した割合)」です。最初の150サイクルではスロットマシンLとRの報酬確率はそれぞれ0.8、0.2と設定してあります。よって、スロットマシンLの選択が正解です。実験で得られた結果を実線で示しています。時間の経過とともに正解率が1に漸近していることがわかります。その後、環境が不確実に変化することを表現するため、150サイクルごとにスロットマシンLとRの報酬確率を反転(0.8を0.2に、0.2を0.8にスイッチ)させます。この結果、報酬確率の反転直後に正解率は急激に低下しますが、時間の経過とともに回復し、やがて1に漸近します。これは、システムが自律的に環境変化を検知し、正しい意思決定を実現していることを示しています。点線はスロットマシンの報酬確率を0.6と0.4に設定した場合の結果です。報酬確率の差が小さいため、より難易度の高い問題を設定したことになります。これにより、正解率はやや低下しますが、依然として自律的に正しい意思決定を実現しています。

今後の期待

今回実証した意思決定機能は、単一光子の物理的性質を利用しており、従来のデジタル計算機上でソフトウェアとして実行されるこれまでの機械学習システムとは全く異なる形態で実装されています。本研究では、量子レベルの光(単一光子)を用いて効率的な意思決定を実現できることが初めて実験的に示されました。
 今後、フォトニクスを利用することで更なる知的機能が実現され、こうした「知的フォトニックシステム」が情報通信における新たな重要なコア技術となることが期待できます。

掲載論文情報
M. Naruse, M. Berthel, A. Drezet, S. Huant, M. Aono, H. Hori, and S.-J. Kim:
Single-photon decision maker, Scientific Reports, DOI: 10.1038/srep13253.
(URL: http://www.nature.com/articles/srep13253

参考文献

  1. S.-J. Kim, M. Aono, and E. Nameda, Efficient decision-making by volume-conserving physical object, New Journal of Physics, Vol. 17, Article number 083023 (2015).
  2. S.-J. Kim, M. Naruse, M. Aono, M. Ohtsu, and M. Hara: Decision maker based on nanoscale photo-excitation transfer, Scientific Reports, Vol. 3, Article number 2370 (2013).
  3. M. Naruse, W. Nomura, M. Aono, M. Ohtsu, Y. Sonnefraud, A. Drezet, S. Huant, and S.-J Kim: Decision making based on optical excitation transfer via near-field interactions between quantum dots, Journal of Applied Physics, Vol. 116, No. 15, pp. 154303 (2014).



本件に関する問い合わせ先

NICT光ネットワーク研究所
フォトニックネットワークシステム研究室

主任研究員 成瀬 誠
Tel: 042-327-6794
E-mail:

NIMS国際ナノアーキテクトニクス研究拠点 原子エレクトロニクスユニット

NIMS特別研究員 金 成主
E-mail:

CNRS Institut NEEL/ジョセフ・フーリエ大学

Directeur de recherche Serge Huant
E-mail:

広報

NICT広報部

Tel: 042-327-6923
E-mail:

NIMS広報室

Tel: 029-859-2026
E-mail:

Public Relations Office
Institut NEEL, CNRS and Université Grenoble Alpes, France

E-mail: neel.communication@neel.cnrs.fr