金融分野向けの高精度AI翻訳システムを開発

〜金融庁による翻訳文書の大量収集と、NICTによる深層学習の連携で高精度化〜
2022年3月11日


国立研究開発法人情報通信研究機構
金融庁

ポイント

  • 金融分野の文書を日本語と英語の間で双方向に高精度に翻訳できるAI翻訳システムを開発
  • 金融庁などから文書を大量収集したことで金融専業翻訳者レベルに達した訳文の割合が2割から5割に向上
  • 専門性が高い金融分野での翻訳効率の改善により、日本の国際金融センター機能の強化への貢献に期待
国立研究開発法人情報通信研究機構(NICTエヌアイシーティー、理事長: 徳田 英幸)と金融庁は協力して、金融分野の文書を日本語と英語の間で双方向に高精度に翻訳できるAI翻訳システムの開発に成功しました。金融庁は、同庁及び金融関係の業界団体の所有する翻訳文書を大量に収集してNICTに提供し、NICTは翻訳文書をAI用の学習データに変換し、更に精製したデータを深層学習に用いて高精度のAI翻訳システムを開発しました。NICTでは、本システムについて、2022年3月1日から、民間事業者に技術移転を開始しています。本システムを用いることで、金融専業翻訳者レベルに達した訳文の割合が従来の2割から5割に向上するなど高精度な翻訳が可能となり、金融分野の文書の翻訳作業を大幅に効率化できることから、日本の国際金融センター機能の強化への貢献が期待されます。

背景

NICTは、AI翻訳を多分野で高精度化するために、その基盤となる翻訳文書を収集する翻訳バンクの活動を進め有効性を実証してきましたが、個別組織単位の収集を越えて一気に大規模に収集する方式を模索していました。金融庁は、国際金融センターの実現に向けた取組の一環として、金融分野に特化した高精度なAI翻訳によって英語での情報の受発信を容易にし、金融行政を更に高度化することを目指していました。

今回の成果

図 1
図1 従来の汎用翻訳システムと金融分野向け高精度AI翻訳システムの比較

NICTと金融庁が連携し、金融分野において、官民協力により業界団体単位でまとまったデータを確保しました。これにより、提供データを効率よく活用し、日本語と英語の間のAI翻訳の精度が向上しました。
具体的には、金融庁の率先垂範の下、金融関係の複数の業界団体から大量の翻訳文書を収集し、NICTはこの翻訳文書をAI用の学習データに変換し、更に精製したデータを深層学習に用いて高精度のAI翻訳システムを開発しました。
同じ原文に対する従来の汎用翻訳システムによる訳文と上記の金融分野向けの高精度AI翻訳システムによる訳文の品質の比較を行ったところ、最高品質である金融専業翻訳者レベルに達した割合は、前者で約2割でしたが、後者では約5割と大きく増加し、NGレベルの割合は半減するなど、圧倒的な高精度化を実現しました(図1参照)。
NICTでは、この金融分野に特化した高精度AI翻訳システムについて、2022年3月1日に民間事業者に技術移転を開始しました。本システムは実用性が高いことから、直ちに普及し、広く利用され、金融分野での英語での情報の受発信が増進されると期待されます。

今後の展望

NICTは、今回の金融分野での成功事例を模範として、今後の更なる分野拡大を目指していきます。
また、金融関連の翻訳文書収集に関する金融庁との連携も継続し、次々と登場する新語・新概念への対応を始め性能改善のエコ・システム化を実現していきます。

《訳文の改善例》
 日本語原文  汎用翻訳の訳文<理解可>  金融分野向け翻訳の訳文<専門級>
保険契約に解約価額がある場合、契約を解約する保険契約者に損失を負担させることを可能にするための解約時の契約価額の削減 where insurance contracts have a surrender value, reducing the value of contracts upon surrender to enable losses to be imposed on policyholders that surrender their contracts.  A reduction in the value of policies at surrender to enable policyholders who surrender policies to bear losses if they have a surrender value ;
なりすましに対抗するため、各参加者に固有の生体認証番号(BIN)が作成されている。 A unique Biometric Identification Number (BIN) is created for each participant to counter identity fraud. To counter identity theft, a unique Biometric Identification Number (BIN) is created for each participant.

本研究は、NICTが「自動翻訳エンジンの金融専用モデル構築に関する委託研究」を金融庁から受託したものです。

用語解説

翻訳バンク

AI翻訳の精度向上のためには、ニューラルネットワークのアルゴリズムの改良が有効であることに加えて、翻訳データ量の影響も大きいので様々な分野の翻訳データの確保が重要です。NICT は総務省と共に「翻訳バンク」の運用を進めながら更なる翻訳データを集積し、日本の翻訳技術の多分野化・高精度化に取り組んでいます。

本件に関する問合せ先

国立研究開発法人情報通信研究機構
【詳細技術に関すること】
ユニバーサルコミュニケーション研究所
先進的音声翻訳研究開発推進センター
隅田 英一郎


【広報 (取材受付)】
広報部 報道室
Tel: 042-327-6923

金融庁総合政策局総合政策課
Tel: 03-3506-6785