屋外の拡声器から放送される防災行政無線(同報系)は、山彦の影響などにより聴き取りにくいという問題を抱えています。本技術は、そのような場合でも聞きやすい合成音声になるように、入力文を編集するための技術です。
トップページ > 聴き取りやすい防災行政無線を実現するための、 音声合成向けテキスト整形システム
2014年9月12日
概要
原理
テキスト(文字列)を入力し、その合成音声を出力するシステムでは、入力したテキストをそのまま読み上げる仕組みになっています。一般にテキストは文字として読んで理解しやすい形で書かれている場合が多いため、そのテキストをそのまま音声合成システムに入力しても、必ずしも聴いてわかりやすく違和感のない合成音声に変換されるとは限りません。そこで本技術では、以下の処理フローにより、テキスト自体をインタラクティブに変換する編集技術を提供します。
【処理フロー】
- 入力テキストを単語に分割する。
- 各単語の発音を決定する。
- 各単語(内容語)について単語辞書を検索し、同義異音語ラティスを作成する。
- 同義異音語ラティス内の全単語について観点(注)に基づきスコアを計算する。
- 元の単語よりスコアの高い同義異音語がある場合に入れ替え候補とする。
- 入れ替え候補をユーザーに提示し、ユーザーの判定を入力する。
- 入替候補単語が提示されたにも関わらず、どうしても元の文字列を利用する必要がある場合は、その単語の前後にポーズを入れたり、その文字列の発声スピードを遅くしたりして、聴き取りやすくする。また、山彦の多い環境で合成音を再生することを想定して、文節ごとにポーズを挿入する。
- 上記により整形した文章を合成、出力し、人間が聴取してさらに整形すべき部分があれば、6に戻って判定入力する。
(注)スコア計算の観点(あてはまる場合にスコアが低い)
- 聴き取りにくい単語等(音韻的問題)
親密度、頻度が極端に低い単語、短い単語、母音の「イ」「エ」を多く含む単語、母音の無声化が多い単語等 - 意味が取りにくい単語等(意味的問題)
同音異義語が多い単語、複数の意味を持つ単語、あいまい性の多い単語、漢語/音読みの単語等 - 禁忌単語等
- 文全体の属性(楽しい、お悔やみ、子供向け、高齢者向け、非常通報、高級/低級)に合わない単語
- 使用するテキスト音声合成システムが不得意とする単語等
特長
音の組み合わせパターンに着目して、聞きづらい発音パターンを検出した場合に、当該単語又は複合語を他の単語又は複合語に置換する技術や、複合語を構成する単語間に助詞又はポーズを挿入する技術は、既にあります。それに対して本技術は、防災行政無線のような拡声器を介して遠く伝わる合成音声を対象として、さまざまな観点に基づく言い換えに対応できるところに特長があります。
関連知財
木村晋太, 滝澤修, “テキスト整形プログラム、方法及び装置”, 公開特許公報, 特開2014-44289.