日本語と英語、フランス語など、最大10言語で同時に話しても、それぞれきちんと聞き分けて認識します――。三菱電機は、複数人が異なる言語で同時に交わした音声をほぼ瞬時に、高い確率で認識できる技術を開発した。これまでの音声認識技術は、特定の言語だけに対応しているが、今回の技術は、国際空港など多言語が飛び交う場所で活用できそうだ。
唇の動き、AIが言葉に変換 円滑な会話を助けるアプリ
同社は、この技術を搭載した空港ロビー案内板(試作機)を使ったデモンストレーションを、報道向けに公開した。英語で「ネックレスを買いたい」、日本語で「中華料理が食べたいな」と同時に案内板のマイクに話しかけると、案内板に、英語で宝飾店、日本語で中華料理店の位置が同時に表示された。
今回の技術は、発音辞書など言語別の専門知識を必要としないことが特徴だ。
人工知能(AI)技術の一つで神経回路を模した「ニューラルネットワーク」を使った「深層学習」を利用。音声と文字列の時間的な対応関係を推定する方法と、文字列の音と文章のつながりを重視して推定する方法を組み合わせた。
複数の言語を学習させることで…