日本を囲む「言葉の壁」。自動翻訳も例外ではありません。開発の国家プロジェクトを率いる隅田英一郎さん(63)は、性能がなかなか上がらない冬の時代を長く経験してきました。「ここで春が来てほしい」と願います。
AI・プログラミング…文系は負け組なのか 識者に聞く
さまざまな言語の音声自動翻訳の実現にチームで取り組む。中国、インド、カンボジア、ミャンマー、フランス――。研究員の出身地は多彩だ。「ぼくは『放牧主義』。研究はだいたいこの方向で、と言うだけ。見ているだけで楽しいから」。笑顔で語る。
京都府精華町にある国立研究開発法人情報通信研究機構・先進的音声翻訳研究開発推進センター。ここで、2010年から音声自動翻訳アプリ「ボイストラ」の開発を進めている。
「なにかお困りですか」「切符の買い方が分かりません」。アプリをダウンロードしたスマホに話しかけると、文章ごとにすぐに流暢(りゅうちょう)な外国語の音声が流れる。いまは31言語を翻訳でき、このうち16言語は音声で入出力できる。
「研究が役立つなんて、めったにない。ありがたいことです」
東京五輪の開催が13年に決まると、翌年、研究は突然、国家プロジェクトに「昇格」した。「言葉の壁がない社会」をつくるためだ。時代も追い風になった。訪日する外国人は10年の861万人が昨年は3119万人に。技能実習生に頼る職場も増えた。
ここまでの道のりは長かった。
自動翻訳の研究を始めたのは1983年。日本の経済成長に伴い、経済摩擦が政治問題になりつつあった、欧米から「日本は金をもうけるだけで、情報を出さない」という批判が高まっていた。「せめて学術論文の要旨くらい自動翻訳できるようにしようと、企業の若手研究者らが京都大学に集められました」。研究チームの一員になった。
これをきっかけに、企業もこぞって研究プロジェクトを立ち上げた。ところが、ブームは5年ほどで終わる。要旨は翻訳できたが、会話にたどりつけなかった。
「当時は文法と単語をコンピューターに覚えさせ、翻訳させていた。でも、人は文法通りにしゃべらない。完全に失敗しました」
それなら原文と訳文をまるごと覚えさせ、翻訳させてみたらどうか。90年、こうした「用例」に基づく方法の有効性を実証し、研究の流れを変えた。
しかし、翻訳の性能は上がったものの、そのペースは次第に鈍っていった。「芽を出すと風が冷たかった、というのはつらい。でも研究はそんなもの。みんなに喜んでもらえるようなものをつくりたい。そう思って続けてきた」
状況が一変したのが、AI(人工知能)と、人間の神経回路網を模したニューラルネットワークの登場だった。ボイストラも2017年、AI翻訳に移行する。
「ニューラルネットは論理ではない。いい絵をたくさん見ると、いい絵がわかるようになるようなもの」。だから性能向上のため、企業や団体に呼びかけ、原文と訳文のセットを提供してもらっている。目標は「1億セット」だ。
東京五輪まで、あと1年余。「課題は山のようにあります」という。アプリをダウンロードしたり、操作ボタンを押したりする手間を省き、電源を入れるだけで使える翻訳機をつくりたい。最終目標は同時通訳だ。(上田俊英)
プロフィール
すみた・えいいちろう 1955年、札幌市生まれ。電気通信大学大学院修士課程修了。82年、日本IBMの研究員となり、自動翻訳の研究を始める。86年に音声自動翻訳の最初の国家プロジェクトが立ち上がると、研究チームに参加。92年、国際電気通信基礎技術研究所研究員。2007年に情報通信研究機構に移り、現在フェロー。東京五輪に向けて「日本全国、どこでも使える」音声自動翻訳システムの実現を目指す。