「選択と集中」で日本語に特化したことがカギ

『はなして翻訳』海外からも高評価

2013.01.11 FRI


『はなして翻訳』は、2012年冬モデルから対応するドコモのクラウドサービスだ ※この画像はサイトのスクリーンショットです
アップルのSiri、そしてドコモの「しゃべってコンシェル」と、音声入力による端末操作が多くの機種で利用できるようになったことで、スマートフォンを自動通訳機のように使うことも夢物語ではなくなってきた。

とはいえ音声認識と比べて、機械翻訳はまだまだ未成熟な技術だ。音声による発話はほぼ正確に認識してテキスト化できたとしても、それを自動翻訳することに困難があるのだ。現状の技術でできることには限りがある。だから対応言語や語彙範囲を絞り込んで、特定の用途での使い勝手を高めること――つまりは選択と集中を巧みに行うことが、会話翻訳アプリの完成度を高める秘訣になると、現時点では言えるかもしれない。

『旅行翻訳機』や『VoiceTra』は、旅行会話に特化することで語彙範囲を絞り込み、精度向上を図った例だ。前者は12カ国語、後者は6カ国語の音声入力に対応している。

NTTドコモの『はなして翻訳』は、英語・韓国語・中国語をはじめ、10カ国語の音声入力に対応しているが、片方の言語が日本語に固定されていることが大きな特徴だ。つまり、日本語を介する翻訳にしか使えないのだ。これは一見大きな欠点だが、日本語に特化することで対応力に差をつけたことに、ドコモの着眼の鋭さがあると考える。

その『はなして翻訳』は、幕張メッセで昨秋に開催された「CEATEC JAPAN 2012」で、「米国メディアパネル・イノベーションアワード」のグランプリを受賞した。国内開催のイベントではあるが、EngadgetやWired.comといった米国メディアの編集長が審査員に名を連ね、米国市場への影響力が高いと判断された技術・製品・サービスに与えられる賞だけに、価値は大きい。審査員コメントを約言すれば、「レスポンスの速さと翻訳品質の高さが(これまでの製品とは違って)実用の域に達したこと」が評価されたようだ。

具体的にはどこがすごいのか? 『はなして翻訳』は入力された音声をクラウドに送信することで音声認識から翻訳までを行うのだが、ドコモは音声の波形パターンと単語について膨大なデータベースを構築している。それを利用することで話者の意図をきめ細やかに解釈できることが、他社サービスと比較した際の強みだという。

日本語の会話では、一人称はもとより二人称までも省略されることが珍しくない。たとえば「カードで払えます?」や「煙草吸われます?」といった発言をそのままテキスト化しても、疑問符がなければ肯定文か疑問文かも、さらには動作主が誰なのかも判然としない。抑揚まで読み取ることではじめて、正しく文意が解釈できるのだ。

近年、日本市場はガラパゴスと揶揄されがちだ。海外で通用しない製品/サービスは、それだけで酷評されることも珍しくない。しかし翻訳というサービスは、作り込みの良さが結果を大きく左右するものだ。外国人と対面する緊張の場面では、ちょっとした対応力の高さがどれだけありがたいか分からない。現に日本語がらみの翻訳に関しては、『はなして翻訳』の方がGoogle翻訳より優れているという声も多い。

日本語の翻訳力が優れているということは、日本に滞在している外国人にとっても役立つアプリということでもある。『はなして翻訳』が駅やお店で使えれば、旅先での意思疎通がスムーズになり、日本語の難しさから訪日をためらっていた人の背中を押すことになるかもしれない。そういった観点からも、今後、同サービスがユーザーにどう評価されるか注目したい。
(待兼 音二郎)

取材協力・関連リンク

関連キーワード

注目記事ピックアップ

 

編集部ピックアップPR

ブレイクフォト