「音声検索」はまだまだ序の口だ!

音声認識テクノロジーの進化で「同時通訳電話」も登場間近!?

2011.06.02 THU


最近のIT業界で、ホットなキーワードのひとつが「音声認識」。スマートフォンのCMでも紹介されていた「Google音声検索」をはじめ、音声認識技術を応用したサービスが続々と登場している。数年前までは、カーナビで目的地を入力する際に利用される程度だった音声認識。それが、ここにきて急速に実用化が進んだのはなぜか? 「同時通訳電話」など、音声認識技術を応用したサービスの研究開発を行っているドコモR&Dセンタの飯塚真也氏によれば、「認識技術自体の進化」に加え「ネットワーク技術の進化」「通信回線の高品質化」が、音声認識系サービスの発展を支える要因だという。

「最近の音声認識系サービスの特徴といえるのが、認識処理を端末本体ではなくクラウド上などのサーバーで行っていること。これにより、端末の性能に影響されず、高度かつ多様なサービスが提供できるようになりました。もちろん、こうしたサービスを提供するためには、高品質な通信回線の存在も重要。サーバーとのやり取りが高速に行えるだけでなく、きれいな音声が送れることで、認識の精度も向上するわけです」

つまり通信機能さえあれば、スマホに限らず一般の携帯電話(フィーチャーフォン)やゲーム機などでも、同様のサービスを提供できるわけだ。さらに、サービスの進化により、音声認識のネックともいえる「人前で使うのが恥ずかしい」という難点も解消され得るという。同センタの小栗伸氏によれば、

「現時点では、『六本木 カフェ』というように、キーワード単位で入力をするサービスが中心ですが、今後人と会話をするような自然さで入力ができるサービスが登場すれば、恥ずかしさも緩和されるのではないでしょうか?」

とのこと。発声内容からユーザーの意図をくみ、最適な検索を行うアプリもすでに登場。対話で機械を操作するのが常識となる日は、目前に迫っている!?
(石井敏郎)


関連キーワード

注目記事ピックアップ

 

編集部ピックアップPR

ブレイクフォト