コンピュータが文章の内容まで解析するらしい

検索の進化型!?  「テキストマイニング」って何だ?

2008.08.01 FRI


従来のキーワード検索と違い、必要な情報を整理して集約できるのがテキストマイニングの特長。これにより、例えば、今までひとつひとつ内容を確認しなくてはならなかったフリーアンサー形式のアンケートなどが内容別に集約できるようになるなど、効率的な検索が可能になった 後藤亮平(BLOCKBUSTER)
情報量が日々増え続けていくウェブの世界。その数の多さに、検索してもあまり関係のない情報にたどり着いてしまうなんてこともたまにあったり。

どうすれば、必要な情報を効率的に検索できるのか? その答えのひとつとして、最近「テキストマイニング」という技術が注目されています。あまり耳慣れない言葉ですが、いったいどんな技術なのでしょう?

テキストマイニングを利用したウェブマーケティングを行うブログウォッチャーの言語解析スペシャリスト ・村山紀文さんに伺うと。

「テキストマイニングとは簡単にいえば、文章の特徴を見つけ出す手法。一般的なキーワード検索は、その単語を含むサイトを引っかける手法なので、内容までは絞れず目的外の情報にたどり着くこともありますが、テキストマイニングは文章の内容をコンピュータが解析するので、必要な情報を絞って集めることができるのです」

文章の内容をコンピュータが解析!? それは、どんな方法で?

「基本は統計です。テキストマイニングは主に企業が利用するサービスですが、例えば、ある化粧品会社が自社製品のネット上での評価を調べようとした場合。まずはブログや掲示板のコメントなど、文章中の製品名の頻出度を調べ、次にその前後に並ぶ言葉との関連性を見ます。そこに使いやすいや安いなどの言葉があれば好評で、その逆の言葉が並んでいれば不評ということをコンピュータに覚えさせるわけです。その評価例をコンピュータが記憶することで、以後、その製品についての文章をウェブ上で見つけた場合、書かれている内容を判断し、評価を振り分けてくれるのです」

このような文章解析の研究は10年くらい前から行われていたそうですが、近年、ブログの普及などウェブの情報量が飛躍的に増え、その取捨選択が困難になってきたことにより、テキストマイニングに注目が集まるようになったのだとか。

現在ではスパムメールのフィルタリングに利用されるなど、意外と我々にも身近になりつつあるこの技術。将来的に、僕らのネット生活に直接関わりを持つこともあるのでしょうか?

「まだまだ研究段階ですが、テキストマイニングの応用により『渋谷のウマいラーメン屋ってどこ?』なんて質問にパッと答えてくれるような自然文検索が可能になるかもしれませんよ」

それはスゴい!! もしかしたらテキストマイニングって、この先、僕らにとってなくてはならない存在になるのかもしれませんね!

関連キーワード

注目記事ピックアップ

 

編集部ピックアップPR

ブレイクフォト