連載 Tourism Informatics (TI) の試み(45)
おきなわ観光情報学研究会


検索エンジンの現状と問題点

おきなわ観光情報学研究会・當間愛晃(琉球大学工学部情報工学科・助手)

情報検索技術にみる研究シーズ(3)

 暫く間が空いてしまいましたが、前回の記事「情報検索技術にみる研究シーズ(2)」(*1)に関する近況をご報告したいと思います。以前の記事で述べたことを整理しますと、

 ・観光商品は「時事性」「地域性」「人間性」「リピート性」が混在しているために評価が日々変化するものであるため、取り扱いが難しい。

 ・一つの解決案として、「情報発信源に一般ユーザ(口コミ)を加えた人間味溢れるコミュニティサイト的なシステム」を構築することでそれらを考慮した情報提供(PR)に活かすことが可能である。

 ということを提案し、上記を実現するためには解決すべき研究シーズが多数あるという話をさせていただきました。今回はその中の一つ「類似性を計算する自然言語処理技術やメタ情報付加技術」における具体的な問題点を紹介したいと思います(解決策は次回!)。

 インターネット上において情報を検索するといった場合、一般的には(1)検索対象となる名詞が含まれているページを探す「キーワードマッチング方式」により関連のあるページ群を列挙し、(2)その中から適切だと思われるページに絞り込むためにキーワードの出現数・優良サイトからのリンクの有無、といった付加情報から点数を付けていき、(3)高得点となるページから順に表示するといった処理を行うことになります。この手続きのうち、(2)において優れた精度で出力することが出来る事でGoogle(ぐー ぐる)が世界的に広まり、今では「ぐぐる」という言葉が「検索する」を意味するほどに一般的に使われつつあります。

 そのぐらい強力(便利)な検索技術が実現しているにもかかわらず、近年各国ではこぞって検索エンジン開発のための大型プロジェクトが動き始めています。日本でも「情報大航海プロジェクト・コンソーシアム」が立ち上がっており、2007年2月の時点で91もの団体が参加するという極めて大規模なプロジェクトとして動いているようです(*2)。これほどまでに検索エンジンの開発が求められている理由は様々ですが、「検索技術」に対する要求が年々高まっている点が大きいでしょう。

 では、「検索技術」に対する要求としてどのようなものが考えられるでしょうか。言い換えると、現状の検索エンジンを使っていて、どういう点で不満があるでしょうか。私の考える解決して欲しい点を列挙すると以下のものがあります。

 (1)[キーワードの問題]調べたい対象に関する適切なキーワードを思いつかないと、いつまで経っても知りたい情報にたどり着かない事がある。

 (2)[検索精度の問題]検索後に出てくるページを一つ一つ見ていかないと、本当に調べたい情報にたどり着かない事が多い。

 (3)[情報分散の問題]調べたい情報が一つのページに載っているとは限らず、複数ページに跨って分散している事が多い。

 次回は、ここで挙げた問題点を解決する一手法について紹介したいと思います。

(*1)情報検索技術にみる研究シーズ(2)

 http://www.sokuhou.co.jp/library/TI/TI28.html

(*2)検索エンジン開発のための大型プロジェクト

 「情報大航海プロジェクト・コンソーシアム」の事。

 参考記事

 (1)国産検索エンジンはなぜ必要なのか?‐経産省担当者に聞く

 http://japan.cnet.com/interview/story/0,2000055954,20151767,00.htm

 (2)「Googleを超えたい」産学官が次世代検索エンジン開発のコン ソーシアム設立へ

 http://itpro.nikkeibp.co.jp/article/NEWS/20060616/241148/

 (3)情報大航海プロジェクト・コンソーシアム

 http://www.jyouhoudaikoukai-consortium.jp/

(「観光とけいざい」第720号07年4月1日号)


 |  連載46 |  HOME |
本ホームページに掲載の記事・写真の無断転載を禁じます。すべての著作権は沖縄観光速報社に帰属します。
Copyright (c) 1996 Okinawa Kankou Sokuhousya. No reproduction or republication without permission.