WWWは世界大百科辞典


2種類の検索方式

 2002年当時、日本のサーバーに収納されているWebページ数(いわゆるホームページのページ数)は、だいたい6600万ページくらいだったと言う。もっとも、近年、その増加率は鈍化しているとも聞く。
 しかし、それにしても、これはすごい数で、この数を見ると、WWWを利用すれば、世界中のありとあらゆる情報を入手できるのではないかとさえ思えてくる。
 当然、自分の研究テーマとかかわるデータがどこかに蓄積されている可能性も高い。

 問題は、このような膨大な情報の中から、いかに必要な情報をすばやく、しかも確実に見つけだすかである。

 そのための仕組みとして、サーチエンジンがある。
 サーチエンジンには、大きく分けて、ロボット系とディレクトリ系の2種類の方式がある。


ロボット系

 ロボット系検索サービスは、コンピュータによって自動的に全世界のデータを収集して、目的のサイト名を表示する。

 この方式では、探したい情報に関するキーワードを入力することによって、目的のサイトを検索する。
 つまり、これは、情報の内容や主題を検索するのではなく、キーワードの文字列を検索するものである。
 比較的マイナーな事柄を調べるのに役立つ。

 この方式の長所は、情報量が多いということである。
 一方、その裏返しの短所として、検索結果があまりに多くヒットしてしまい(しばしば何万件ものヒットがある)、目的のサイトを絞り込むのに膨大な時間がかかるということがある。
 また、適切なキーワードを入れないと、必要なデータを洩らしてしまうこともある。
 日本語の場合、表記の違いも考慮に入れなければならない。
 したがって、どのようなキーワードを入れるか、どのような絞り込みをするかという点の工夫が重要である。
 一語だけの検索で終わらず、可能な限りさまざまな語を試してみるのがコツであろうか。

 現在(平成17年春)、このタイプのサーチエンジンは、次のものがほとんど独占状態である。

●Google


ディレクトリ系

 サイトを細かいジャンルに分類して、それを階層構造によって整理してあるのがディレクトリサービスである。

 この方式では、大まかな分類から細かい分類へと階層が下ってゆくのをたどることにより、目的のサイトを検索する。

 この方式の長所は、探したい分野やテーマだけは決まっているが、探すべきサイト名などがわからない時に、その分野・テーマに関するサイトを一挙に見つけることができる点にある。
 また、比較的良質な情報だけを見ることができる点も長所。
 一方、サイトの分類や、データの登録が人手によってなされているために、ある種の曖昧さの生ずるところが短所である。
 また、人手による作業が不可欠なため、そのデータ量が少ないのも欠点。

 なお、ディレクトリ系のサーチエンジンにおいても、キーワードによる検索機能はある。
 ただし、これは、タイトルやコメントなどに含まれる語などの検索に限られており、ロボット系検索のように網羅的なものではない。

 現在(平成17年)、日本におけるディレクトリサービスとしては、次のものが代表的存在。

●Yahoo!


メタサーチ

 どのようなサーチエンジンがあるかを調べるためのサイトもある。

 サーチエンジンを集めて、一つのキーワードを入れると、いろいろなサーチエンジンで探してくれるページもある(メタサーチ)。

●検索デスク


←目次へ