検索エンジンの本質

検索エンジンの歴史(初期の検索)

2013年05月10日 ネズミ1号:略称「T」

このエントリーをはてなブックマークに追加

ディレクトリー型とロボット型

SEOについて語る前に、基本に立ち返って、そもそもネットワーク上で役に立つページを探す行為と検索エンジンについて歴史をさかのぼり私なりの解釈と理解を述べたいと思います。これはあくまでも個人的な見解も含まれていますので、解釈の間違いなども多々あることと思いますが、検索について本質的な理解を深めるためのキッカケとなればと思います。



まずは、下の動画を見てみてください。これはインターネットの検索の巨人となったGoogleがGoogleI/Oで流した今のウェブが誕生するまでの動画です。

動画を見た感想はいかがでしょうか?インターネット検索の巨人Googleが登場する以前も、勿論、ウェブの世界はありました。Googleの登場は現在のウェブ世界が成り立つ上で重要な影響を与えたといって過言ではないです。
SEOについて語る前に、過去にさかのぼり検索エンジンが誕生するまでのウェブの基本的な流れや必要性などについて知ることが検索エンジンの本質についての理解を深める事になると思いますのでしばしお付き合いください。

ウェブ初期は人手でサイトを整理していた!
ディレクトリ型のポータルサイト

ディレクトリ型というとYahoo! やOpen Directoryをご存じの方も多いと思います。便利なサイトや有益なサイトをネットサーファーやボランティアが電話帳のように登録し整理されていたも のを思い浮かべる人も多いでしょう。ウェブ初期の時代、まさに価値のあるサイトや公共性のあるサイトなどを自主的に集めて整理していたんです。まだまだ ホームページ自体が少なかった頃はこうした手作業によるディレクトリー型のサイト(ポータル)が主流だったように思います。

しかし、次第にインターネットが普及し、日々何千、何万ものサイトやページがネットワーク上に公開されるようになると人手による整理には限界が出てくるもの。そこで登場するのがロボット型検索エンジンです。

ロボット型検索エンジンは膨大なウェブ世界を
自動的に整理し探がせるようにしようとした試み

ロボット型検索について。namazuという全文検索システムがありますが、個人的には、ロボット型検索はこのnamazuの発想その物だと考えていま す。簡単に言うとnamazuは、全文検索したい場所にあるファイルをまずはindex化し(mknmz::といったコマンド)、index化されたド キュメントを全文検索できるようにするアプリケーションです。検索結果ページの機能としては、namazu -sort:score,date,などと指定することでヒット数やファイル更新日順に検索結果をソートできたものです。

ロボット型検索エンジンは、まさにnamazuのようにネットワークに点在するWebサーバー上にあるドキュメントをクロールしてインデックスすることで、簡単に探したいページや文章を検索できるようにしたものと言えます。

初期のロボット型検索エンジンはこんな感じだった!?

初期のロボット型検索エンジンについては、キーワードとAND、ORなどの論理積や論理和などでインデックスを検索し、ヒット数やページの更新時刻などを見て新しいものから表示すると言ったものだったと思います。

日本では、人手で整理されたディレクトリー型検索エンジンにロボット型がミックスされたポータル化の流れが1990年代後半から2000年初期まで主流だっ たようです。しかし、検索という行為が一般化される中で検索結果の表示順位を各社どう差別化してユーザーを囲い込むか?各社凌ぎを削ることになるのです。 ディレクトリー型、ロボット型ともに共通して言えることは、利用者が意図している役に立つページやサイト・文章を効率的に検索結果やカテゴリなどで整理されたポータル上で如何に簡単に見つけて貰えるかという1点で切磋琢磨していたと言うことです。

最近になってホワイトハットという言葉がクローズアップされていますが、そもそも論で言うと、SEOという言葉自体、実はナンセンスであると言う事がようやく世間一般に認識されるまでの技術発展がなされたと解釈してもいいでしょう。
SEOという名の元に実力がないのに、お金を払って裏口入学するような対策から検索結果に表示されるべき有益な情報を有しているサイトを作るという流れが今の主流となりつつあるのです。

だだ、まだまだ裏口入学まがいな手法は後を絶たないかもしれません。しかし、今後検索エンジン企業の精度が上がり続けることで、当然いつか「あなたは、裏口入学しましたね」とペナルティを受けることは誰もが想像できることだと思います。

| コメント(0)


関連記事