ハブ・オーソリティ理論でGoogleのページランクの例をお話しましたが、初期のGoogle Page Rankがクエリ(Query Word)に依存しないページ固有価値を算出する技術だったのに対し、近年では、クエリに連動したページ固有価値の演算がなされるようになっています。
分かり易く説明すると、3つの手順で算出されることで、よりテーマに沿ったページの固有価値を測れるようになっていると言われています。
1.検索キーワードに一致するページ群を抽出
2.抽出したページ群の中でハブ・オーソリティ理論に基づき参照重要度を計算する
3.計算された参照重要度とテキストのマッチング率をもとに最終的なランキングを決定する
この3つの手順を踏んで、特定QWに対するサーチリザルトが決まるのです。(これは個人的な解釈も入っていますのでこんなものではないだろうかという参考としていただければ幸いです。)
こちらのキモはまず利用者が入力した検索ワードに一致するページ群を抽出するというもの。その抽出されたページ群(いってみれば、キーワードで絞ら れたテーマについて言及されていると想定されるページ群)内でページランクをスコアリングします。よってテーマに関係ないページ群は除外されますし、同じページであっても、クエリ(Query Word)が変われば、ランキングも変動するということが言えますね。
Googleが用いているアルゴリズムにQDF【Query Deserved Freshness】、QDD【Query Deserved Diversity】というものがあります。
QDFは、ある一定期間にニュースやブログ記事などで特定のキーワードの出現頻度が急激に増えた際に話題のキーワードであると認識し、そのキーワードに関するトピックスを表示されやすくするもの。
QDDは、利用者の検索意図が明確でない場合に、1位以下に多種多様な結果を表示することで利用者の意図する結果を表示しようというものです。
必ずしも、1位以下にページランク上位のサイトやページが表示される訳ではないのです。
BIGワードと呼ばれる大半の検索クエリはこのカテゴリに属しますので、QW毎に検索者の多様な意図をいかに想定するかが重要であることがわかってくると思います。
このように現在の検索エンジンは、時流をリアルに反映させ、またユーザーのあいまいな検索意図に関して多様なページを推奨して利用価値を高めるビジネスモデルを構築しているといえます。
言ってみれば、検索結果にショボイサイトが含まれること、もしくはユーザーが意図しないサイトやページが含まれることは検索エンジンの死活問題ということが皆さんも簡単に理解できるのではないでしょうか?