ピックアップ,最新動向,突撃!マット・カッツ

グーグルは、その道の権威と単なるポピュリズムをどう判別しているのでしょうか?

2014年04月05日 ネズミ1号:略称「T」
, ,
このエントリーをはてなブックマークに追加

film.png今日はブライアン君5歳、カリフォルニア州サンフランシスコからの質問です。「グーグルはソーシャルシグナルをアルゴリズムに反映させるようになっているようですが、単に受け狙いで迎合しているのと、真のオーソリティをどうやって見分けているのですか?」
matt:
グレートな質問ですね。ただし、グーグルがソーシャルシグナルをアルゴに使ってきているという前半の質問がありましたが、ここでは、真のオーソリをどう見分けているのか?という後半の質問を中心にお答えしましょう!



matt:このテーマについては本当に良く考えさせられますね。というのは以前ページランクに関して書かれた記事で、「ページランクとは、Webサイトのポピュラリティを推し量る指標だ!」なんて書かれていたりしたことがあるんです。こんなこと書かれるとストレスが溜まるんですが、これは明らかに「間違い!」ですね。

例えば、ポルノサイトです。ポルノは、ポピュラー(実は多くの人がこそこそ見ている)でしょうが、誰も自分のサイトからポルノサイトにリンクを張りませんよね。一方で、例えば、ウィスコンシンにある不動産会社のボードには張るかもしれませんね。
なので、「ポピュラリティというのは、多くの人が訪れるのではなく、少ない人数でも政府のサイトにはリンクが張られている」つまり「ポピュラリティというならば、ある意味多くの人が見ているというもの、一方で、ページランクは信用や評判を推し量るもの」と言えますね。より多くの人がリンクを張って引用しているページやサイトはより信用があるというイメージですね。

matt:もうお分かりでしょうか?ポルノサイトの方が政府のサイトよりもページランクが高いなんて不相応なことがおこったら困りますよね。だから僕らは多くの人が見るというのでなく、信頼できる政府のサイトへ張られているリンクの方を見るようにしているんです。

matt:はい、では本題に移りますね。単なるポピュラリティと真のオーソリティをどう判別するかについてですが、例えばここまでにお話したページランクのことを思い出してください。例えば、マットカッツについて書かれている(述べている)ページがあったとしましょう。そこに張られているリンクで、マットカッツについて述べているページからの引用リンクがどれぐらいあるかがポイントです。リンク元のページのトピックやテーマ、リンク先のページの内容、トピックが合致していて、そのテーマがマット・カッツだということが分かり、かつそうしたマットカッツに関するページからのリンクが多かったとしたら、そういうサイトはマット・カッツについての専門家サイトだということが判断できると思います。

matt:このように、ページランクにおけるポピュラリティは単にリンクが多ければ良いということではなく、よりTopical(テーマが合致したリンク)が重要になるということです。例えば、医療分野だとかトラベルなど、僕らはリンクに対して+αのシグナルを見ているんです。例えば、旅行に関係したアンカーテキストが張られているけど..これはどうなの?とかですね。これはハードなことなのですが、同時に面白いテーマでもあります。アルゴリズムの改善によりこうしたことがより確度高く見つけ出すことができるようにしたりすることはとてもエキサイティングなことですし、日々僕らは一生懸命この分野について働いているのです。

普通の人ならばこのサイトは有名なサイトだからクエリーワードについてこれはベストだ!と言いたくなるでしょうが、僕らは、いやこのサイトは、何からしらメディカルなクエリーに対してランクできるいくつかのエビデンスがあるからメディカルなトピックを検索していると思われるクエリーに対して高ランクにすべきだ!という見方をしているのです。

こうしたことを適切に判別するためにも常に品質を改善しているのであり、アルゴリズムの更新もそうした目的で日々行っているのですね。いかがでしょうか?

ねずみ小僧:ペンギンなんかでは、リンク元のサイトやページの内容をある程度把握するアルゴリズムなどが適用されたとも言われていますが、単なるポピュリズムとその道の真の権威を判別するというのはグーグルにとっては重要なテーマといえるのでしょうね。ただ一方で、グーグルの基本はページランクというハブ・オーソリティ理論(HITS)を基に信用度や評判をスコアリングするとういう考え方が基盤にあるということを改めて認識させていただきました。ソーシャルシグナルというとグーグルの場合はGoogle+になると思いますが、以前MarkTraphagen氏の考え方に共感して紹介した「「Google+ボタンを押させればいいわけでない!」に書いたように、「その道のプロ同士のお付き合いが重要!?」のような感じで単なるポピュリズムな件と真のオーソリを判別しているのかもしれませんね。ソーシャルシグナルに関するポピュリズムとオーソリの判別方法に関する質問だったので、是非この部分も答えていただきたかったですね。

PS:1週間ほど数か国に出張に行ってましたため更新が滞っておりましたが、シンガポールでとあるカンファレンスに出席した際、法律面やプライバシー面、ビックデータなどの今後の扱い方など含め、話題は、常にモバイルが中心だったことが印象深いです。ガラパゴスの時代と違い、法律、ビジネスルール面でも、アジアでもASEANフレームワークほげほげなるものが、当然、米国、イギリスもちゃっかり仕切っておられましたが、今年から来年にかけて対話型文脈でのI/Fやセンサリング技術の発展による識別、Microsoft社の方針転換、PC出荷台数が3億台をキャップに下降、激安Chromeノートのエマージングマーケットでの普及のきざし?やら検索文脈にもここ3年ぐらいでちょっとしたパラダイム・シフトが起こるかもしれませんね。香港にも立ち寄りましたが、しばらく出張は許してもらえるかな...と思いきや多言語系サービスの新規プロジェクトの担当になってしまったのでちょっとしたサプライズもありましたが、まぁ無茶ぶりはサラリーマンとしては致し方ないことですから、日々是決戦の精神をもってがんばらないとと思う週末でした。

, ,


関連記事