ピックアップ,最新動向,突撃!マット・カッツ

WebSpamチームは全世界で同じ指標でスパム判断しているのですか?

2013年08月06日 ネズミ1号:略称「T」
, ,
このエントリーをはてなブックマークに追加

film.png今日の質問は、カリフォルニア州マウンテンビュー匿名希望さんからだ。「Webspamチームは、全世界で同じ指標でスパムを判別しているのですか?たとえば、同じ英語を使う国のケース:インドとアメリカとで本当に同じ基準でRatingされているのでしょうか?”google.co.in"(Googleインド)で検索すると"google.com”に比べて1ページ目にしょぼいサイトが多いように思うのですか...」

matt:はい、グレートな質問ですね!思い出してください。ウェブスパムチームは、技術者中心のアルゴリズムチームと、マニュアルオペ要員で構成されるマニュアルオペスパムチーム2つのチームが連携して全世界でSpam判定業務を行っているんだ。



matt:そうだねぇ。google.comとgoogleインドでの検索結果についての質問だけど、基本的には、どんな言語についてもボーダレスで、アルゴリズムについて統一なソースで運用できるように体制を敷いている。僕らは、英語だけでなく、その国々で母国語を自由に扱えるスタッフを各国に抱えているんだ。そーだね。現時点で40ヶ国語に対応できる配置で全世界で展開しているよ。

matt:質問の趣旨に答えるとすると、確かに英語圏のスパム、特にアメリカのgoogle.comなどのスパムについては、多くのスタッフが注目することはあるかなぁ。だって、エンジニア全員がフランス語とかドイツ語とか、特定の第2外国語を自由に扱えたり理解できるわけではないからね。だからどうしても英語のspam事例に目を捉えられがちなことはあるかもしれないね。

matt:でも、アルゴリズムは国際標準が基準という点ではこれが僕らのポリシーだから、もし他の国の言語圏で「ちょっと品質の悪いSERPSだよ」とか、「これおかしいんじゃない?」ってのがあったら、フォーラムとかでチクって(いやいいすぎですね、フィードバック)ください!直接@でTweetしてもらってもOK!僕らは必ずキャッチするから。
そうしてアテンションを投げてもらえると僕らも特定な事例やケースに目を向けてアルゴリズムがよりよくなるように日々努力させてもらうから!!

ねずみ小僧:マットさん、Googleは品質フィードバックに関しては、+groupやCommunityをはじめTweetまで気軽に皆さんのフィードバックを受け付けているのですね。逆にいうと、そういったフィードバックが世界中からもらえるGoogleさんはうらやましい限りです。

各国ごとに母国語を扱えて、英語ができるスパムチームさんがいて、アルゴリズムを検証したり、アルゴリズム調整後のSERPSに関してSide by sideやQWのインテンションについての類推判別データを検証するRaterさんがいて、それを束ねるモデレーターもいて、おまけに、ユーザーからのフィードバックも集めて日々改善されているというお話を聞くと、やはり他社がなかなか追いつけなかったのもわかるように思います。それから忘れてましたが、クロール後インデックスする際のNLP(自然言語)処理スタッフも当然いらっしゃることと思います。こちらも各国言語ごとにどれぐらいチェックする方がいるのか是非!おしえてください。形態素解析精度の評価も重要ですからねぇ。

あと、インドなどで特定QWにおけるSERPSでしょぼいページが多いというのは、まだそこまで競争が激しくないということも言えるように思いますが、そこは偉大なエンジニアにしてスパムチームのスポークスマンですね。

模範解答ご立派でした!m(_ _"m)ペコリ

, ,


関連記事