Googleを使った、ちょっとした遊び。
例えば、「日本語のほとんどのページを検索結果に出すキーワードは何か?」と考えたら、日本語のページであればほぼ間違いなく使っている『、』や『。』。しかし、Googleはこういった句読点などの有無で検索結果は変わらない。変わらないというか無視されてしまう。
その結果、『。』だけで検索すると何も入力しなかった場合と同じになってしまう。
これは、効率よくなるべく検索結果を出すべくして出来た仕様であり、自分で考えた長い文章でも極力似たページをだそうとするためのものである。同様に『(』『「』などの記号もまったく無視されてしまう。
上2つは、通常の検索と、検索後の前後に『"(ダブルコーテーション)』をつけることでひとつの連続したキーワードとして検索が出来る方法。これは後述。
下2つは、『「〜」』を文字につけた場合のつけない場合の比較。セリフとしての『「こんにちは」』を探したくても、『「』はなかったものとなり、これでは出てこない。同様に、『.(ピリオド)』『,(カンマ)』も同じ。
英語でも同じものがある。それは『to』をはじめとした接続詞や『A』などの冠詞など。しかし、英語の場合これら単体だけであれば、とりあえず検索結果が出てくる。
しかし、それに言葉を追加して、文章の一部としての「to」となるとまったく無視されてしまう。
- google:to my friend→『my』と『friend』が含まれる結果で、必ずしも『to my friend』ではない
しかし英語で違うのは、これを先ほどの『"(ダブルコーテーション)』で文末文頭をくくるとあら不思議、目的のものが出てくる。
- google:"to my friend"→『to my friend』と連続で書かれたページのみ出てくる
おまけの情報として、希望の検索キーワードの結果から、特定の文字を『含まないページ』を探したい場合は、その語句の前に『-』をつけると良い。
- google:はてな ダイアリー→「はてなダイアリー」も当然出てくる
- google:はてな -ダイアリー→「はてなダイアリー」は出てこず、その他「はてな」のサービスは出てくる
他にも、特定のサイトから希望の検索キーワードが含まれるページを見たい場合は、「site:サイト名(もしくはURL)」を検索キーワードに追加すると良い。
- google:分からない→Web全体から検索される
- google:分からない site:d.hatena.ne.jp→はてなダイアリーの中から検索
- google:分からない site:hatena.ne.jp→はてな全体(ダイアリーも人力検索もすべて)から検索
- google:分からない site:d.hatena.ne.jp/masahiror→ここの僕の日記の中から検索
ただし、Googleはロボット型で定期的な巡回をして検索結果に反映させているので、リアルタイムに更新されたページは引っかからないことに注意。特に上記のブログ中の文章を探す場合は、基本的に1週間以上前に更新したページぐらいからしか結果は出ない。そういうブログにおいてリアルタイムの検索をしたいときは、ブログ検索に特化したlivedoor Blogやgoo ブログ などのサービスを利用すると良い。これらは各種ブログサービスのPingやRSSといった仕組みを使って検索結果を出しているので、ブログに限れば1分もあれば反映される。
とまあ、ここは余談。
このような検索の仕組みを知ってるだけでも、Googleで欲しい情報の検索をしたいとき、今まで以上に高い精度で希望の情報を見つけることが出来るだろう。
そこで本題。「特定のWebサイトを探す」ではなく、「世の中のごく一般的で有名なサイトを無作為に探す」ということをやってみたい。前記のとおり、『。』などは無意味となってしまう。さらに、Googleは同じ検索ワードでも、適合率が高く、人気のページ、訪問者が多い、被参照率(外部からリンクを貼られた数)が高いページを優先的に出す仕様となっている。こうすることで、より目的に合ったページが上位に出るようにしているのだ。
それらを踏まえ、今回のミッションに合った検索キーワードを考えると・・・
『www.』
URL、URIは結構な確率でアドレス中に『www.』が含まれている。『www. +ドメイン名+.co.jp』などである。このワードで検索すれば、Web全体として「人気の高さ」ランキングを知ることが出来るんではなかろうか。もちろん、「www.〜」からはじまらな人気ページも多数あるだろうが、会社概要やサービスのポータルのページは大方「www. 〜」を用意しているので、そのドメインで行われている各種サービスも含めて、ドメインごとで人気サイト・訪問数の多いサイト・そのドメイン内のサービスでよく使用されるサイトなどが分かると予想。
早速、やってみた。前記のとおり『.(ピリオド)』は検索結果に反映されないので『www』のみで検索。
【ランキング一覧は今日現在(2005/11/21)の検索結果上位5位の順位】
google:www
しかし、これは「ウェブ全体から検索」した場合。「日本語のページを検索」で検索すると少し変わってくる。
"google:www(日本語のみ)"
- Yahoo!Japan
- asahi.com:朝日新聞の速報ニュースサイト
- 生活地図サイト MapFan Web - 全国どこでも簡単地図検索!地図と季節の ...
- Amazon.co.jp: 通販サイト 本、DVD、CD、エレクトロニクス、家電 ...
うーん、変わるものだ。Googleを使ったのに、1位じゃないし。ここは多少やらせでいいから、Googleが1位で出て欲しかったな。自分のところなんだし。まあ、そういう意味ではGoogleは公平と見ていいのかな?
Yahoo!が1位なのは納得。日本人としてまずYahoo!に行くのは納得だし、Yahoo!検索をメインで使ってる人も多い。自分のWebサイトのアクセス解析を見てても半分ぐらいはYahoo!の検索から来ている。他にもメール・オークションなどの人気サービスもあるから、やはり人は集まる。総合でも強いんで当然だな。
次に、日本ドメインであればよく使われてるであろう「co.jp」「ne.jp」「or.jp」「go.jp」あたりも調べてみる。
google:go.jp
ついでに「.com」。これも「com」と変わらないので「com」で。また、全体で検索すると外国のページがメインになるので日本語ページ検索。
"google:com(日本語のみ)"
- 【価格.com】 賢者の買物 〜価格比較・くちコミ・レビュー〜
- asahi.com:朝日新聞の速報ニュースサイト
- ドメイン 取るならお名前.com
- Amazon.co.jp: 通販サイト 本、DVD、CD、エレクトロニクス、家電 ...
- @nifty
やはり、軒並み有名どころが出てきます。「世間で有名なサイトが知りたい!」って時や世の中の動向を知りたいときなどは、こんな使い方もありかもね。特に「www」は使用される頻度も考えれば一番有効な検索キーワードだろう。