清水さんのこちらのエントリを読んで。

ちょっと衝撃を受けたのでブログします。

先ほど、テレビ朝日の「爆笑問題の検索ちゃん」という番組から電話がかかってきて、2005年に僕が日刊ゲンダイの記事の中で「人気ブログをつくるには、"つれづれ"というタイトルは数が多く埋もれてしまうのでできるだけ避けるべき」と説明していることに対し、具体的・数値的な根拠や資料はあるのかという問い合わせが来ました。

しかも今日中に回答しろということです。
 

テレビ朝日の情報収集能力の低さには呆れるばかりですが、
(要は責任をソースに丸投げしたい、それを保証してくれるソースが欲しいってことでしょう)
それはともかくとしてこの大元のお話、

人の記憶に残っても「つれづれ」などのありふれた言葉をタイトルに使っていると、検索して見つけてもらえる可能性が低くなってしまうのでタイトルとして採用するべきではない

この件について清水さんがおっしゃっているようなことは、そういえばあるよねーと。
簡単に言えば、一般的すぎる単語を用いたものは検索の海の中に沈むことが多いってことね。
ここ4年くらい、このサイトを訪れたクローラーの調査をしてるんですが。

BOT - NOBODY:PLACE - MUTTER

やっぱりUserAgentにもいろいろありますね。


メジャーどころでわかりやすいところと言えば…このあたりとか。

Baiduspider+(+http://www.baidu.com/search/spider_jp.html)

UserAgentの場合は、URLを織り込むことが出来るので余計にわかりやすいです。
検索エンジンに頼らなくても誘導できます。


逆に普遍的な単語を使っているものも結構あります。
例えば実際にあるヤツでこんなのとか。

BubbleGum/4.0

音楽関係のデータに埋もれてなにがなんだか。
せっかくサービスを作ったとしてもこれだとねぇ…まだ造語の方がましです。

ただ、こういうヤツにはSPAM系が多いです。
SPAMブログは露出しないと話になりませんが、
SPAM目的のBOTはなるべく隠密に行動できるのが良いので、
検索しづらいヤツを選ぶんでしょう。きっと。


…それなら単にIEのUserAgentを騙ってればいいのに、ついつい名前を付けちゃうのは…
やっぱり開発者のサガってヤツなんでしょうかねぇ。