恒例のアクセス解析調査、第18弾。
調査期間は、[2005/12/1-12/31]。

過去の調査一覧はこちら。
NOBODY:PLACE - MUTTER / Tag Search: BotReport

WEB SERVICE
Comaneci
UA: Comaneci_bot/2.0 (+http://help.i-know.jp/?crawler) UA: Comaneci_bot/1.2 (+http://help.i-know.jp/?crawler) はてなアンテナと同じようなサービス。ていうかこういうのはパクリと言うんじゃ無かろうか。名前にしても。新機能をくっつけて『新しいもの』としてリリースするのは、どこの業界でも常套手段であるとは言え。 まぁそれより神経を逆撫でしたのは、アクセスの仕方。2.0がページにアクセスしてから、1.2がrobots.txtを読みに来るという…よくわからない動作。取り敢えず形だけは見ておきますね、と言ってるようなもんだ。

BOT/CRAWLER
Y!J-BSC
UA: Y!J-BSC/1.0 (http://help.yahoo.co.jp/help/jp/search/indexing/indexing-15.html) 前回取り上げた、Y!J-DSCと同じく、研究・開発・メンテナンスなどの目的で動くYahoo!Japanのクローラー。
Y!J/1.0
UA: Y!J/1.0 (http://help.yahoo.co.jp/help/jp/search/indexing/indexing-15.html) UA: Mozilla/4.0 (compatible; Y!J; for robot study; keyoshid) Y!J-DSC/BSCと同じように、Yahoo!Japanのクローラーだが、こちらは、普通のインデックス用かと。上のUAのクローラーがrobots.txtを確認し、下のUAのクローラーが、ページを読み、RSSを取得しているようだ。
StackRambler
UA: StackRambler/2.0 (MSIE incompatible) IP: 81.19.66.8 ロシアのポータルサイト?、『Rambler』のクローラーだと思われる。IPを調べるとまさにそこがヒットするし。でも、正直に言うと、全部ロシア語で書いてあるので、よくわからなかった(苦笑) robots.txtを読んで直帰。お利口さんである。
Theophrastus
Mozilla/5.0 (compatible; Theophrastus/1.2; +http://users.cs.cf.ac.uk/N.A.Smith/theophrastus.php) 説明によると…リンクをたどってWEB情報を集めるスパイダー、と言うことらしい。基本は何でもそうなんだろうけど、妙に古典的に聞こえてしまうのは気のせいだろうか。いや、いいんだけど。
MSRBOT
UA: MSRBOT Microsoft Researchが使っているクローラーらしい。目的は、研究のため、とのこと。なんだかなぁ。

SOFTWARE
RSS Popper
UA: Mozilla/4.0 (compatible; RSS Popper) Microsoft OutlookでRSS記事タイトルと概要を受信できるプラグインらしい。対応OSはWindows XP/2000。RSS/RDF/Atomに対応しているとかで、Outlookの人にとっては便利かもしれませんね。よくわかりませんが(無理にOutlookで読む必要があるのかは微妙)
CE-Preload
UA: CE-Preload どうやら、Cisco Systemsの製品、Cisco Content EngineによるPROXY処理らしい。おそらく、ですが。

Mizzu Labs
UA: Mizzu Labs 2.2 あんまりよくわからないが、IPアドレスは、Optimum Onlineというポータルサイトのものなので、検索目的のクローラーかなぁ、と思ってみたりして。でも、プロバイダ稼業もやってるっぽいので、そのユーザからのアクセスという方が可能性は高いか。とすると、何かのソフトウェアかなぁ。うーん。
Mixdelta
UA: Mixdelta 謎。ページURL自体には、普通のUAでアクセスしておいて、画像やスクリプトファイルなどに対しては、Mixdeltaという名前でアクセスする。やっぱり、何かクローラーだろうねぇ…
PayPal?
UA: PayPal Website Payment Pro, IPN Web Hosting, Free Scripts IP: jaylynn.escape.com よくわからないUAまたはクローラー。参照元はhttp://www.belahost.comと言うホスティング会社で、怪しさ全開。トップディレクトリにのみアクセスして帰ってますが…文章的には、なんかフィッシングくさいなぁ…
rolecot
UA: rolecot 謎。MUTTERのエントリファイルに直接、12秒おいて連続でアクセスしている。検索掛けてみてもヒットしなかったし。うーむ。

編集後記
年末は、多くのBOTが訪問してきましたが、 まぁあんまり種類的には大したこと無かったですね。 面倒すぎるので、2005年のまとめなんてのはやりませんが、 Yahoo!JapanやMSNのサービス変更で、検索クローラーだけ取ってみても、 かなり変化し、激化しているような気がします。 相変わらず、Blog系、RSS系、はてな系(RSSとサイト更新チェックの複合)など、 情報を取得整理するサービスは元気ですし… まぁでも、検索サイトがそうだったように、いずれこっちも淘汰されるんでしょうね。