恒例のアクセス解析調査、第15弾。
調査期間は、[2005/8/16-9/15]。

vol. 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14

BOT/CRAWLER
Dumbot
UA: Dumbot(version 0.1 beta - http://www.dumbfind.com/dumbot.html) 海外の検索サイト、Dumbfind.comのクローラー。趣味の良いインデックスなんだけど、まぁ英語サイトということで、ウリはよくわからん(汗)about dumbotに書いてある通り、robots.txtに従っているようです。
MaplogCrawler
UA: MaplogCrawler (+http://maplog.jp/) maplog.jpからのクローラー。前回も紹介しましたが、どうやら綴りが間違っていて修正した模様。ちなみに、クローラー用のページはありませんが、使い方によると、robots.txtに従うようです…本当かなぁ…。このサイトのrobots.txtに従うとしたら、アクセスしないはずなんですが、全く無視してRSSファイルにアクセスしてきています。説明なんて当てになりませんねぇ。面白そうなサービスなのにもったいない。
HooWWWer
UA: HooWWWer/2.1.3 (debugging run) (+http://cosco.hiit.fi/search/hoowwwer/ | mailto:crawler-infohiit.fi) 説明によると、データ蓄積を目的にしたクローラーらしい。実際の動作もrobots.txtだけを読んで帰っているし、とりあえず信頼できるようだ。収集したデータをどう活用するのかについては、不明だが。
NuSearch Spider
UA: NuSearch Spider www.nusearch.com 『NuSearch』という検索サイトのクローラー。きちんとrobots.txtに従うようです。
BlogRanking
UA: BlogRanking/RSS checker (http://blog.with2.net/) 見ての通りのクローラーだけど、なぜ急に来るようになったかは謎。


SOFTWARE

Mozilla/2.0 BBB/4.103 (BrightV/4.104)
UA: Mozilla/2.0 BBB/4.103 (BrightV/4.104)
謎。BrightVというのは、よくLinux系OSの解説に出てくるんだけど、僕にはよく分からない。アクセスを見た感じでは…普通の、検索サイトを利用して訪れた人のアクセスというように読めるから、Linuxベースのブラウザかなぁ、と。

\x8d\x06\x90\t\x8d\x06\b
UA: \x8d\x06\x90\t\x8d\x06\b 謎…と言いたいところだけど、このUAは、Lunascape 3.0.0 Betaでアクセスした人の最後に、favicon.icoを探して記録されているので、これはつまり、Lunascape 2.xにおける、『Luna』 と同じ動作ですね。エンコードめんどくさくて放っておくので、なんて書かれてるかはよく分かりませんが(何となく、最後のbは親指っぽい感じがするので、顔文字かなぁとは思うが)ちなみにこの他にも、\xd0\xa7\xc8など、さまざまなバージョンがある。多分全部同じ人。本当にうっとおしい。
PSP
UA: Mozilla/4.0 (PSP (PlayStation Portable); 2.00) 遂にご来店、PSPです。もちろん騙られてる可能性もありますが、一応このUAで間違いないらしいです。どうやって見えたか不安ですが…って、中身はNetFrontか。そーか、そーか…(参考:PSPwiki
IEFav172Free
UA: IEFav172Free 恐らく、IE のお気に入りに関係するプログラム(お気に入りを取り込んで更新情報をチェックする…とか)の、ver1.72なのでは…と思うけど、IEFavで検索してみても、unDonutのプラグインと、Microsoftの更新情報がヒットしただけで、有効な情報はなかった。んー…謎。ちなみに、アクセス対象は、今は存在しないページ(むかしオンラインゲームのサイトを作ってたことがある)に、HEADとGETリクエストを送ってきて、404で蹴られてる。挙動的には…上の仮説が正しい感じ。早いところ、ユーザは404に気付いて欲しいなぁ…
htdig
UA: htdig/3.1.5 (bogus@unconfigured.htdig.user) Linuxのソフトウェアで、Web全文検索システム「ht://Dig」用の検索ロボットとのこと。(参考:Linux Software [htdig])公式サイトは、http://www.htdig.org/。多分個々に設定できるんだと思いますが、取り敢えずこのアクセスはrobots.txtを読んで帰ってます。
Xyzzy
UA: www-0.0.1.4 on xyzzy-0.2.2.233 元々は、カスタマイズ、機能拡張にすぐれたテキストエディタ、だったものが機能拡張を繰り返して成長したらしい。というわけで、その中の一機能なんではと…。
AutoTaggerBot
UA: AutoTaggerBot/1.0 自動でタグを作成するBOT…かな?正体はよく分からないけど、多分そう。


SERVICE

2beeTrackBacker
UA: 2beeTrackBacker
『カメラ付き携帯で更新できる日記』からのトラックバック。多分。

BlogFan
UA: blog search engine by BlogFan.ORG (http://www.blogfan.org/) よくあるブログ情報収集サイト。RSSファイルを取得し、情報を羅列します。例によって、収集の拒否の仕方は明記されていません。bloggerは、拒否しないとでも思ってるんでしょうか。謎です。とりあえず、今後、必要と認めない、blogサービスからのアクセスは拒否いたします。さしあたって、BlogFan様には、.htaccessにて対処させていただきます。
googlebot-urlconsole
UA: googlebot-urlconsole 事情により、Googleに特定のページに対する処理依頼を出したのだけど、そのときに訪れたBOT。ページがあるかどうかや、METAタグの有無などを確認する。
BlogMasterCrawler
UA: BlogMasterCrawler/1.0 恐らく、BlogMasterというblogサービスからのクローラーであると思われるが…詳細不明。えん罪の可能性もあるので何とも言えないが、BlogMasterというサービスの管理者は、スパマーとして広く認知されているようだし、このクローラーは相変わらずいきなりエントリにやってきてるし、と言うことで、両者に関係あろうが無かろうが、遮断。ということで。
Kinja
UA: kinjabot (http://www.kinja.com) Weblog Searchサービスのクローラー。意外なことにきちんとrobots.txtを読んでます。



\x10=
UA: \x10=
謎。複数の階層でfavicon.icoにアクセスしようとしているんだけど…なんらかの収集系プログラムだろうか?

head-scan.pl
UA: head-scan.pl/1.0 名前で調べてみると、ポートスキャンに関する情報がつらつら出てきて驚くけど、直接これには繋がらないっぽい。謎。でも、トップページを舐めて帰ってるんだよなぁ…逆に不気味。
?
UA: ? 全くの謎。普通にページにアクセスしてるから、人の可能性も捨てきれないが…何となく、フィルタリングとか、メールアドレス収集とか、そういうBOTな気がする…あくまで勘なので、何も根拠はないけれども。
unknown
UA: unknown 尼崎市役所からのアクセス。unknownっていわれても…(汗)謎。
eva00@NERV
UA: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; eva00@NERV) こんなこと書かれると、愛好者の方は気を悪くされるかもしれませんが…イタイ(汗)あ、わかんない人はわかんなくて良いです。ブームになった頃、ちらっと見て覚えてるだけですから。僕も。でも、ネットで検索すると、UA統計が引っかかるんで…もしかしたらこういう名前のUAを出す、プラグインやスパイウェアがいるのかも。謎だけど。
Ferret
UA: Ferret フェレット (英:ferret) は、イタチ科に属する肉食性の哺乳小動物である。 イタチの一種であるヨーロッパケナガイタチから家畜化されたもので、古くからヨーロッパで飼育され、現在は世界中で飼われている。 狩猟、実験、毛皮採取、愛玩用に用いられる。 同じイタチ科の仲間には、ほかにイタチ、カワウソ、アナグマなどがある。

体長は、成体で35?50cmほど。メスの方が小さい傾向にある。 毛色はさまざまだが、野生のヨーロッパケナガイタチと異なり、一般に白色か薄い黄色であることが多い。 寿命は6?12年である。(フェレット - Wikipediaより)

…だから違うって。

CE-Crawler
UA: CE-Crawler-01 UAで検索しても特にヒットしないんで素性は全く謎だなぁ…と思ってたら、Community Engineからのアクセスだった。gumonjiとか作ってる会社です。Community Engine → CE-Crawlerと。あー。ガッテン。ガッテン。ガッテン。と言っても、別に何してるか分かったわけじゃないんですけど。いきなりディレクトリにアクセスしてきてるので、遮断する方向で。
NetCrawler
UA: Mozilla/5.0 (Macintosh; U; PPC Mac OS X; ja-jp) NetCrawler/1.3 謎。ていうか、こんな名前で見つけられるわけがない…なぜ、MacのUAに寄生しているかもよくわからない。


総括

あまり数が多くなかったので、期間を倍にしてみました。
そういうわけで久々の、集計結果ですが…
相変わらずblog関連のクローラーが多いね。
そしてご多分に漏れず、適当な動作。やれやれ。

それにしても、ずっとよく分からないコード(日本語か顔文字かな…しかも毎回違う)で
アクセスし続けてる方、
気になるんで何とかして欲しいんですが…