不定期連載のBOT類調査。(→前回
今回の期間は2月上旬?3月上旬。

新規発見物と、アクセス制限の調整について。

Blogdex
UA: Blogdex/0.1 (+http://blogdex.net/about) 名前を見てすぐに分かるとおり、blogのRSSフィードを集めて回るBot。最近、あまりに数が増えすぎて、解放し続けるのもどうなんだろう…と疑問を感じつつあるが…。取りあえずこれは、MIT(Massachusetts Institute of Technology)内のプロジェクトだ、ということなので、静観。
appie 1.1
UA: appie 1.1 (www.walhello.com) 検索サイト、Walhello.com のクローラー。一応robots.txtを確認していますが、次のアクセスで構わずディレクトリを読もうとしてます。行儀悪し。しかも、読もうとしたディレクトリは/eb/という昔某半オンラインRPG用にサイトを作っていた場所で、今は存在しない場所。いったい、どこから、そしていつの時代からやってきたのか…意味が分からん。
DigiPub Grape
UA: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Digipub,Grape; .NET CLR 1.0.3705; .NET CLR 1.1.4322) 通常のブラウザにデータベース機能を付加したブラウザ、らしい。お気に入りや履歴をDB化して、整理や検索をし易くした、ということなんでしょうか。便利なんでしょうけど、必要かって言われると微妙です。別に良いけど。
WebCapture
UA: Mozilla/3.0 (compatible; WebCapture 2.0; Windows) サイトを画像化してくれるソフト(→ Vector)。一見して、『うぜぇな…』と思ったんだけどよくよく考えると非常に有用なので(これを使わないと、スクリーンショットを撮って繋ぎ合わせることになるし)取りあえず執行猶予にすることに。ただ、ログを見てみると、ページ内の全ての画像に対してGETリクエストを出してくるらしい。そしてそれを統合ということか。これだけ見ると非常にウザイ。ダウンローダーとかわらんではないか。あと、公開されてる『WebCapture』のバージョンは1.0なのに、UAは2.0なのも気になる…別ソフトか?
SharpReader RSS Aggregator
UA: SharpReader/0.9.5.1 (.NET CLR 1.1.4322.2032; WinNT 5.0.2195.0) 海外製の、RSS Aggregator。日本語の表示も可能とのこと。使い勝手等は不明だけど、気になる方はこの辺参照のこと。
RNA
UA: RNA pre2.0b2 (build 041106) libwww-perl/5.69 RSSアグリゲータ、RNA。アンテナとして利用できます。ハテナとの連携も可能。簡単に言えば、様々なサイトの更新情報や概要を、自動的に取得し、見やすいように整理して表示してくれるということでしょうかね。かなり高機能なようですが、一応サーバベースで使うようなので、万人向け、というわけではなさそう。僕個人は、今のところ、そこまで他サイトの更新情報を欲してないので、使わないだろうけど、必要があるのなら便利だろうなぁとは思う。
[謎]節操無いアクセス
UA: DoCoMo/J-PHONE/KDDI / IP: 202.181.106.75 さくらインターネットに割り当てられたIPからのアクセスなんだけど、正体は不明。ていうかね…節操無いUAだなぁ、と。確かに、携帯への振り分けでは、DoCoMo、J-PHONE、KDDIの何かがUAに含まれていたら…とするのが一番シンプルで一般的(古い端末や新しい端末への対応問題はあるにせよ)だけどもねぇ…こりゃないでしょうよ。 なんか他にやりかたなかったんかい。(それとも何か意味のあるアクセスなのか…)
[謎]新手のセールス?
UA: Spider.NET / IP: 219.142.78.181 いかにもな名前だったので、アクセスしてみたところ、検索サイト『The Gigantic Search Engine at SoGoSearch.com』に繋がり、下に『spider.net domain is FOR SALE』と出ていた。なめんな。一応価格は"5桁"だそうです。あ、あと、このアクセス自体は中国からのアクセスでした。逆引きも出来ないし…弾こうかな。
[謎]何の検索?
UA: WEP Search 00 / HOST: 200-109-37-163.genericrev.cantv.net WEPと言えば、無線LANの暗号化方式。それをサーチするってことは…セキュリティの甘い無線LANを検索する…?って、サイトを巡回することに何の意味があるのか…よくわからぬまま。

【救済措置】
以下のサイトからの更新確認Botが拒否されていたので、IP指定で個別に救済。

Blognavi
UA: BLOGNAVI/0.1 [ja] (http://www.blognavi.com)libwww-perl/5.69
libwwwから始まるユーザーエージェントは原則弾いているので、その影響で一緒に弾かれていた。211.4.244.0/25 をallow指定することで解決。