恒例のアクセス解析調査、第9弾。
調査期間は、[2005/5/16-31]。

vol. 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8

SOFTWARE
HTTP::Lite/2.1.6
UA: HTTP::Lite/2.1.6 Perlモジュール。LWPの簡易版として使えるらしい。まぁアレかな、早い話がリクエストを出す、と。アクセス元のホストを調べたところ、プラエセンス株式会社にたどり着き、そこのソフトウェア『Chararina(キャラリナ)』が、RSSリーダーも備えている様子。ログをよく見てみると、まず、1つのページにアクセスし(HEADリクエスト→GETリクエスト)、その後、rdfファイルにアクセス(GETリクエスト)するので、まぁ多分その辺の機能かなぁ…と。多分ね。
GetHtml
UA: GetHtml ホームページをまるごと Get して、オフラインで閲覧するためのソフトウェア。コマンドライン版(GetHTML)と、GUI版(GetHTMLW)があるらしい。てか、こういうソフトウェアって、ナローバンド時代の遺物だと思ってたんだけど、今でも需要あるんだねぇ。自分自身のネット環境だと、PCに向かってる時間≒ネットに繋いでる時間だから、収集目的以外ではダウンローダーなんか要らないわけだが。つうか、収集目的もないが。
Pockey
UA: Pockey/4.10.0(Win32; GUI; ix86) UAの類似性から、恐らく、GetHTMLに依るものと思われる。この辺りを読むと、『Pockey-GetHTML/4.11.6 (Win32; GUI; ix86)』が正しいようなのだが、それにしても似通っている。前バージョンではPokeyと名乗っていたんだろうか?まぁどうでもいいが。これを弾いても冤罪にはなるまい。
sigmarion
UA: Mozilla/4.0 (compatible; MSIE 5.5; Windows CE; sigmarion3) NTT DoCoMo の、ポケットPCというかPDAというか、そんなの。
Galeon
UA: Mozilla/5.0 Galeon/1.2.5 (X11; Linux i686; U) Linux用タブブラウザ『Galeon』。レンダリングエンジンにGeckoを採用し、動作も軽いそうです。
Deepnet Explorer
UA: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Deepnet Explorer; SV1; .NET CLR 1.1.4322) 普通のタブブラウザに、Gnutella Networkを使用しているファイル共有機能、RSSリーダをつけた物。(参考:Deepnet Explorer-タブブラウザ推奨委員会)まぁ、よくある、機能追加型亜種ってヤツですかね…UAに、Deepnet Explorerを追加するとのこと。
POE-Component-Client-HTTP
UA: POE-Component-Client-HTTP/0.65 (perl; N; POE; en; rv:0.650000) POEっていうのは、『イベント型フレームワーク』だと、vol.7でお勉強したわけだが、だから何なんだ?というようにワタクシ全く解ってませんね。まぁしかし、UA見る感じでは、POEの中のHTTPリクエスト出すモジュール、みたいな捉え方で良いんじゃないですかね?知らんけど。(無責任)
Twisted PageGetter
UA: Twisted PageGetter どうやら、Twistedという、Pythonベースのフレームワークをベースにした?Spiderらしい。とうぜん、目的、意図などは一切不明。まぁ、使う人によって違うだろうしねぇ。実体はよく分からず。ググって見ても情報もあんまりないし。でもまぁ、たぶん、ダウンローダー的に使うんではと。いきなりファイルにアクセスしてきてるしね。
RssBar
UA: RssBar/1.14 InternetExplorer / Sleipnir 対応の、ブラウザ組み込み式RSSリーダー。便利そうですね。
Miech
UA: Miech/600 RSSリーダー機能を搭載したタブブラウザ。『ミーチ』と呼ぶらしい。やはり世の中には、新しい使いやすいブラウザを求めて放浪してる方、自分で作っちゃおうという方がたくさんいらっしゃるようで…。機能は一通り揃ってるようだけど、一部対応していないモジュールとかあるようだし、完璧かどうかは微妙。全体的なデザイン(姿形、機能の配置など)が、いかにもプログラマーが作りましたという感じなので一般受けはしないかもしれないな。開発自体は、去年の夏で止まってる様子。FireFoxにでも移行しちゃったのかな?
portalmmm
UA: portalmmm/1.0 TS21i-10(;ser123456789012345;icc1234567890123456789F) 『portalmmm』は、ヨーロッパのi-modeが吐き出すユーザーエージェント。この後に機種名が来る。この場合は、東芝の欧州版端末『TS21i』。結構、洗練されたフォルムで、何で日本ではこう言うの出さないんだと小一時間(ry
sna-0.0.1
UA: sna-0.0.1 (mikemuzio@msn.com) どうやら、Snoopyという名前のソフトが残すUAらしい(参考:sna-0.0.1 ?!)。じゃあそのSnoopyとは何かというと、、、“ブラウザをシミュレートするPHPクラス”…なんのことかさっぱりわかりません(汗)まぁでも何らかのクローラーでしょうね。robots.txtを一目見てお帰りになってます。ちなみに、UAに載ってるメアドはダミー。
contype
UA: contype 恐らく、HTTPリクエストを出すモジュール。何かの、RSSアグリゲータ、リーダーなどに使われていると思われる。というか、このUAを残してるのって明らかに自分なんだよね…しかも行き先は、mutterのRSSファイル。あーなんのこっちゃよく分からん!もしかして、IEのことかなぁ…詳細はよく分かりません。
glucose2
UA: glucose2/2.0-20050313 『glucose』ってのは、前にも一回取り上げたことがあるんですが、フリーのRSSリーダーです。gooへの技術提供が一段落して、2.0を作成中というところみたいですねぇ…未だアルファ版のようですけれども。おきばりやす。
iCab
UA: iCab J/3.0 (Macintosh; U; PPC) Macintosh用ブラウザ『iCab』。NN/IEに対抗して作られたそうだけど、今となるとちょっと時代遅れの感も…まぁそうはいっても、Donutよりかなんぼかマシか。でも、セキュリティ問題がここまで取り上げられると、マイナーブラウザは安全なのか、危険なのか、判断迷うな。
SERVICE
MarkAgent
UA: User-Agent: Mozilla/4.07 [ja_JP.EUC] (X11; I; MarkAgent FreeBSD 2.2.8-RELEASE i386; Nav) オンラインブックマークサービス。ここ経由のアクセスなのか、更新チェックのクローラーなのか、ツールバーを組み込むとこのUAを使うのか…詳細は不明だが、多分、ここに関連してるんでしょう。だから、UAにUser-Agent含めるのやめれ。
Netcraft
UA: Mozilla/4.0 (compatible; Netcraft Web Server Survey) あるWEBサイトが、何のOSで、何のWEBサーバで動いてるかなどの情報が表示されます。また、OSやWebサーバの変化の履歴も表示されます。(参考:コンピュータ系blog: Netcraft
The Incutio XML-RPC PHP Library
UA: The Incutio XML-RPC PHP Library モビゾーからのアクセス。モビゾーは、携帯から動画をblogにアップできるサービス…なんだが、なぜか上手く行かなかった。ログ見ても、200返してるんだけどなぁ…謎。
All Consuming
UA: All Consuming RSS Crawler/1.0 (http://allconsuming.jp/news/000015.html) ネット上から、さまざまな商品レビューを収集して載っけるサイト。ちらっと見てみたけど、ただの情報の羅列ながらおもしろかった。って…出来たばっかりか。クローラーはおざなりな出来(robots.txtを読まないなど)だけど、作者さんの誠意が伝わる文章で、説明されているので、まぁ安心かなと。頑張ってください。
BOT/CRAWLER
NextGenSearchBot
UA: NextGenSearchBot 1 (for information visit http://www.eliyon.com/NextGenSearchBot) ZoomInfoの検索クローラー。
Cyberz
UA: Cyberz Communication Agent (http://www.cyberz.co.jp/) であい.COM, 日記系.jp,メルちょ@, gumonji 他を運営する、サイバーズ株式会社のBot。ていうか、何の目的で巡回してるんですか?
Program Shareware
UA: Program Shareware 1.0.0(IP: 63.223.67.249) これまた、これだけじゃねぇ…検索しても山のように引っかかるし。と思ったら、Webmasterworld.comに情報があった。それによると、『program shareware is a guestbook spambot. 』だそうで。なるほどね。遮断で問題なさそう。
abot
UA: abot/0.1 (abot; http://www.abot.com; abot@abot.com) 検索サイト、aBot.comの検索クローラー。
php-soft
UA: php/perl software solutions company. http://www.php-soft.com 2003-2004 よくわかんない。…いや!いきなり、mt-comments.cgiにアクセスしてきてやがる!これ、コメントスパマーだ!まぁ、それなりの対処をしてたんで大丈夫だったけど。全く、ウザイ…ちなみに、UA中のURIにアクセスしてみても何も無し。
ScSpider
UA: ScSpider/0.2 情報(webmasterworld.com)を総合すると、SURFCONTROLのスパイダーの様子。スパムなど総合的なフィルタリングサービスのようなので、そのための情報収集かな。robots.txtを読んで、そのまま帰っているので、お行儀は問題なし。
[名前無し]
UA: http://www.almaden.ibm.com/cs/crawler [rc2.wf.ibm.com] IBMのクローラー。UA内のページにアクセスすると、クローラーに関する情報が記載されている…のだけど、『クローラーとは何か知っていますか?』的、初心者向け一般論が延々展開されて、結局このクローラーが何を目的にして作られているのかは明確になっていない。片手落ちじゃないっすか、IBMさん。さすがに、robots.txtには厳格に従うようですが。 ところで、名前くらい付けてあげてやってくれませんかね…可哀想なので。
Twiceler
UA: Twiceler www.cuill.com/robots.html 上記URLにアクセスすると、『Twiceler is an experimental web crawler. Please contact costello@cs.stanford.edu if you have problems. It should obey robots.txt.』(Twicelerは実験中のWEBクローラーです。何か問題があれば連絡お願いいたします。Twicelerはrobots.txtに従います。)とのメッセージが表示される。cuill.comにも情報は全くないので、結局なんなのかよく分からないけど、確かにrobots.txtを一目見てお帰りになっているあたり、設計通りには動いている様子。
謎。
daygestgar
UA: daygestgar ググってみたが、ログが1件表示されるのみ…誰かのイタズラか。謎。
Ken
UA: Ken(IP: 143.101.239.237) これだけでは調べようがありません…
Luna
UA: Luna えー…ルナさんからのアクセスです。違います。Lunascapeかなぁ…多分こんなアングラなUAじゃないと思うしなぁ。謎です。 (→VOL.11で解決)
MSIE 6.0
UA: MSIE 6.0 IP: 81.180.251.250 → 81.180.250.0/23 また謎なアクセスが…多分問題ないと思うので、IPも晒しておきます。これ、ルーマニアからのアクセス。アクセス履歴は、まずルートディレクトリに、それからRSSファイルに、それからおもむろに月別アーカイブなどのページのトップに、最後にもう一度ルートディレクトリにそしてそれらを正確に二度ずつ。絶対人間じゃないよなー。何をしたいのかは不明だけれども。そういうわけで遮断。ルーマニアの友達いたら、ごめん(どうせプロクシだと思うが)
TuringOS
UA: Mozilla/4.78 (TuringOS; Turing Machine; 0.0) 謎。webmasterworld.comの結論も、『うーん…』でした。この記事の時期が、2001年なので、もしかしたらなんらかのネットユーティリティなのかもしれないけど、しかしこのBOT。mt-comments.cgiで500出されてもしつこく、しつこく、アクセスを繰り返してる…あー…これは、アレだ、スパマーだな…でも直接、mt-comments.cgiにアクセスする意図はよくわからんな。


総括。

今回はちょっと量が多かった。なんなんだいったい。
別に僕が頑張ったわけではなくて、『みなさん』が頑張ってくれちゃったわけで。
集計が大変だった…
まぁ、毎日のルーチンとして組み込まれてるから、今日まとめてやったわけではないけれども。
自分が使ってるだけのログチェックプログラムだけど、そのうちどっかにアップしてみようかな。
(ローカルで使ってくださいね)