恒例のアクセス解析調査、第38弾。
調査期間は、[2007/8/1-8/31]。


過去の調査一覧はこちら。

NOBODY:PLACE - MUTTER : botreport

BOTS/CRAWLERS

UA: CazoodleBot/CazoodleBot-0.1 (CazoodleBot Crawler; http://www.cazoodle.com/cazoodlebot; cazoodlebot@cazoodle.com) 検索エンジンクローラーだけど、サイトはComing Soon。
 
UA: <a href=http://www.courbis.fr>Courbis presente Voyage au centre de la HP48</a> よくわかんないけど、とりあえず何らかの実験ぽい。
 
UA: Net_TrackBack PEARに上がってるところから見て、PHPで書かれたラックバックモジュールだと思うのだけど、うちのサイトに来てるのは100%SPAM。技術的にはまぁ、アレだけど、でももうこれって、UA毎、SPAM認定しちゃっていいんじゃねーかなー
 

SERVICES

UA: ImageCrawler (C)ugou.net http://ugou.net/labo/ “適当な文字のディレクトリが出来てどんどんアレな画像が溜まっていきます。”だそうです。ところで、どんなアレがうちのサイトにあったんだろう…
 
UA: monolist.jp crawler 0.1 (http://monolist.jp/) ブログの記事を自動的に収集し、本文内に書かれている参照リンクを集計してランキングとして表示するサービス…らしいです。あんまり動いてないけど。
 
UA: kakiko.com check 0.02 掲示板がなぜ、と思ったら、掲示板内にURLを入力すると、自動でリンクを貼る機能があり、その際にリンク先のページが安全かどうか?をチェックする模様。なるほどね。
 
UA: Zend_Http_Client HOST: www.rssnavi.com いろんなブログ検索サイトの、注目キーワードを表示するマッシュアップ、のようだ。まー…ページの最初にアフリエイトの羅列ってのはどうかと思うけど、そう言う向けの実験サイトみたいな感じなんだろうなー。赤松さんがされてるヤツみたいなの。
 
UA: woriobot (+http://www.worio.com) UBC(ブリティッシュコロンビア大学@カナダ)を中心にした検索エンジンプロジェクト、らしい。サイトは2007年公開予定となっているが今のところはクローズドβテスト中。
 
UA: IWAgent/ 1.0 - www.brandprotect.com サイトを超ざっくり斜め読みした感じ、ネット上の情報を収集してお宅のブランドの悪口書かれてないかチェックしますよ的サービスと見た。知らんけど。
 
UA: Google-Sitemaps/1.0 自分のサイトのサイトマップをXMLで作って、アップすると、"Google でお客様のサイトがどのように処理されているか、および潜在的な問題についてご確認いただけます。Google がお客様のサイトをクロールおよびインデックスする方法、および Google がお客様のサイトにアクセスする際の特定の問題をご覧いただけます。"だそうです。なんかわからんけど。
 
UA: BrightCrawler (http://www.brightcloud.com/brightcrawler.asp) BrightCloudというサービスのクローラー。業務内容は検索エンジンとかではなく、主にセキュリティ関連ぽ。クローラーの目的も、サイトを収集し、分類するため、となっている。
 
UA: Mozilla/5.0 (compatible; KLSH-PageGet/1.03; http://www.kondo-net.gr.jp/klsh/) 近藤さん?運営の検索エンジンのクローラーと思われる。多分。
 
UA: Mozilla/5.0 (compatible; croozbot/2.0; +http://crooz.jp/) "日本最大の携帯電話専用検索サイト"らしい。そのクローラーってことだろうな。
 

SOFTWARES

UA: UniversalFeedParser/4.1 +http://feedparser.org/ Pythonで設計された、Feed Parser(RSSリーダー)。オープンソース、とのこと。
 
UA: FNavigator/1.0b1 (http://www.mobirus.com/) UAから見て、多分これのことではと。Internet Explorer上で操作することも出来る、RSSリーダーソフトウェア、って感じでしょうかね。
 
UA: Mozilla/5.0 (compatible; OCEAN Browser class; http://ocean.to ) "OCEANブラウザは、DoCoMo i-mode、au EZweb、SoftBank Yahoo!ケータイに対応した利用無料の携帯フルブラウザです。携帯電話の標準ブラウザ(i-mode、EZweb、Yahoo!ケータイ)から利用できるのでパケット定額制適用範囲内でご利用いただけます"とのこと。アクセスしたページをQRコードに変換して友人に渡せる、とあるけど、URL渡した方がよくね?
 
WorldTALK
UA: Mozilla/4.5 (WorldTALK/2.2.24) 一応ブラウザらしいんだけど、Wikipediaによると、Windows3.1用って書いてある…その後CE対応したりして、携帯端末などで組み込みブラウザとして使われてるみたい。ただ、オフィシャルな情報は無し…一応開発?販売?は、テニック株式会社らしいのだけど。

UNKNOWN

BORG
UA: BORG 何なんだろう…ボルグ
secret
UA: secret IP: 124.34.158.130 そ、ソウデスカ…
TMCrawler
UA: TMCrawler HOST: 211-75-91-3.hinet-ip.hinet.net 謎。数少ない情報では、あまり評判が良くなさそうだったが、ここではディレクトリをたどって、普通のページにアクセスしてきただけ。TBでもなさそう。なんだろう…ちなみにHOSTは、台湾のバックボーンらしい。 関連情報:Hiro'sぶろぐ | TMCrawlerってなんだ!?
NASA Search
UA: NASA Search 1.0 HOST: igh-cachemx.internetghana.com IP: 196.29.120.70 『NASA』という名前を冠してはいるものの…多分、NASAとは関係ないと思われ。なぜって…アクセス元が、ガーナなんだよね。NASAが、ガーナの回線を使う…だろうかっていう。 ちなみにアクセスしてきてたのは、BOT関連のページ。どういうことなんだ?なんかもうよくわからん。
TR Planning
UA: TR Planning 携帯電話用クローラーか?という情報もあったけど、アクセスログから見ると、有人な気がしなくもない。このUAでの掲示板への書き込みもあるし(SPAMとかじゃなくて)。とりあえず謎。
UA: Mozilla/5.0 (compatible;YodaoBot-Image/1.0;http://www.yodao.com/help/webmaster/spider/;) IP: 60.191.80.123 何らかのサービスのクローラーだと思うのだけど、現状、UAにあるドメインが落ちてるっぽいので、なんとも判断付かず。IPで見た感じでは、中国からのアクセスなので、中国の検索サイトかなーという感じ。いや、もしかすると、ドメインはダミーで、単なるスパマーかもしれないけど。 あ、第30弾で、YodaoBotを書いてた。てことはその、イメージ検索部門てことなんだろうか。確かに、ログを見る限り、PNG、GIF、JPG辺りを片っ端から持って行ってますね…うざ。
 


という感じで、結構豊作でした。


で、振り分けの定義が結構ぶれまくってるんですが。
一応、以下のような感じで決めてみようかと思います。
(まぁ細かい振り分けはやっぱりオレオレになるけど)

  • "SERVICE" … WEBに公開しているサービスまたはアプリケーションに付随したプログラム。
  • "BOT/CRAWLER" … SPAMなどのための情報収集を目的とした巡回、出自を明らかにしないプログラム。また上記であっても悪質なもの。
  • "SOFTWARE" … 主にローカルで使用するアプリケーション。ブラウザなど。
  • "UNKNOWN" … ハッキリと判断できないもの。但し動作が余りにアレなものは、BOTと判断する。


そんな感じで。