恒例のアクセス解析調査、第23弾。
調査期間は、[2006/5/1-5/31]。

過去の調査一覧はこちら。
NOBODY:PLACE - MUTTER / Tag Search: BotReport

BOT/CRAWLER
UA: NetResearchServer/4.0(loopimprovements.com/robot.html) NRS社によるクローラー。集めた情報は、ODP - Open Directory Projectのために使われている様子。
UA: Krugle/Krugle,Nutch/0.8+ (Krugle web crawler; http://www.krugle.com/crawler/info.html; webcrawler@krugle.com) 『Krugle - the search engine for developers』ということで、コードなんかを対象にした検索エンジン、とのこと。Nutchは、以前も書いたかもしれないけれども、オープンソースの、ウェブ検索エンジン。 → Nutch: Nutchについて
UA: NPBot/3 (NPBot; http://www.nameprotect.com; npbot@nameprotect.com) ITソリューションの会社らしい。モニタリングかなー
UA: Mozilla/5.0 (compatible; EARTHCOM.info/2.01; http://www.earthcom.info) チェコのポータルサイト、EARTHCOMからのクローラー…らしいな、どうも。英語以外の表記が読めないんで詳しくは分からないけど。
core-project
UA: core-project/1.0 CoreなProjectなんていっぱいあるわけで、どれやらわからん。…と思ってたら、webmasterworldに情報が載ってた。さすが。以下、抜粋。
Looks like core-project/1.0 is a personal bot written by someone over at codingforums.com.
なるほどね。じゃあ分からなくても無理はないな。
Uoi-Adzap-Agent
UA: Uoi-Adzap-Agent/9.99 (Sega Mega Drive; 2-bit) なかなかいかしたUAを使ってるわけだが…実態は多分、掲示板への自動書き込み系BOT。もちろん(例によって)確証はないけど、この辺のキャッシュを見ての判断。このアクセス自体も、guestbookに来てるし。
UA: MQbot metaquerier.cs.uiuc.edu/crawler UIUCは、University of Illinois at Urbana-Champaignの略ってことで、イリノイ大学。UAで示唆されているサイトによると、そこのプロジェクトで、WEBの情報を収集し、統合することが目的、らしい。つまり、普通にクローラーだな(技術面はともかく)。


WEB SERVICE

UA: Mozilla/5.0 (compatible; BecomeJPBot/2.3; MSIE 6.0 compatible; +http://www.become.co.jp/site_owners.html)
BecomeBotの日本版。ちなみに、UA内のアドレスが間違っているというオチ付き。(×owners.html → ○owner.html)

UA: BlogRangerCrawler/1.0 gooの、“次世代型ブログ検索実験”、BLOGRANGER - goo ラボのクローラー。一度取り上げた記憶があるんだけど見つからなかったのでもう一度言うと、BLOGRANGERは、キーワードやブロガーに加えて、『感想』という基準でブログを検索できるなど、見たいブログを視覚的に特定できるサービスがウリ。にしても、gooてやたらと名前の違うクローラー巡回させてる気がするんだけども…その辺、効率的にならないのかしらね。
UA: HatenaScreenshot/1.0 (checker) UA: HatenaScreenshot (compatible; MSIE 6.0; Windows NT 5.1; SV1) 5/29に、はてなダイアリーで拡張された、スクリーンショットを簡単に作成する機能『はてなスクリーンショット』(まんまじゃん)のbotだと思います。多分。ところではてなさん。このbot、もの凄い勢いでディレクトリを遡りながらrobots.txtにアクセスしまくってくれます(上のUA)が、これってこれで良いんでしょうかね…?なんかよく分かんないんですけど。その後、下のUAが撮影に来るのはまぁ良いとしても。


SOFTWARE

UA: Dillo/0.8.4-i18n-misc
『Dillo』という、Cで書かれ、Linux(など?)で動作するWEBブラウザらしい。

InettvBrowser
Mozilla/4.0 (compatible; MSIE 5.0 compatible; Device Mosaic 5.0; OpenTV) InettvBrowser/1.0 (008045;LX600;1.08;10300) 久々に見慣れぬブラウザだ!と思ったら、どうやら、いわゆるブラウザではなくて、ネット対応家電によく載っているブラウザのようだ(参考:Web系雑記: パナソニック「VIERA」のWebブラウザを試す/液晶ハイビジョン、来る - ただのにっき (2004-03-14))。まぁ、見慣れぬブラウザには違いないがね。どこが作ってて、どういうOSで動いてるんでしょうねぇ。どちらもPanasonicみたいだから、Panasonicが開発した…のかなぁ。自前でも作れるだろうけど、発注/提携した方が簡単そうだしなぁ。 …と調べてたら分かりました。ブラウザ名は、『Device Mosaic』。開発しているのは、米Spyglass社。『OSはSolarisとNCDwareに対応し、OS-9、pSOS、QNX、LynxなどのリアルタイムOSへ簡単に移植することもできる』そうである。へー。(参考:Device Mosaic - マルチメディア/インターネット事典)てことは、それの移植版かな?恐らく。
portalmmm/2.0 Z320i(c100;TB)
UA: portalmmm/2.0 Z320i(c100;TB) 何か新手のブラウザか…と思ったが、ここを読んだ限りでは、ヨーロッパで展開されているiモードを利用したアクセスのUA、ということになるようだ。


ETC.

RssTicker
UA: RssTicker
RssTickerで検索すると、ブログツールとしてのRssTickerを作るサイト、『RSSTicker Factory』が引っかかる。また、RSSTickerという名前のRSSリーダーもあるようだ。いずれにせよ、アクセス先がRSSフィードではなく、ルートディレクトリなので、結局、何をしているかは謎である。

URLFlatFileTool
UA: URLFlatFileTool Googleでそのまま検索して見るもヒット無し。Yahoo!Japanの提案で、"URL FlatFile Tool"で検索して見るも、それぞれやたらとヒットするので、うーんよく分からない。その内のどれかに解答がある気はするけど、さすがに全部見てまわるわけには…詳細を知っておられる方がいましたらご一報を。
Yeti
UA: Yeti イエティ…雪男。うーむ。よくわからない。まさか、これじゃないよな?(苦笑)


今回はこんな感じで。
本当に、クローラーって無くならないなぁ。
みんな似たようなプログラムを寄ってたかって書いてるのね。
そして名前を付ける、と。

ご苦労様です。
でも、UA統一してくれると助かるけどなー