最近やってること – RRS配信してないページのRSSを勝手に作る
きっかけは、RSSどうこうと言うことよりも、むしろ、ちらっと目にしたWeb::Scraperのお話。 miyagawaさん謹製のモジュールでCPANに上がってるらしい。 Web::Scraper – Web Scraping Toolkit inspired by Scrapi – search.cpan.org Web::Scraper – naoyaのはてなダイアリー Web::Scraperが便利すぎて困るの巻 (CodeZine編集部ブログ) やれることは、ざっくり言うと、 タグやclass名、IDなんかに紐づけて要素を引っ張ってこれる、ということみたい。 つまりは、これさえあれば、最近の、 classやidがきっちり指定されたhtmlからなら、 欲しいデータを楽に取得できると言うことなのだけど、 んーあいにく僕の主戦場はPHP。 もちろん、Web::Scraper組み込んで書いたPerlプログラムを走らせておいて、 RSSの配信の部分だけPHPで実装するか、 ないしはPHPなんかやめて、RSSも静的なXMLファイルにすればいいじゃない、 そんな感じが多分常識的な判断なのだと思うけども、 いや、なんか、HTTPリクエストも含めて何か書いてみたかったんです。はい。 車輪の再発明になるのはよく分かってるけどさ。