勝手にRSS – データの形式 について

先日ちょろっと書いた、RSS配信していないページのRSSを勝手に作る、なんですが。
(略して、勝手にRSS)

実験的に、色んなサイトを色んな形式で試してみていたせいで、
いつの間にかデータ形式がバラバラに。


一応、書き出してみると、こんな感じの構成になってるっぽい。

  • 画像のみのページ
  • 画像
    • 画像を取得して保存
    RSS
    • ディレクトリを検索して動的にRSSを作成
  • 画像とテキストのページ
  • 画像
    • 画像を取得して保存
    テキスト
    • ログファイルとして保存
    • MySQLに保存
    RSS
    • ログファイルを読み込んで動的にRSSを作成
    • MySQLからデータを取得して動的にRSSを作成
  • テキストのみのページ
  • テキスト
    • ログファイルとして保存
    RSS
    • ログファイルを読み込んで動的にRSSを作成


まぁ…真面目に考えて作ったわけじゃないから仕方ないけど、
それにしても酷いな(苦笑)


きちんと整理したいと考えるんであれば、データは全てMySQLなどにすべきかな。

サイト毎にテーブルなんか作ってられないから、
最低でもテーブルを2つ作って、リレーション。
1つはログ、もう1つはサイト情報みたいな感じで。

画像も、少なくともファイル名をログ用のテーブルに含む、かな。
画像用テーブルを一個作っても良いけど、
そんなに横断的に画像を処理することはなさそうだし、まぁいいか。


RSSの書き出しは、それらRDBMSから必要なデータを取得して書き出し。

自分が思ってたよりも、きちんと更新情報が取得できてるっぽいし、
その辺の管理について、もう少し考えてみよう。


ま、サービス化はしませんがね。
欲しいものを抜き取るロジックが、僕には汎用化できないから(苦笑)




なお、このココロミに関しては、実験的意味合いが強く、
RSS配信も個人的な利便性向上が目的です。
決して、著作権侵害や、RSS配信した上でそこから利益を得る、という目的ではないので一応。

著作権のこと考えると、全文配信は控えた方が良いのかなー
タイトルだけとか、文字数で抜粋とか。