予想外に大変でしたが。
ルーチンのバグは以下の点。
- 本文内容をエスケープしていない
- ニコニコ動画や自動リンクなど、タグを伴う文章が含まれていると不正な文章になる。
- XMLになる際に、複数の日記が1つにまとめられてしまうことがある。
- はてなの仕様上、仕方のないことなんだけど(基本的には日記で、データは日付ごとなので)
- XMLになる際に、動画以降のテキストが勝手に削除されてしまうことがある。
- 日付順には並ばない。取得した順?にバラバラに並ぶ。
元々おまけ機能であるわけだし、メイン機能のバックアップという点で言えば、
上のバグとは無関係にきちんと保存されてる。
なので仕方がないかなーとは思うのだけど、
とはいえ、1つずつ修正していくわけにも行かないので、
ファイルを一旦テキストファイルとして読み込んだ上で、正規表現で日記ごとにバラバラにして、
必要な箇所はエスケープし、ニコニコ動画に関する部分ははてな記法に変換し、
タイトルははてなでカテゴリーとして認識されるように書式を変更し、
すべてを日付順に並べ直した上でXMLとして再度書き出して、構文チェック。
んで、細かい点を修正したあとはてなにインポート。
できあがりはこんな感じ。
1日1ニコ@はてな – ニコニコ部
2008-12-25からあとは、ここに直接書き込んだ文章だけど、
それ以前のものは、mixiから引っ張ってきた文章。
よく見ると、文章まるきり消えてるエントリ多いな…
それにタイトルに動画が入っちゃってるエントリも多数。
うわー…これ直すのだいぶだるいな…ま、気が向いたら直す方向で。