backup_mixiのはてな向けXML書き出しルーチンがずいぶんとバグだらけで、
予想外に大変でしたが。

ルーチンのバグは以下の点。

  • 本文内容をエスケープしていない
    • ニコニコ動画や自動リンクなど、タグを伴う文章が含まれていると不正な文章になる。
  • XMLになる際に、複数の日記が1つにまとめられてしまうことがある。
    • はてなの仕様上、仕方のないことなんだけど(基本的には日記で、データは日付ごとなので)
  • XMLになる際に、動画以降のテキストが勝手に削除されてしまうことがある。

  • 日付順には並ばない。取得した順?にバラバラに並ぶ。


元々おまけ機能であるわけだし、メイン機能のバックアップという点で言えば、
上のバグとは無関係にきちんと保存されてる。

なので仕方がないかなーとは思うのだけど、
とはいえ、1つずつ修正していくわけにも行かないので、
ファイルを一旦テキストファイルとして読み込んだ上で、正規表現で日記ごとにバラバラにして、
必要な箇所はエスケープし、ニコニコ動画に関する部分ははてな記法に変換し、
タイトルははてなでカテゴリーとして認識されるように書式を変更し、
すべてを日付順に並べ直した上でXMLとして再度書き出して、構文チェック。

んで、細かい点を修正したあとはてなにインポート。


できあがりはこんな感じ。

1日1ニコ@はてな - ニコニコ部


2008-12-25からあとは、ここに直接書き込んだ文章だけど、
それ以前のものは、mixiから引っ張ってきた文章。

よく見ると、文章まるきり消えてるエントリ多いな…

それにタイトルに動画が入っちゃってるエントリも多数。
うわー…これ直すのだいぶだるいな…ま、気が向いたら直す方向で。