各種アーカイバによるテキストファイルの圧縮率比較。

サーバログをローカルにダウンロードし圧縮して保存しているのだけど、
(ローテーションで削除されていくため)結構なサイズなので、圧縮が必要です。
でも圧縮形式にも色々と種類があってどれが適しているのか分からない…

というわけでどの形式が、テキストファイルを一番圧縮できるのか調べてみました。


詳細については以下をどうぞ。

圧縮対象
タイプ:テキストファイル
ファイルサイズ:22,000,538バイト
使用ソフトウェア
Lhaz v1.36α1(ちとらソフト
WinRAR 3.80日本語版(WinRAR in Japan
圧縮結果
圧縮形式圧縮後サイズ圧縮率
7-Zip(PPMd)699,78896.8%
7-Zip(LZMA-9)848,48296.1%
7-Zip(LZMA-7)848,48296.1%
TBZ855,04596.1%
BZ2855,38796.1%
7-Zip(LZMA-5)904,00295.9%
RAR916,66895.8%
LZH(lh7)1,276,00494.2%
GZIP(9)1,436,00593.5%
TGZ1,436,06993.5%
ZIP(9)1,441,32693.4%
CAB1,486,41293.2%
LZH(lh5)2,102,78390.4%


比較的サイズの大きなテキストファイルだからなのか、
全体的にかなり高い圧縮率を示していますが、
中でもアルゴリズムにPPMdを使った7-zip形式での圧縮が圧倒的です。

圧縮速度に関してはしっかりとは計測してはいませんが、
RARよりも低い圧縮率の形式の場合はかなり速いです。一瞬。
それ以上のものだと3-5秒が掛かりますが、その中でも7-Zip(PPMd)が一番速い、かな。


と言うわけで、テキストファイルの圧縮に最適なのは7-Zip(PPMd)!


…と言いたいところなのですが、
7-Zip(PPMd)には1つ欠点があって、「解凍速度が遅い」のです。

同じ7-Zip形式でも、LZMAアルゴリズムで圧縮したファイルは1秒以下で解凍出来るのに対し、
PPMdの方は圧縮と同程度の時間が掛かります。

ま、今回は二度と開かないであろうログファイルの格納なので、
僕は7-Zip(PPMd)を選びましたけれども、
例えばポータブルみたいな解凍することが想定されているファイルの場合には、
LZMAで圧縮した方が便利なのかもなーとも思います。



…画像ファイルとかだとどうなるんだろうなぁ?