電子化された文書ないし書籍を長期保存するためのマスター・ファイルは 非圧縮のTIFFを使うのが標準である。 しかし ストレージ・コスト削減のために圧縮をしなくてはならない場合
どのような選択肢があり どれが最も適しているのか ということをGillesse等の論文を中心にまとめる。
● 圧縮率の比較 Gillesse論文p.40
圧縮方法
|
圧縮率 ※
|
JPEG 2000 lossless
|
2.08
|
JPEG 2000 lossy
|
11.11-50.00
|
PNG lossless
|
1.75
|
JPEG lossy
|
9.09-25.00
|
TIFF LZW lossless
|
1.43
|
※ここで圧縮率nとは 圧縮後 元の1/nのサイズになることを意味する
参考のため 別の比較表 (可逆 (lossless) 圧縮のみ)
『JPEG 2000 - a
Practical Digital Preservation Standard? 』 p.27
http://www.dpconline.org/docs/reports/dpctw08-01.pdf
圧縮方法
|
カラー画像
|
グレー画像
|
文字・写真混合
|
文字のみ
|
JPEG 2000 lossless
|
2.08
|
2.00
|
4.25
|
4.36
|
PNG lossless
|
1.57
|
1.59
|
3.88
|
4.35
|
TIFF LZW lossless
|
1.32
|
1.38
|
3.10
|
3.56
|
TIFF Packbits
|
1.003
|
1.02
|
1.68
|
3.00
|
ZIP
|
1.37
|
1.49
|
2.91
|
4.51
|
Lossless JPEG
|
1.45
|
1.52
|
2.77
|
3.07
|
JPEG-LS
|
2.11
|
2.05
|
4.86
|
5.20
|
● 圧縮率以外の項目も検討した結果 長期保存適切度の評点は以下の通り Gillesse論文p.41
順位
|
圧縮方法
|
評点
|
1
|
非圧縮TIFF6.0
|
84.8
|
2
|
PNG 1.2
|
78.0
|
3
|
JP2 (JPEG 2000 Part 1) lossless
|
74.7
|
4
|
JP2 (JPEG 2000 Part 1) lossy
|
66.1
|
5
|
Basic JFIF (JPEG) 1.02
|
65.4
|
6 |
TIFF 6.0 with LZW compression |
65.3
|
● 非圧縮T IFF6.0以外で検討する場合 以下の順序が妥当 Gillesse論文p.42
1. JP2 (JPEG 2000 Part 1) lossless
2. 1.2
3. Basic JFIF (JPEG) 1.02
4. JP2 (JPEG 2000 Part 1) lossy
5. TIFF 6.0 with LZW compression |
上記評点順位とは異なる理由は
補足参照のこと |
Gillesse論文:
『Alternative File
Formats for Storing Master Images of Digitisation Projects』 p.42
http://www.scribd.com/doc/2388286/Alternative20File20Formats20for20Storing20Masters202201
● 補足1 なぜ評点順位とは異なる順番を推奨しているのか
○ なぜ JP2 losslessとPNGが逆転しているのか?
・ 評点では 可逆圧縮として PNG1.2 が2位 JP2 (JPEG 2000 Part 1) losslessが3位となっている。
・ その評価の基準となる評価ポイントの一つとして 「マスター・ファイルとして使用されている実績」
という項目があった。
・ ところが 過去の実績も重要だが それ以上に将来の予想を踏まえる必要がある。
・ 将来の予想をしてみると JPEG2000の方が よく使われることになると思われる。
・ なぜなら 現在 PNGもJPEG2000も両方ともよく使われているが PNGは1996年からあるフォーマットであるのに対して JPEG2000は2000年にできたフォーマットであるから。
○ なぜ JP2 lossyとBasic JFIF (JPEG)
1.02が逆転しているのか?
・ 評点では 不可逆圧縮として JP2 (JPEG 2000 Part 1) lossy が3位 Basic JFIF
(JPEG) 1.02が4位となっている。
・ しかし 先ほどと同じ「将来の予想」を踏まえると JP2 lossyに比べてJPEGの方が将来的にも安定していると思われる。
● 補足2 それぞれの圧縮方法を使っている団体の例は?
○ JPEG2000
・ 英国図書館
・ 米国議会図書館
http://memory.loc.gov/ammem/index.html
http://www.loc.gov/ndnp
・ 日本 国会図書館
http://jpimg.digital.archives.go.jp/kouseisai/index.html
・ Google Earth
http://earth.google.co.jp/
・ Second Life
http://secondlife.com/
・ Digital Cinema Initiatives
http://www.dcimovies.com/
・ DICOM (医用画像の規格)
http://medical.nema.org/
・ カナダ国立図書 ・ 資料館
・ Internet Archive社
・ コネチカット大学図書館
・ ユタ大学図書館
http://www.lib.utah.edu/digital/collections/sanborn/
・ スミソニアン図書館
・ J. Paul Getty美術館
http://www.getty.edu/museum/
○ PNG
・ オーストラリア国立公文書館
○ JPEG
・ オランダ Leiden地方公文書館
http://www.leidenarchief.nl
・ チェコ国立図書館
http://www.manuscriptorium.com/
○ TIFF LZW
・NARA
(2008年収集)
|