文書ないし書籍を電子化する場合 長期保存を目的とするマスター・ファイルと
閲覧や配布などを目的とする派生ファイルを作成するのが一般的である。 今回は
マスター・ファイルのファイル形式について 現状と最近の動向をまとめる。
●(現状)マスター・ファイル(長期保存用データ)として TIFFが標準である
○ 「マスター・ファイルとしてTIFFを推奨します」 (p.60 in NARA 2004)
○ 「マスター・イメージとして認めるファイル形式は次の通り」 (p.23 in LOC 2006)
☆ TIFF バージョン6 (二値はグループIV圧縮可、グレーおよびカラーは圧縮不可)
○ 「マスター・ファイルは全てTIFFであること」 (p.4 in CDL 2008)
表 : ファイル形式を規定する代表的標準文書
タイトル |
発行元 |
発行年 |
Technical Guidelines for Digitizing
Archival Materials for Electronic Access:
Production Master Files - Raster Images |
U.S. National Archives
and Records
Administration |
2004年 |
Technical Standards for Digital
Conversion of Text and Graphic Materials |
Library of Congress |
2006年 |
CDL Guidelines for Digital Images Ver2.0 |
California Digital Library |
2008年 |
●(最近の動向) JPEG2000に関心が集まる
○ 背景 : 大規模な電子化が進む中 コスト削減が課題となっている。 JPEG2000は
ストレージ・コスト削減だけでなく プロダクション・コスト削減の可能性までも秘めている。
○ 最近の重要論文と論旨:
☆ 『JPEG2000 Implementation at Library and Archives Canada』
・ カナダ国立図書・資料館で行われたJPEG2000に関するパイロットテストの報告。
TIFFからJPEG2000に切り替えることで 30-50%コスト削減になると推測。
・ 著者 : Pierre Desrochers and Brian Thurgood, Library and Archives Canada
・ http://www.archimuse.com/mw2007/papers/desrochers/desrochers.html
☆ 『Compression and digital preservation : do they go together? 』
・ 「長期保存用は圧縮しない方が良い」 という業界常識に対する疑問から始まり
他のファイル形式 (圧縮/非圧縮) に対するJPEG2000の優位性を提示する。
・ 著者 : Judith Rog, National Library of The Netherlands
・ http://www.imaging.org/store/epub.cfm?abstrid=34425
☆ 『Page Image Compression for Mass Digitization』
・ HUL、フランス国立図書館、CDL、IA社、UCBなどにより JPEG2000の設定条件を最適化するためテストが行われた。そのテスト結果と考察をまとめる。
・ 著者 : Stephen Chapman, Harvard University Library 他
・ http://www.imaging.org/store/epub.cfm?abstrid=34415
☆ 『JPEG 2000 - a Practical Digital Preservation Standard? 』
・ 「電子情報を保存する標準としての “JPEG2000” の可能性について検討した技術観察レポート」
・ 著者 : Robert Buckley, Ph.D., Xerox Research Center Webster
・ http://www.dpconline.org/docs/reports/dpctw08-01.pdf
● (事例) JPEG2000採用事例
○ 英国図書館 Digital Preservation
○ 米国議会図書館 Chronicling America: Historic American Newspapers
○ (日本) 国立公文書館 Digital Gallery
○ ハーバード大学図書館 HUL Digital Repository Service
○ その他 (Google Earth、Google Print、Second Lifeなど)
● 参考文献 (枠内はカレントアウェアネスによる紹介記事)
○ Alternative File Formats for Storing Master Images of Digitisation Projects
Robert Gillesse, Judith Rog他 (Mar 2008)
資料のデジタル化事業を進めているオランダ王立図書館では 現在 デジタル画像の保存用マスターデータのフォーマットとして
TIFFを用いていますが デジタル化が完了する暁には650テラバイトものディスク容量が必要になる見込みです。
そこで 保存戦略を見直すべく TIFFの代わりとなり得る5つのフォーマットについて
その結果を報告書 “Alternative File Formats for Storing Master Images of
Digitisation Projects” として発表しました。
検討対象に挙がったのは JPEG 2000可逆(lossless)、JPEG 2000非可逆、PNG、JPEG、TIFF
LZW(LZW圧縮したTIFF)の5フォーマットで 総合的にはJPEG 2000可逆フォーマットが最も高い評価を得ています。
○ 『JPEG 2000 - a Practical Digital Preservation Standard? 』
Robert Buckley, Ph.D., Xerox Research Center Webster (Feb 2008)http://www.dpconline.org/docs/reports/dpctw08-01.pdf
デジタル保存連合 (Digital Preservation Coalition: DPC) は2008年2月 電子情報を保存する標準としての “JPEG2000” の可能性について検討した技術観察レポート “JPEG2000-
a Practical Digital Preservation Standard?” を発表しました。 (http://current.ndl.go.jp/node/7353)
○ Preservation in the Age of Large-Scale Digitization
Oya Y. Rieger (Feb 2008)
米国の図書館情報資源振興財団 (CLIR) が実施した調査事業 「大規模デジタル化時代における保存 (Preservation in the Age of Large-Scale Digitization)」 の報告書最終版が公開されました。
・Google、Microsoft、Open Content Alliance (OCA)、Million Book Projectの各イニシアティブの概観
・大規模デジタル化イニシアティブを 「保存」 の側面から評価する際のフレームワーク
・大規模デジタル化イニシアティブが蔵書構築 ・ 蔵書管理等に及ぼす影響
といった構成になっています。 (http://current.ndl.go.jp/node/7266)
○ Library of Congress Collaborates with Xerox To Test Format for Digitally
Preserving, Accessing Treasured Images
LOC (Oct 2007)
米国議会図書館 (LC) はこのほど Xerox社と共同で デジタル画像の保存と利用により適した方法を開発するプロジェクトに着手することを発表しました。
具体的には デジタル化された文化遺産資料の大規模なリポジトリで JPEG2000フォーマットを利用する可能性について研究するということです。
○ Preservation Plan for Microsoft - Update
British Library Digital Preservation Team (Jun 2007)
○ Compression and digital preservation : do they go together?
Judith Rog, National Library of The Netherlands (May 2007)
○ Page Image Compression for Mass Digitization
Stephen Chapman, Harvard University Library 他 (May 2007)
○ JPEG2000 Implementation at Library and Archives Canada
LAC (March 2007 )
○ Digital Imaging - How Far Have We Come and What Still Needs to be Done?
RLG (Apr 2007)
○ Digitisation in the British Library: strategy and partnerships
John Tuck, Head of British Collections (Jun 2006)
○ JPEG 2000 Profile for the National Digital Newspaper Program
Robert Buckley, Research Fellow, Xerox Innovation Group (Apr 2006)
○ Using JPEG2000 for Enhanced Preservation and Web Access of Digital Archives
? A Case Study
James S. Janosky, Aware, Inc.他 (Feb 2004)
○ The British Library Digital Preservation
○ CDL Guidelines for Digital Images Ver2.0
CDL (April 2008)
○ Technical Standards for Digital Conversion of Text and Graphic Materials
LOC (December 2006)
○ Technical Guidelines for Digitizing Archival Materials for Electronic
Access: Production Master Files ? Raster Images
NARA (June 2004)
(2008年 収集)