@文書情報マネジメントとは? | Aコンピュータの基礎知識 | Bコード情報(電子文書)とイメージ情報(電子化文書)の基礎 | Cイメージ情報の入力・検索・保存 | Dアナログ(マイクロフィルム)とデジタルのハイブリッド(融合) | Eネットワークの知識 | FCOMシステム | G確認テスト | H確認テスト回答 |
コード情報(電子文書)とイメージ情報(電子化文書)の基礎
文字情報のコード情報入力 コード情報とは コード情報とは文書情報のなかでも文字を中心とした情報、あるいはイメージ情報を検索するための索引となる目的で入力されている情報のことで、文字コードによって認識される情報のことである。 コード情報の入力方法 @キーボードからの入力 キーボードからの直接入力が基本の入力方法である。 タイピングミス等が発生しがちとなるため、重要なキー項目にはシステム的にチェックデジットなどを利用して正確さをはかる必要がある。 AOCR機器からの入力方法 OCR(Optical Character Recognition)とは、光学的に読み取ったイメージ情報から、文字情報を読み取ってコード情報に変換する技術である。 スキャナから原稿を読み取った状態ではビットマップのイメージ情報なのでコード情報に変換する必要がある。 この変換を、OCR解析という。 OCR解析には、ハードウェアとソフトウェアの両方を利用して解析する方法と、ソフトウェアだけで解析する方法がある。 Bバーコードからの入力方法 バーコードとは、白と色地(通常は黒)の線の集まりと、その線の太さによって特定のコードを対応させたもので、この縞模様を光学的に読み取ることにより、コードを認識する。 日本でJIS 規格化された「総合標準バーコード」は、JAN、標準ITF、CODE-128、CODE39、NW-7の5種類がある。 |
|
ビットマップフォント | アウトラインフォント |
イメージ情報に関する基礎知識 デジタルとアナログの変換について 実生活のほとんどはアナログ情報である。 しかし、コンピュータは全ての情報をデジタルで表現する。 そのため、実世界のデータをパソコンに入力するには、アナログ情報からデジタル情報への変換作業が必ず必要になる。 @ アナログデータからデジタルデータへ (A/D変換) アナログ信号をデジタルデータとして符号化し、ハードディスクなどに取り込む。 これをサンプリングあるいは標本化という。 A デジタルデータからアナログデータへ (D/A変換) ハードディスク内のファイルを読み、このデータをもとに1つ1つの標本の大きさを復元する。 イメージ情報のタイプ @ ビットマップデータ ビットマップは小さな点で画像を表現する仕組みで、その画像を描く最小の単位は「画(picture)」と「要素(element)」という意味を合わせて、「画素(pixel)」と呼ぶ。 また単に「点(dot)」とも呼ばれている。 ビットマップは1つの画像(イメージ)を1つ1つの小さな点で表現する。 従って、その特性上、画素が小さいほど精密な画像が描けることになる。 この画素の細かさ単位を「解像度」といい、1インチ当たりの画素数で表す。 単位は「dpi(ドットピッチ:dot per inch)」という。 A ベクトルデータ ベクトルデータは、画像を「書き方の命令」の集まりととらえ、CADなどで利用されているデータである。 画質について 画像の品質(画質)を決める要素には次のものがある。 @画素数、A階調数、B画像のダイナミックレンジとS/N 比 @ 画素数 画像を構成する画素の数を画素数という。 画素数が多いほど品質は良くなるが、ファイルサイズが大きくなるため、出力時間やパソコンでの処理時間がかかるなどの問題も発生する。 特にネットワークを通じて送受信する際には、ネットワークの環境により通信時間などが問題となることが多いので、画素数を多くすることがよいのではなく、使いやすさとのバランスから画素数の決定が必要である。 人間の目の解像力は20 dot/mm 程度である。 一般のカラー画像では、300 dpi (11.8 dot/mm 相当)とすればまず満足する値となる。 A 階調数 カラーやグレースケールの調子の段階を階調という。 デジタル信号は文字原稿のような白黒のみの画像では、2値情報が使われることが多いが、写真などの連続の階調を持った原稿では多値の情報を使用する。 パソコンが扱いやすい単位として8bit が使われるケースが多い。 8bitは2の8乗で256の階調を表す。 カラーの場合は、RGBそれぞれの色に256階調を持たせると、256×256×256=16,777,216色の再現ができることになる。 8bitの256階調では滑らかなトーンのある明るさの変わり目などで段差が出てしまうことがあるので、デジタル化の前に明るい部分と暗い部分で階調に差をつけ(非線形処理)、段差を目立たなくする処理をする場合である。 また、階調数を16bit、24bitにすることもある。 B画像のダイナミックレンジとS/N 比 入力する光学的な画像に対して信号として受け取ることのできる明るさの範囲、または再現できる明るさの範囲の能力をダイナミックレンジという。 スキャナで画像を取り込む際に、スキャナのダイナミックレンジが被写体である資料の濃度レンジより狭いと、低濃度側や高濃度側の階調(濃度変化)がなくなってしまう。 特にカラー写真をスキャンする時には、このダイナミックレンジに気をつける必要がある。 SN比は、信号(S)と雑音(N)の比で、この値が大きいほどよい画質になる。 ノイズが多いと、信号がノイズに打ち消されて、ダイナミックレンジは打ち消されてしまう。 画像をクッキリさせるような処理をするときにSN比が低いと、ざらついた汚い画像になってしまうので、SN比にあった画像処理にをする必要がある。 モノクロ画像のデジタル化 モノクロ画像には、大きくわけて2値(白か黒)とグレースケールに分けることができる。 @ 白黒2階調(2値) 画像の各ピクセルを、白か黒のいずれかにあてはめることにより、表現する方法である。 (例:FAXなどで出力される文字原稿) 1画像を1ビットに対応させているだけで色成分を保存しておく必要がないため、データは最もコンパクトである。 A グレースケール モノクロ写真のようなアナログの画像は、各点ごとに明るさの決まった連続的なデータである。 B カラー画像 2級の範囲外 |
@文書情報マネジメントとは? | Aコンピュータの基礎知識 | Bコード情報(電子文書)とイメージ情報(電子化文書)の基礎 | Cイメージ情報の入力・検索・保存 | Dアナログ(マイクロフィルム)とデジタルのハイブリッド(融合) | Eネットワークの知識 | FCOMシステム | G確認テスト | H確認テスト回答 |
出典:デジタル化に対応した文書情報マネジメントの基礎と応用 (社)日本画像情報マネジメント協会新資格準備委員会編 |