【デジタル化の基本】「ドット分け」と「色付け」で完全攻略!画像のデータ量とサンプリング定理

第1章:標本化(サンプリング)は画像の「ドット分け」

アナログ画像をデジタルデータにするための第一歩が「標本化(サンプリング)」です。 連続しているアナログ信号を、離散的(飛び飛び)なデジタル信号に変換する……と教科書には難しく書かれていますが、要するに「画像を細かい『ドット(マス目)』に切り分ける作業」のことです。

ドットが細かければ細かいほど解像度は向上しますが、元のアナログ信号(被写体)の細かさを超えて無駄に細かくドット分けしても、データ量だけが重くなって意味がありません。

では、「どれくらいの細かさでドット分けするのが正解」なのでしょうか?

1-1. サンプリング定理とナイキスト周波数(なぜ分母に「2」がつくのか?)

ここで登場するのが、国試でよく出る2つの数式です。どちらの式にも必ず「2」という数字が含まれていますが、この「2」の正体は何でしょうか?

画像や信号の元となる「アナログ信号」は、波の形をしています。1つの波(1サイクル)には、必ず「一番高いところ(山の部分・上)」「一番低いところ(谷の部分・下)」がありますよね。

この波の形をデジタルで正しく読み取る(ドットに分ける)ためには、最低でも「山」で1回、「谷」で1回、合計2回サンプリング(標本化)しなければ、波が上がって下がったという本来の形を再現できません。

つまり、「1つの波を記録するには、最低2つのドット(標本)が必要」という絶対ルールがあるのです。波の細かさに対して、常に2倍以上の細かさで拾いにいかなければならないため、数式に「2」が登場します。

  • 最適なサンプリング間隔(D)どれくらいの間隔でドット分けすれば良いかを示す式です。
    $$D = \frac{1}{2f_{max}}$$
    (※ $f_{max}$ は最高空間周波数。つまり画像に存在する「一番細かい波」のこと。それを上と下で2回拾うので分母に2がつきます)
  • ナイキスト周波数逆に、今のドットの間隔(d)で、「どれくらい細かい波までなら元の形を保って表現できるか」の限界を示す式です。
    $$ナイキスト周波数 = \frac{1}{2d}$$

数式が苦手な人は、「波の上と下を拾うから、限界のルールには『2』がつく」と理解しておけば、国試の数式選択問題で迷うことはなくなります!

1-2. エリアシング誤差と「モアレ」(ドットが粗すぎる悲劇)

もし、この「最低でも2つのドットが必要」というルールを破って、細かいシマシマを広すぎるサンプリング間隔(粗いドット)で無理やり読み取ろうとしたらどうなるでしょうか?

  • エリアシング誤差ナイキスト周波数(限界の細かさ)よりも高い周波数成分(細かすぎるシマシマ)を読み取ろうとすると、機械がバグを起こし、「低い周波数成分(太いシマシマ)」だと勘違いしてしまいます。
  • アーチファクト(モアレ)この勘違いによって、元の画像には存在しない「波打つようなシマシマ模様」が画像の上に現れてしまいます。この現象(アーチファクト)を「モアレ」と呼びます。

国試では「サンプリング間隔が広すぎる → 高周波が低周波に化ける(エリアシング) → モアレ発生」という呪文のコンボを必ず覚えてください。

1-3. アパーチャ効果(ドットが「面」であることの弊害)

ドット分けをするとき、ドットは「点」ではなく「面積(アパーチャ)」を持った四角いマス目です。

この四角いマス目の中に入ってきた光は、すべて「平均化(ごちゃ混ぜ)」されて1つの値になってしまいます。これによる一長一短をアパーチャ効果と呼びます。

  • メリット:ノイズ特性が向上するマス目の中で平均化されるため、極端に飛び抜けたノイズ(捨てるべき信号)が薄められ、ザラつきが減ります。
  • デメリット:解像度が劣化する平均化されるということは、細かいエッジ(高周波成分)も一緒にボヤけてしまう(減衰する)ということです。結果として、画像のシャープさが失われます。

第2章:ドットに「色(白黒・カラー)」を塗る「量子化」の完全理解

第1章の標本化(サンプリング)によって、アナログ画像は細かいマス目(ドット)に切り分けられました。しかし、この段階ではまだドットの枠組みができただけで、中身の色は決まっていません。

それぞれのドットに「どれくらいの濃さの白黒」あるいは「どんな色」を塗るかを決める作業、それが量子化です。

2-1. 量子化とは?(連続値から離散値への変換)

標本化された直後の電気信号の強さは、中途半端な小数点以下の値を含む「アナログ値(連続値)」です。しかし、コンピュータは0と1しか理解できないため、この中途半端な値を「1段、2段、3段…」といった明確な「デジタル値(離散値)」の階段に当てはめて、キリの良い整数に丸め込む必要があります。

この連続的な信号を、あらかじめ決められた段階的な明るさや色(階調)に当てはめていく処理を量子化と呼びます。このとき、階段の1段1段の高さの幅(明るさの区切り方)のことを量子化間隔と呼びます。

2-2. ビット数と「濃度分解能・雑音」の絶対法則

量子化によって画像を何段階のグラデーション(階調)で表現(色塗り)できるかは、割り当てられるデータ量である「ビット数(X)」によって決まります。この関係性は以下の式で表されます。

$$ 階調数 = 2^X $$

  • X:割り当てられるビット数

■ 画質への影響(なぜ階調が多いとノイズが減るのか)

ビット数(X)が大きくなればなるほど、量子化レベル数(階段の段数)が飛躍的に増加し、より豊かなグラデーションで色塗りが可能になります。これにより、画像には以下のような劇的な変化が起こります。

  • 濃度分解能が向上する階段の段数が増えるということは、わずかなX線量の違い(組織のわずかな吸収差)を、異なる濃さのピクセルとして描き分けられるようになるということです。これを「濃度分解能の向上」と言います。
  • 雑音が減少する本来のアナログ値を無理やり近い整数の階段に丸め込む際、必ず「本来の値とのズレ」が生じます。これを量子化誤差と呼びます。ビット数を増やして階段の段差を細かくすればするほど、この丸め込みによるズレ(誤差)が小さくなるため、結果として画像上のザラつき(量子化雑音)が減少します。

2-3. 白黒(グレースケール)とカラー画像の量子化の違い

デジタル画像において、ドットに塗る色は「白黒」だけではありません。医療現場では目的やモダリティ(撮影装置)によって、白黒とカラーを明確に使い分けて量子化を行っています。

  • グレースケール画像(白黒)一般撮影(DR)やCT、MRIなどの画像です。わずかな組織の濃度差(コントラスト)を見分けることが最大の目的であるため、色情報は切り捨てて白黒のみに絞り、その代わり12〜14ビット(4096〜16384階調)という非常に細かく豊かなグラデーションを持たせています。
  • カラー画像内視鏡、超音波(カラードプラ)、核医学(フュージョン画像)、3Dワークステーションのレンダリング画像などで使用されます。カラー画像の場合は、光の三原色であるR(赤)、G(緑)、B(青)の3つのチャンネルそれぞれに対して量子化を行います。一般的には各色に8ビット(256階調)ずつを割り当てます。これにより、256 × 256 × 256 ≒ 約1677万色(フルカラー)の豊かな色表現が可能になります。

2-4. 線形量子化の定義

量子化の区切り方にはいくつか種類がありますが、国家試験で基本となるのは線形量子化です。

  • 線形量子化すべての量子化間隔(階段の1段の高さ)が、信号の大きさに関わらず「すべて等しい(均等な幅である)」量子化方式のことです。

第3章:画像データ量の計算と「単位のひっかけ」対策

第1章の「ドット分け(標本化)」、第2章の「ドットへの色塗り(量子化)」を経て、画像がデジタルデータとして完成しました。本章では、その完成した画像1枚が「どれくらいのデータ量(重さ)になるのか」を計算する公式と、国家試験で頻出する「単位の大文字・小文字の罠」について解説します。

3-1. 画像データ量を決める公式

画像全体のデータ量は、これまで学んできた要素をすべて掛け合わせることで簡単に求めることができます。

$$ \text{画像のデータ量}[b] = マトリックスサイズ(M \times N) \times 標本化数 \times 量子化数 $$

縦と横のマス目の総数(マトリックスサイズ)に対して、さらにフレーム数などの標本化数を掛け、最後に1マスあたりに割り当てた色のデータ量(量子化数)を掛けることで、全体のデータ量 [b] が算出されます。

3-2. 記憶媒体の単位「B(バイト)」と「1024」の法則

計算式で求めたデータ量の最小単位は b(ビット) です。しかし、ハードディスクやUSBメモリなどの記憶媒体にデータを保存する際は、通常 B(バイト) という単位が使われます。

ここで必ず覚えておくべき絶対ルールがあります。大文字の「B」はバイト、小文字の「b」はビットを表します。

  • 1 B = 8 b

さらにデータ量が大きくなると、K(キロ)、M(メガ)、G(ギガ)といった接頭辞がつきます。ここで重要なのが、コンピュータは「0と1」の2進数で動いているため、記憶容量は2の10乗である 1024 倍ごとに単位が繰り上がるという点です。

  • 1 GB = 1024 MB

3-3. 伝送速度の単位「bps」と「10の9乗」の罠

作成した画像データをネットワーク経由で送信する場合の「伝送速度」にも注意が必要です。通信の世界では、B(バイト)ではなく b(ビット) 単位が用いられ、1秒間に送れるビット数を bps(bits per second) で表します。

ここが国家試験最大のひっかけポイントです。記憶媒体の容量は「1024倍」で計算しましたが、ネットワークの伝送速度の場合は、物理的な周波数の基準である10進数(10の3乗=1000倍)ごとに単位が繰り上がります。

  • 1 Gbps = 1 × 10の9乗 bps

【国試の重要ポイント】

国家試験の計算問題では、単位を揃える手順と、大文字・小文字の見極めが必ず求められます。以下の違いを確実に暗記してください。

  • 大文字の B はバイト、小文字の b はビットである。
  • 画像のデータ量を求める基本単位は b である。
  • 記憶媒体に保存する際は、1 B = 8 b で換算する。
  • 記憶容量(B)の接頭辞は、1024(2の10乗) 倍ごとに繰り上がる。
  • 伝送速度の単位は B ではなく bps(b/秒) である。
  • 伝送速度(bps)の接頭辞は、1000(10の3乗) 倍ごとに繰り上がる。(例:1 Gbps = 10の9乗 bps)

コメント

タイトルとURLをコピーしました