量子化|連続信号を有限ビットで表現

量子化

量子化とは、連続的な値をとる信号やデータを有限個の離散レベルへ写像する処理である。アナログ信号をデジタル表現する際の基幹ステップであり、標本化(サンプリング)により時間離散化した後、振幅を離散化して符号化(エンコード)へ渡す。実装はA/Dコンバータ(ADC)や、画像・音声コーデック、機械学習モデルの推論最適化など多様な分野で用いられ、設計ではビット数、ステップ幅Δ、誤差特性、歪みと帯域・レイテンシ・電力のトレードオフを総合的に最適化する。

基本概念とモデル

量子化は入力xを離散代表値集合{y_k}へ写像する非線形写像である。等間隔の一様量子化では区間幅Δを定め、xが区間[kΔ,(k+1)Δ)に入れば代表値y_kを出力する。丸め規則にはmid-rise(ゼロ交差が閾値)、mid-tread(ゼロ付近に幅を持つ不感帯)の差異がある。丸め誤差e=x−Q(x)は理想化仮定(入力がステップに比べ十分滑らかで、飽和が無視できる)では一様分布U(−Δ/2,Δ/2)に近似でき、分散はΔ²/12となる。

量子化雑音とSNR

誤差eを白色雑音として扱うと、フルスケール振幅Aの正弦波をNビット一様量子化したときの信号対雑音比(SNR)は近似的にSNR≒6.02N+1.76[dB]で与えられる。すなわち1ビット増加ごとに約6dB改善する。過大入力では区間外でクリッピングが生じ、粒状雑音(granular noise)とは異なるオーバロード歪みとなる。入力の統計やダイナミックレンジに応じてΔやフルスケールを整合させることが重要である。

非一様量子化とコンパンディング

人間の知覚や信号の確率分布が非対称・尖度大である場合、非一様量子化が有効である。代表例がμ-lawやA-lawのコンパンディングで、対数近似により小振幅域の解像度を高く、大振幅域を粗くする。これにより平均二乗誤差(MSE)を低減し、主観品質の改善や低ビットレートでの透明性向上に寄与する。設計では入力PDFに対するLloyd–Max最適化により、しきい値と代表値を数値的に求める。

スカラー量子化とベクトル量子化

各サンプルを独立に写像するスカラー量子化は実装容易で低遅延だが、相関の高い信号には冗長である。ベクトル量子化(VQ)はサンプルブロックを高次元ベクトルとしてコードブックの代表ベクトルへ写像する手法で、LBG(Linde–Buzo–Gray)アルゴリズムなどで学習する。VQはレート–歪み最適化の観点で有利だが、コードブック探索の計算量やハード実装の複雑さとの折り合いが必要となる。

ディザと誤差のホワイト化

入力と量子化誤差の相関が無視できない場合、可聴アーチファクトや帯域内の構造化した雑音が生じる。ディザ(微小な擬似雑音)を加算して量子化前の入力をランダム化すると、誤差が統計的に白色化され、バイアスや相関が緩和される。オーディオではノイズシェーピングと組み合わせて聴覚感度の低い帯域へ誤差電力を押し出し、主観品質を高める。

固定小数点・浮動小数点における量子化

組込み制御や信号処理の固定小数点実装では、丸め・切り捨て、飽和・ラップアラウンドなどの振る舞いが安定性や位相特性に影響する。浮動小数点でも有限精度による丸め誤差は不可避であり、累積により演算順序への依存や数値的不安定性が顕在化する。スケーリング、ブロック浮動小数点、Kahan加算などの手法で誤差を管理する。

画像・音声・通信での応用

画像では画素値の8〜12ビット量子化が一般的で、ガンマ特性やヒト視覚系の非線形性を踏まえた非一様マッピングが使われる。音声・音響では16〜24ビットPCMやコンパンディングPCM、ΔΣ変調器が普及する。通信ではアナログ帯域を狭めつつ、標本化定理に適合するフロントエンド設計(アンチエイリアシング、S/H、基準電圧設計)と量子化ビット数の選定がスループットと誤り率、消費電力のバランスを決める。

レート–歪み理論と設計指針

情報理論の観点では、目標ビットレートRに対して許容歪みDを最小化するレート–歪み最適化が中心課題となる。実務では(1)信号統計と用途に応じた一様/非一様量子化選択、(2)Δやフルスケールの自動利得制御(AGC)による最適化、(3)ディザ・ノイズシェーピングの導入、(4)後段のエントロピー符号化(Huffman、算術符号)との協調、(5)ハード・電力・遅延制約の満足、といった多目的最適化を行う。

ニューラルネットワークの量子化

推論高速化と省電力化のため、学習済み重みとアクティベーションを8ビットや4ビットへ量子化する手法が一般化している。後量子化(PTQ)はキャリブレーションでスケールを推定し、量子化対応学習(QAT)は学習中に丸めの影響を近似勾配で反映させる。対称/非対称、per-tensor/per-channel、整数行列演算(INT8 GEMM)の選択が精度とスループットを左右する。

実務上のチェックリスト

  • 信号の分布とダイナミックレンジを推定し、フルスケールとΔを整合
  • 一様で足りない場合はμ-law等の非一様量子化を検討
  • ディザの有無とノイズシェーピングの効果を評価
  • SNR≒6.02N+1.76[dB]を目安に必要ビット数を概算
  • 固定小数点の丸め・飽和仕様を明示し、最悪ケースを検証
  • 後段の圧縮・符号化と協調設計し、全体のレート–歪みを最適化

用語と記号の補足

Δ:量子化ステップ幅、e:量子化誤差、MSE:平均二乗誤差、SNR:信号対雑音比、VQ:ベクトル量子化、PTQ/QAT:ニューラルネットの後量子化/量子化対応学習、mid-rise/mid-tread:丸め規則の類型、コンパンディング:非線形前処理によるダイナミックレンジ圧縮である。