画像情報特論 (4)

画像情報特論画像情報特論 (4)(4)- ディジタル圧縮とメディア表現

(1) ビデオ圧縮

電子情報通信学科甲藤二郎E-Mail: katto@katto.comm.waseda.ac.jp

2002.05.14

ビデオ圧縮の原理

ディジタル動画ディジタル動画 (1)(1)• 時間方向・空間方向のサンプリング

時間

フレーム

フレーム周期 (1/30 秒～ )

カメラビデオキャプチャ

• RGB / YUV 変換

31.052.021.032.028.060.0

11.059.030.0

RGB 各８ビット YUV 各８ビット

ディジタル動画ディジタル動画 (2)(2)• CCIR 601 フォーマット

UV 垂直解像度半分 UV 水平・垂直解像度半分YUV 解像度同じ

• 通常のビデオ圧縮： 4:2:0 フォーマット• 高画質ビデオ圧縮： 4:2:2 フォーマット

ディジタル動画ディジタル動画 (3)(3)• 莫大な情報量

用途TV 会議

解像度352x240

720x480

1920x1080

データ量21Mbit/s

83Mbit/s

498Mbit/s

データ圧縮の必要性

ビデオ圧縮の仕組みビデオ圧縮の仕組み• MC+DCT ハイブリッド予測符号化 (20 年間変わらない方式 )

DCT 量子化

逆量子化

逆 DCT

メモリ動き補償

動き検出

エントロピー符号化

符号量制御YUV 入力

局所デコーダ

時間方向の相関除去： MC ( 動き補償： motion compensation)

空間方向の相関除去：DCT ( 離散コサイン変換： discrete cosine transform)

圧縮ストリーム

Q: 局所デコーダが必要な理由を説明せよ

フレーム内符号化フレーム内符号化空間方向の相関除去

• DCTフレーム

ブロック

DCT ( 離散コサイン変換 )

隣接ブロック間でさらに予測 ( 特に直流成分 )

特定の変換係数にエネルギーが集中

画像信号の性質：隣接画素間の相関が非常に高い( 相関係数 : 0.9 ～ )

直交変換

直交変換直交変換 (1)(1)空間方向の相関除去

KLT, DCT, DFT の符号化利得の比較

理論的最適値

0 2 4 6 8 10 12 14 16

OPTIMUM ()

KLT, DCT

• DCT が使われる理由

直交変換のブロックサイズ

圧縮効率

KLT: 理論的に最適な直交変換。DCT: 相関の高い入力に対するKLT への漸近性、及び高速アルゴリズムが存在。通常は 8x8 サイズの DCT を使用。

角周波数0

LLL LLH LH H

2h0(n)

2h1(n)

2h0(n)

2h1(n)

2h0(n)

2h1(n)

2 分割フィルタバンクのツリー接続

直交変換直交変換 (2)(2)• Wavelet 変換 ( 対抗 )

空間方向の相関除去

ピラミッド表現長所：ブロックひずみが少ない短所：ブロック動き補償と相性が悪い

DCT, Wavelet の符号化利得

0 1 2 3 4STAGES

OPTIMUM ()DCT(16)DCT(8)

DCT(4)

Wavelet:● 　直交 CQF (16tap)▲ 　 SSKF (5/3)

直交変換直交変換 (3)(3)• DCT と Wavelet の比較

空間方向の相関除去

理論的最適値圧縮効率

Wavelet の多段接続数• DCT ：動画 ( ビデオ ) 圧縮• Wavelet: 静止画圧縮 (JPEG-2000)

フレーム間符号化フレーム間符号化 (1)(1)

• I: I ピクチャ ( フレーム内符号化 )

• P: P ピクチャ ( フレーム間符号化 )

I P P P P P P

時間方向の相関除去

• IP 予測

ビデオ信号の性質：隣接フレーム間の相関が非常に高い( 相関係数 : 0.9 ～ )

フレーム間の予測誤差がほとんどゼロ

さらに動き検出・動き補償予測

• I: I ピクチャ ( フレーム内符号化 )

• P: P ピクチャ ( 片方向予測 )

I B B P B B P

• B: B ピクチャ ( 両方向予測 )

→ 予測効率の改善

時間方向の相関除去フレーム間符号化フレーム間符号化 (2)(2)• IPB 予測

片方向で予測を行うより、両方向で予測を行うほうが予測効率が高い( ただし、フレーム間の距離に依存 )

I B B P B B P

奇数フィールド偶数フィールド

• 動き補償：フィールド予測、フレーム予測、デュアルプライム予測• DCT: フレーム DCT 、フィールド DCT

ディジタル TV 放送に対応 (MPEG-2)

時間方向の相関除去フレーム間符号化フレーム間符号化 (3)(3)• フィールド予測

動き検出と動き補償動き検出と動き補償 (1)(1)• 動き検出 ( ブロックマッチング ) ：　過去の画像 ( 参照フレーム ) から、現在の画像 ( カレントフレーム ) に最も類似　しているブロックを探索し、動きベクトルを求める。• 動き補償：　動き検出で求めた動きベクトルから、カレントフレームの予測画像 ( 予測フレーム ) 　を作成する。

カレントフレーム参照フレーム動きベクトルブロック

予測フレーム

ブロック類似

③ 予測誤差① 動き検出

② 動き補償

動き検出と動き補償動き検出と動き補償 (2)(2)• 半画素精度動き補償 : 　線形内挿を行い、 0.5 画素精度の動きベクトルを算出し、予測画像　を作成。

画素線形内挿画素内挿フィルタ：0.5 0.5

各々 0.25

( 注 ) 1/4 精度、 1/8 精度の効果はほぼ飽和

予測フレーム参照フレーム通常のブロックマッチング

予測フレーム参照フレームオーバーラップ動き補償

動き検出と動き補償動き検出と動き補償 (3)(3)• オーバーラップ動き補償 : 　隣接ブロックの動きベクトルも利用し、ブロックの平滑化加算によって　予測画像を作成。

平滑化平滑化：台形ウィンドウ、コサインウィンドウなど。

整数画素精度・ブロック動き補償に対する半画素精度・オーバーラップ動き補償の予測利得

0.7 0.75 0.8 0.85 0.9 0.95 1Estimation Reliability

オーバーラップ + 半画素

半画素のみ

オーバーラップのみ

動き予測しやすい画像の場合

動き予測しにくい画像の場合

整数精度ブロックマッチング

予測誤差の低減効果

動き検出と動き補償動き検出と動き補償 (4)(4)• 特性比較

国際標準方式

H.261 ISDN 用テレビ電話団体名称当初の用途

H.263 アナログ回線用テレビ電話1990 年

時期

1996 年

MPEG-1 CD-ROM1992 年MPEG-2* ディジタル放送1995 年MPEG-4 インターネット、移動体1999 年

H.263+ インターネット、移動体1998 年

64kb/s ～ 2Mb/s

符号化レート

数十 kb/s ～

～ 1.5Mb/s

数 Mb/s ～数十Mb/s

数十 kb/s ～

* MPEG-2/H.262 、 H.26L は ISO と ITU-T のジョイント規格

国際標準方式国際標準方式 (1)(1)

H.26L* インターネット、移動体2003 年 ? 数十 kb/s ～

82 84 86 88 90 92 94 96 98 00

H.120 Sub-rate H.261 H.263 / H.263+

MPEG-4MPEG-1

MPEG-2 /H.262

MC( 動き補償 )

1.5M 384K 64K - 1.5MISDN

MC+DCT の基本構成

Internet, 移動体

モデム , Internet, 移動体

放送、 DVD 、 HDTV

CD-ROM

国際標準方式国際標準方式 (2)(2)02

Joint (ITU-T & ISO)

Internet, 移動体

誤り耐性形状符号化B ピクチャ半画素精度フィールド予測スケーラビリティ

名称

MPEG-1

MPEG-2

MPEG-4

H.263+

国際標準方式国際標準方式 (3)(3)

MC+DCT

1/2 画素

IPB 予測

スケーラビリティ

フィールド

再同期

形状符号化

• 代表的な機能の比較

インターネット放送で有効+ 符号量制御 ( 後述 )

H.26L ○ ○ ○ △- ○△

ISO/IEC MPEG-4

MPEG-4 MPEG-4 の特徴の特徴• 機能拡張 ( 誤り耐性とオブジェクトベース符号化 )

誤り耐性ツール ( アダプテーション ) ：　シンプルプロファイル形状符号化ツール (シーン合成 ) ：　コア・メインプロファイルスプライト符号化：　メインプロファイル

静止画像符号化 (Wavelet 変換 ) ：　ハイブリッドプロファイル顔画像・胴体アニメーション：　ハイブリッドプロファイルメッシュ符号化：　ハイブリッドプロファイル

シーン合成Hello

“Hello”

前景( 形状符号化 )

背景

テキスト

形状符号化形状符号化 (1)(1)

( 注 ) 形状取得方法 (領域分割方法 ) は標準化の対象外

MPEG-4

• オブジェクト合成

通常のマクロブロック

境界マクロブロック

スキップマクロブロック

オフセット (x, y)

VOP領域 (w, h)

通常のフレーム (CIF, QCIF, …)

形状符号化形状符号化 (2)(2)• 境界マクロブロック

(1) 形状範囲外をパディング(2) ポリゴンマッチング(3) 予測画像作成

(1) I- ピクチャ：ブロック内平均値でパディングしたブロックに DCT (2) P- ピクチャ：形状範囲外を 0 でパディングしたブロックに DCT

境界 MB のテクスチャ符号化

水平パディング垂直パディング

境界マクロブロック

形状符号化形状符号化 (3)(3)• 境界マクロブロックにおけるパディング処理

境界 MB の動き検出・動き補償

2 値画像 (0,1) として符号化(1) バイナリ符号化

(0, 255) の画素とみなして符号化 (DCT)

(2) グレイスケール符号化

( 参考 ) (R, G, B, A) 、 (Y, U, V, A) フォーマットA: アルファマップ ( コンピュータグラフィックス用語 )A = 0: 透過、形状無し (transparent)A = 255: 形状あり (opaque)A = 1 ～ 254: アルファブレンディング (前景と背景の混合 )

形状符号化形状符号化 (4)(4)• 形状の符号化

ITU-T H.26L(進行中 )

H.26LH.26L の特徴の特徴• 圧縮効率の改善 (目標 : 　 MPEG-4 の 50%)

多モード・イントラ予測

多モード・動き補償予測

　　可変ブロックサイズ、 1/4 ・ 1/8 画素精度、複数参照ピクチャ、ループフィルタ

整数変換 (⇔ 浮動小数点 DCT)

符号化レイヤとネットワークレイヤの分離　　　　 VCL: Video Coding Layer　　 NAL: Network Adaptation Layer → RTP Packetization

ファイルフォーマット

多モード・イントラ予測多モード・イントラ予測I A B C DE a b c dF e f g hG i j k lH m n o p

符号化済み画素

未符号化画素

mode 0: DC predictionmode 1: Vertical/Diagonal predictionmode 2: Vertical predictionmode 3: Diagonal predictionmode 4: Horizontal predictionmode 5: Horizontal/Diagonal prediction

mode 0:

予測値 = (A+B+C+D+E+F+G+H) / 8

mode 1: a = (A+B) / 2e = Bb = i = (B+C) / 2f = m = Cc = j = (C+D) / 2d = g = h = k = l = n = o = p = D

I A B C DE a b c dF e f g hG i j k lH m n o p

予測の方向例：

多モード・動き補償予測多モード・動き補償予測

0 1 2 3

4 5 6 7

8 9 10 11

12 13 14 15

mode 116x16 block

1 vector

mode 28x16 block2 vectors

複数参照ピクチャ複数参照ピクチャ

P P P P P P

符号化済みピクチャ

参照ピクチャの適応切り替え

画像情報特論 (4)

Documents

画像情報特論 (4)

特集「ネオ・サイバネティクス」・論文テクノ画像 …特集「ネオ・サイバネティクス」・論文テクノ画像により剥奪される身体性に関する基礎情報学的研究

2010 年マルチメディア論画像処理演習（２）

RGB画像と深度画像から分析した植物成長状態を提 …...筑波大学大学院博士課程システム情報工学研究科修士論文 RGB画像と深度画像から分析した植物成長状態

画像処理と医用画像 - cs.tsukuba.ac.jpkudo/online/media-siryou.pdf · 2．画像処理入門『画像処理』の基礎的な部分の一部を説明『画像処理』基礎技術の全体像

画像のヒストグラム平坦化についてcafe.mis.ous.ac.jp/2015/sawasemi/画像の...2015年度卒業研究論文画像のヒストグラム平坦化について岡山理科大学

論文時空間画像処理による雨天時画像からの視野妨 …yamashita/paper/A/A025Final.pdf論文時空間画像処理による雨天時画像からの視野妨害ノイズ除去

論文画像の認識・理解論文特集kurazume-lab.sakura.ne.jp/kurazume_lab/papers/IEICE07-3.pdf · 論文画像の認識・理解論文特集並列Fast Level Set Method による移動体の高速な三次元形状復元

照明の操作マニュアル①照明の操作マニュアル② 照明コントローラー(画像④)の電源をONにする。(上部にスイッチ画像③) 画像③ 画像④

FinePix AX200 AV100”»像のサイズを小さくする（jリサイズ）.....73 画像を回転する（N画像回転）.....73 画像をコピーする（P画像コピー） .....74

画像処理システム論（視覚情報処理論）kato/IPS10/IPS-101216-a.pdf画像処理システム論（視覚情報処理論） Image Media Systems 視覚感性と画像処理（5）

MATLABによる画像処理2yamasho/old/IP2.pdfMATLABによる画像処理画像処理の流れと分類画像入力－画像変換－情報計測画像処理は次元を減らすことで特徴量を抽出する

メイン画像・サブ画像についてs3.amazonaws.com/JP_AM/su/201890960.pdf · 商品画像の登録には、メイン画像サブ画像それぞれに、Amazonの定めるルールがあります。

Image Montage by Optimizing Relative Arrangement of Two ... · 2枚の入力画像（前景画像，背景画像）を用い，前景画像から切り抜いた前景領域を背景画像上に手動で配置して出力画像を

ASTER画像ASTER画像からからからの影の影の影 … 年度修士論文 ASTER画像ASTER画像からからからの影の影の影ののの抽出抽出抽出と都市密度の分類と都市密度の分類

パターンとシンボル画像の処理と認識・理解 · 3次元画像計測・認識 "画像生成（シンボル→パターン）! コンピュータグラフィックス

画像工学cv › files › 画像工学スライド...2017/07/27 · 画像理解(image understanding) 画像から得られる情報を統合し、画像がもつ意味を構造的に理解する。画像処理とCG

画像提供 - Iki...画像提供 - Iki ... と

A4shiagari 6P nakamen 2015 Re3 › static › file › media2015.pdf · 画像システム系情報デザイン系コンピュータ概論／メディア画像機器入門／

画像再生 - Panasoniccar.panasonic.jp/support/manual/g_navi/data/gl300d/gl300...I‒3 画像再生〔画像再生する〕画像再生する ① モードボタンモード選択画面を表示する。②