5
NTT技術ジャーナル 2014.2 63 4K・8Kサービスを実現する超高臨場感映像技術 MMT標準化の背景 メディア伝送規格として幅広く利用 されているISO/IEC動画像国際標準 MPEGの シ ス テ ム 規 格MPEG2-TS (Transport Stream) *1 の標準化から 約20年が経過し,コンテンツ配信の環 境が大きく変化しています.映像 フォーマットは多様化する一方, HDTV(High Definition Television) の本格的な普及を迎えて,4K ・ 8Kな ど高解像度なものへと移行してきまし た.さらにコンテンツを利用する端末 や,伝送路もインターネットから専用 線,携帯電話網,無線LAN,放送ま で多様化しています.このような背景 の下,MPEGでは高効率映像符号化 HEVC(High Efficiency Video Coding)の規格化と並行して,さま ざまな伝送路でのメディア伝送に対応 する新しい伝送規格として,MMT (MPEG Media Transport) (1) の標準 化を進めてきました.NTT未来ねっ と研究所では,これまでデジタルシ ネマ,ODS(Other Digital Stuff) *2 スーパーテレプレゼンスなど,具体的 なアプリケーションを念頭に4K映像 伝送の研究開発を進めてきましたが, コア技術である誤り訂正符号および階 層化処理技術の普及を目指して, MMTの議論に当初から参画し,標準 化に貢献してきました. MMTの概要 MPEG2-TSは,映像や音声などコ ンテンツを構成するメディアを単一の 固定長パケットに多重化します.同じ コンテンツを多数のユーザへ届ける放 送などには適した方式です.しかし現 在,映像フォーマットや伝送路は多 様化し,MPEG2-TSは標準化時には 想定していなかった用途で用いられ ています.MMT標準化の議論が始 まった2009年当初,MPEG2-TSを用 いた4K ・ 8K映像伝送ではTSパケッ トの大きさが適さないことが指摘さ れ,SVC(Scalable Video Coding) やMVC(Multiview Video Coding) などのマルチレイヤ符号の複数伝送路 での伝送が困難だという問題がありま した.また,伝送品質確保のために誤 り訂正符号などの必要性が議論されて いました.これらを背景として,既存 のメディア伝送方式の課題と新たなメ ディア伝送方式の必要性が認識され, MMTの標準化が開始されました.そ の後,MMTはHEVCと3D Audioを組 み合わせた新たな標準規格である MPEG-Hのシステム部分となり,標 準化が進められました.MPEG-Hの 全体像を図1 に示します.MPEG-H のPart1,Part10,Part11,Part12 がMMTの規格です. MMTの基本構成を図2 に示します. MPEG-H Part1 (2) では,メディア配 信に関して,①メディアのカプセル 化,②ネットワーク配信,③制御メッ セージを規定しています.MMTは MPEG2-TSが対象とする領域のみな らず,IETF(Internet Engineering Task Force) が 定 め るRTP(Real- time Transport Protocol)などの領 域も対象としています.パケット長は 可変であり,IP伝送と親和性が高く, 音声 ・ 映像 ・ ファイルなどの多重化も 単一または複数に自由に設定できま す.UTC(Coordinated Universal Time) *3 ベースのタイムスタンプや MMTシグナリングによる制御メッ セージにより,多種多様な機能を提供 します.また,伝送品質確保のために 誤り訂正符号 ISO/IEC国際標準 メディア伝送 *1 MPEG2-TS:現行の地上デジタル放送など で利用されているMPEG2のメディア伝送 規格です. *2 ODS:映画以外の映像コンテンツの劇場へ のストリーミング配信サービスです. *3 UTC:協定世界時.世界共通の時間の1つ で,MMTではタイムスタンプの情報として 利用することができます. 4K ・ 8K映像配信を支える 次世代メディア伝送技術MMT ISO/IEC動画像国際標準MPEGで,次世代メディア伝送規格MMT(MPEG Media Transport)の標準化が進んでいます.本稿では,NTT未来ねっと研 究所提案の誤り訂正符号を中心にMMTについて説明するとともに,MMT のユースケースとして,4K・8K映像コラボシステムについて紹介します. たかゆき /山 やまぐち たかひろ とのむら よしひで /藤 NTT未来ねっと研究所

02 65 特集2 - NTT公式ホームページ‚„MVC(Multiview Video Coding) などのマルチレイヤ符号の複数伝送路 での伝送が困難だという問題がありま

Embed Size (px)

Citation preview

NTT技術ジャーナル 2014.2 63

特集

4K・8Kサービスを実現する超高臨場感映像技術

MMT標準化の背景

メディア伝送規格として幅広く利用されているISO/IEC動画像国際標準MPEGの シ ス テ ム 規 格MPEG2-TS

(Transport Stream)* 1の標準化から約20年が経過し,コンテンツ配信の環境が大きく変化しています.映像フォーマットは多様化する一方,HDTV(High Definition Television)の本格的な普及を迎えて,4K ・ 8Kなど高解像度なものへと移行してきました.さらにコンテンツを利用する端末や,伝送路もインターネットから専用線,携帯電話網,無線LAN,放送まで多様化しています.このような背景の下,MPEGでは高効率映像符号化HEVC(High Efficiency Video Coding)の規格化と並行して,さまざまな伝送路でのメディア伝送に対応する新しい伝送規格として,MMT

(MPEG Media Transport)(1)の標準化を進めてきました.NTT未来ねっと研究所では,これまでデジタルシネマ,ODS(Other Digital Stuff)* 2 ,スーパーテレプレゼンスなど,具体的なアプリケーションを念頭に4K映像伝送の研究開発を進めてきましたが,コア技術である誤り訂正符号および階

層化処理技術の普及を目指して,MMTの議論に当初から参画し,標準化に貢献してきました.

MMTの概要

MPEG2-TSは,映像や音声などコンテンツを構成するメディアを単一の固定長パケットに多重化します.同じコンテンツを多数のユーザへ届ける放送などには適した方式です.しかし現在,映像フォーマットや伝送路は多様化し,MPEG2-TSは標準化時には想定していなかった用途で用いられています.MMT標準化の議論が始まった2009年当初,MPEG2-TSを用いた4K ・ 8K映像伝送ではTSパケットの大きさが適さないことが指摘され,SVC(Scalable Video Coding)やMVC(Multiview Video Coding)などのマルチレイヤ符号の複数伝送路での伝送が困難だという問題がありました.また,伝送品質確保のために誤り訂正符号などの必要性が議論されていました.これらを背景として,既存のメディア伝送方式の課題と新たなメディア伝送方式の必要性が認識され,MMTの標準化が開始されました.その後,MMTはHEVCと3D Audioを組み合わせた新たな標準規格である

MPEG-Hのシステム部分となり,標準化が進められました.MPEG-Hの全体像を図 1 に示します.MPEG-HのPart1,Part10,Part11,Part12がMMTの規格です.

MMTの基本構成を図 2 に示します.MPEG-H Part1(2)では,メディア配信に関して,①メディアのカプセル化,②ネットワーク配信,③制御メッセージを規定しています.MMTはMPEG2-TSが対象とする領域のみならず,IETF(Internet Engineering Task Force) が 定 め るRTP(Real-time Transport Protocol)などの領域も対象としています.パケット長は可変であり,IP伝送と親和性が高く,音声 ・ 映像 ・ ファイルなどの多重化も単一または複数に自由に設定できます.UTC(Coordinated Universal Time)* 3 ベースのタイムスタンプやMMTシグナリングによる制御メッセージにより,多種多様な機能を提供します.また,伝送品質確保のために

誤り訂正符号 ISO/IEC国際標準 メディア伝送

*1 MPEG2-TS:現行の地上デジタル放送などで利用されているMPEG2のメディア伝送規格です.

*2 ODS:映画以外の映像コンテンツの劇場へのストリーミング配信サービスです.

*3 UTC:協定世界時.世界共通の時間の1つで,MMTではタイムスタンプの情報として利用することができます.

4K ・ 8K映像配信を支える次世代メディア伝送技術MMT

ISO/IEC動画像国際標準MPEGで,次世代メディア伝送規格MMT(MPEG Media Transport)の標準化が進んでいます.本稿では,NTT未来ねっと研究所提案の誤り訂正符号を中心にMMTについて説明するとともに,MMTのユースケースとして,4K・8K映像コラボシステムについて紹介します.

仲な か ち

地 孝たかゆき

之 /山やまぐち

口 高たかひろ

外とのむら

村 喜よしひで

秀 /藤ふ じ い

井 竜た つ や

NTT未来ねっと研究所

NTT技術ジャーナル 2014.264

4K・8Kサービスを実現する超高臨場感映像技術

図 3 に示す誤り訂正符号を規定し,パケットロスに対する伝送の信頼性を向上させています.MPEG-H Part1では共通のシグナリングフォーマット,MPEG-H Part10(3)で誤り訂正符号のアルゴリズムを規定しています.さらにMPEG-H Part11では,表示レイアウト制御を行うコンポジション情報

(CI)が規定されています.ディスプレイ内やマルチディスプレイ上での,

コンテンツの配置位置や表示時間の指定ができます.これらは,いずれもMPET2-TSにはない新しい特徴です.

強力な誤り訂正符号

MPEG-H Part10では,さまざまな伝送路でのパケットロスに対応するために,リードソロモン符号* 4やNTT未来ねっと研究所が提案したLDGM

(Low Density Generator Matrix)符

号など,複数のAL-FEC(Application Layer-Forward Error Correction)方式の誤り訂正符号アルゴリズムを規定しています.個々の誤り訂正符号は,エラー回復特性,演算量の観点から一長一短があります.リードソロモン符号は代数的構造に基づく符号で広く用いられており,低ビットレートでは優れたエラー回復特性を示します.しかし,符号長を長くすることが難しいために,理論限界値を与えるシャノンの通信容量* 5に迫ることができず,十分なエラー回復特性を得ることができません.それに対して,LDGM符号は疎グラフに基づく符号で,符号長を長くすることでシャノンの通信容量に迫ることができ,特に4K ・ 8Kなどの高ビットレート映像の伝送に適した方式となっています(図 4 ).

*4 リードソロモン符号:バースト誤り検出 ・訂正用のブロック符号方式の1つです.

*5 シャノンの通信容量:エラーが発生する通信路での伝送容量限界です.符号長を長くしないと迫ることができません.

図 1  MPEG-Hの概要

メディアトランスポート規格

Part2:高効率映像圧縮 Part3:マルチチャンネル音響

Part1:カプセル化・配信・制御Part10:AL-FECアルゴリズムPart11:コンポジション情報(CI)Part12:実装ガイドライン

MMT

HEVC 3D Audio

図 2  MMTの基本構成

レガシーメディア ファイル①メディアのカプセル化

②ネットワーク配信

MFU

MPU MMTシグナリング

パッケージ

③制御メッセージ

MMTペイロード

UDP,TCP

IPパケット

配信形式 蓄積形式

MFU: Media Fragment UnitMPU: Media Processinng Unit

:MMT対象外

MMTパケット RTP,HTTP

Media CODEC

NTT技術ジャーナル 2014.2 65

特集

LDGM符号は図 5 に示すようにパリティ検 査 行 列 H* 6 に 三 角 行 列

(LDGM構造)を持つ線形符号ですが,NTT未来ねっと研究所提案のMMTで規定するLDGM符号では,メッセージパッシングアルゴリズム(MPA: Massage Passing Algorithm)と呼ばれる方法に準最適化された行列を使用することで,少ない演算で効率的に誤りを訂正することが可能となっています.また,MPAおよび最尤復号(MLD: Maximum Likelihood Decoding)の双

方で優れた復号性能を引き出すことができるイレギュラー行列を用いることができます.

さらにMMTのLDGM符号では,新しい 2 つのアルゴリズムを規定しています. 1 つはサブパケット ・ インタリ ー ブLDGM符 号(4)で す. 従 来 のLDGM符号は,エラー回復特性に関して,高ビットレートでは優れた特性を示しますが,低ビットレートでは劣る欠点がありました.サブパケット ・インタリーブLDGM符号では,高ビッ

トレート領域のみならず低ビットレートでのエラー回復特性を改善し,低演算量を保持しつつリードソロモン符号に匹敵する特性を示します.もう 1 つは,階層型LDGM符号(5)です.一般にLDGM符号は符号長を長くすることができる反面,SVCやJPEG2000などの階層符号化へ適用した場合は,部分復号を行うとエラー回復特性が悪くな る 欠 点 が あ り ま し た. 階 層 型LDGM符号は,階層符号化されたデータの階層性を損なうことなく効率的に誤り訂正を行える構造となっています.なお,サブパケット ・ インタリーブLDGM符号と階層型LDGM符号は,互いに独立ではなく同時に用いることができます.

MMTを用いたユースケース

MMTの機能は多岐にわたります.代表的な機能を図 6 に示します.AL-

*6 パリティ検査行列H:生成行列とともに線形符号を構成する重要な行列です. LDGM行列では, 生成行列とパリティ検査行列Hの関係式を基に誤りの訂正を行います.

図 3  誤り訂正符号

パケット欠損が起きても画像が乱れないで再生できる

安定した映像配信サービスを提供

誤り訂正技術を用いた映像配信サービス

LDGM符号あり

LDGM符号なし

パケット欠損

図 4  LDGM符号の位置付け

疎グラフに基づく符号

代数的構造に基づく符号

符号長数百

数千 数万

誤り訂正能力

ブロードバンドアプリケーション

LDGM符号Turbo符号など

リードソロモン符号は符号長を長くできない

リードソロモン符号ハミング符号など

リードソロモン符号ハミング符号など

NTT技術ジャーナル 2014.266

4K・8Kサービスを実現する超高臨場感映像技術

FECを用いることにより4K ・ 8Kなどの高ビットレート映像を,IP共用網を介して安定して伝送することができるのは大きな特徴です.その一方,UTCベースのタイムスタンプと音声 ・ 映像 ・ ファイルなどの多重化が柔軟にできる機能を利用して,パブリックビューイングやマルチ画面を用いた超高臨場感TV会議など大画面映像を多くのユーザと共有しつつ,個別ユーザはタブレット端末でマルチアングル

映像など好みに応じたコンテンツを大画面映像と同期* 7 して視聴することも可能です.通信と放送を用いたハイブリッド伝送でも,このようなサービスを実現することが可能となります.

コンテンツ協調制作プラットフォームへのMMTの適用シナリオ

近年,ハリウッド映画など大型コンテンツの制作現場では,実写撮影を担当するプロダクション,VFXを担当

するプロダクション,音響を担当するプロダクション等が,分業して作業を行っています.従来は,図 7(a)に示すように,プロデューサ等が,撮影,映像 ・ 音響作成 ・ 編集の仕上げチェックを行うために,人とコンテンツの入った物理メディアの頻繁な移動が必要でした.図 7(b)に示すように,多地点の制作拠点間をネットワークで結び,MMTによるコンポーネントの同期伝送 ・ 再生が利用できるようになると,図 7(c)のように,遠隔地のプロデューサが,異なる拠点にある素材レベルの実写映像,VFX,音響等を組み合わせて仕上がりイメージのチェックを行うことができるようになったり,仕上がりイメージと同期させたタイムライン上でのコメントを共有したりすることもできるようになります.すなわち,物理メディアや人の頻繁な移動が不要となり,仕上げ ・ チェック作業を共同

*7 同期:UTCベースのタイムスタンプが利用できるため,複数経路で伝送したメディア間の同期が可能ですが,同期の仕方は標準化の対象外となっています.

図 5  LDGM符号

S1

0

S1

0

S1

0

S2

0

0

0

S2

S2

By ⑤By ①⑦

S2=S1 ○+ S4○+ S7○+ p5 …⑦S5=S1 ○+ S2○+ S7○+ p1

○+: 排他的論理和 (XOR)

LDGM

ブロック長=14 パリティ生成

パリティパケットソースパケット

パケット長=1400バイト

S5

0

S5

S5

0

0

S7

S7

0

0

S7

0

0

S3

S3

0

0

S3

0

S4

0

S4

S4

0

0

S6

0

S6

0

S6

0

0

S8

S8

0

S8

p1

0

0

0

0

0

0

p2

0

0

0

0

0

0

p3

0

0

0

0

0

0

p4

0

0

0

0

0

0

p5

0

0

0

0

0

0

p6

111

1

= 0

S1 S2 S3 S4 S5 S6 S7 S8 P1 P2 P3 P4 P5 P6

図 6  MMTの代表的な機能

ビデオ

ビューエリア1 エリア 2

エリア 3

キャプション

イメージ

テキスト

オーディオ

超高速,低負荷高い誤り訂正能力

LDGM-FEC

ライブ カメラ映像

音声

映像

音声

同期

多様なネットワーク ディスプレイへの

表示位置・時刻等を制御

大画面ディスプレイ

セカンドディスプレイフレキシブルな配信・メディア同期 マルチソースのメディア表示制御

……

同期

制御信号

アプリケーション

蓄積データ

必要なメディアコンポーネントのみ選択して同期

NTT技術ジャーナル 2014.2 67

特集

で実施することで,編集者にリアルタイムに修正点をフィードバックするなど,プロデューサのタイムリな意思決定が可能になり,コンテンツ制作工程が効率化されるようになります(6).これらは,MMTを利用するユースケースの一例であり,今後MMTの機能を利用した新しいサービスの創出が期待されています.

今後の方向性

NTT未来ねっと研究所では,4K ・8K映像をより多くのユーザに利用いただくために,これまでに培ってきた高信頼映像伝送技術を発展させて,複数のベストエフォート型の共用網を介した安定伝送,ネットワークやユーザ利用環境の変化に即時に対応できるネットワーク接続技術など高信頼 ・ 高機能化へ向けた研究開発を進めていき

ます.

■参考文献(1) 仲地:“次世代映像プラットフォームとMMT

標準化動向,” 第26回情報伝送と信号処理ワークショップ,2013. 11.

(2) ISO/IEC FDIS 23008- 1 : “Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 1 : MPEG media transport(MMT),”2014.

(3) ISO/IEC DIS: “23008-10 Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 10: MPEG media transport forward error correction (FEC) codes,” 2013.

(4) 外村 ・ 白井 ・ 北村 ・ 仲地 ・ 藤井 ・ 貴家:“動画像配信のための下位互換性を考慮したパケ ッ ト レ ベ ルLDGM符 号 の 構 成 と 理 論 解析,” 信 学 論(A),Vol.J93-A,No.3,pp.212-215,2010.

(5) Y. Tonomura, D. Shirai, T. Nakachi,T. Fujii,and H. Kiya: “Layered Low-Density Generator Matrix Codes for Super High Definition Scalable Video Coding System,” IEICE Trans. on Fundamentals,Vol.E92-A,No.3,pp.798-807,March 2009.

(6) T. Nakachi, Y Tonomura, and T Fujii: “A Conceptual Foundation of NSCW Transport Design Using an MMT Standard,” ICSPCS 2013,Gold Coast, Australia, Dec. 2013.

(上段左から) 仲地 孝之/ 山口 高弘(下段左から) 外村 喜秀/ 藤井 竜也

 MMTを利用した高信頼 ・高機能化技術の研究開発を進め,4K ・ 8K映像配信技術ならびにサービス普及に貢献したいと考えています.

◆問い合わせ先NTT未来ねっと研究所 メディアイノベーション研究部

TEL 046-859-2589FAX 046-855-1284E-mail nakachi.takayuki lab.ntt.co.jp

図 7  コンテンツ協調制作プラットフォームへのMMTの適用例

プロデューサ(意思決定)

編集者(音響)

プロデューサ

物理メディアと人の頻繁な移動

(a) 従来のコンテンツ制作 (b) ネットワークを利用したコンテンツ協調制作

(c) MMTを適用した仕上がりイメージのプレビュー

タイムライン

A地点(制作スタジオ)

B地点から A地点へ

C地点から

D地点から

C地点(制作プロダクション)

B地点(制作現場)

D地点(制作プロダクション)

カメラマン(撮影)

デザイナー(VFX)

プロデューサ(意思決定)

編集者(音響)

A地点(制作スタジオ)

C地点(制作プロダクション)

B地点(制作現場)

D地点(制作プロダクション)

カメラマン(撮影)

デザイナー(VFX)

タイムリな意思決定作業

ネットワーク&MMT

ストリーム配信and/or

ファイル転送

コメント(カット挿入しました)

コメント(TAKE2に入れ替えて)

(音響)

(撮影)

(VFX)

MMTによる映像ストリームの切替

MMTによる映像と音の同期再生

ストリーム配信and/or

ファイル転送