MPEG Video 技術

片山泰男 (Yasuo Katayama)

トリケップス出版 "MPEG 技術" (White series No.152)の Video部分(pp.29-127))の 1993 年 12 月 21 日出版の原稿である。
１～９章は MPEG-1 Video、１０～２１章が、MPEG-2 Video の技術的解説である。

この文章は、MPEG-2 の CD 通過時点の技術的内容であり、当時までの数年間の MPEG 標準化活動に参加しつつ雑誌"インターフェース" に書いた技術報告をまとめ加筆したものである。トリケップス出版のこの本は、高価な企業向けの本で 200 数十部しか出なかったと聞いている。監修はSonyの米満潤氏、オーディオはJVCの杉山昭彦氏、システムはNECの松本英博氏が担当された。 MPEG を仕事にする技術者に有益な本で、私には私以外の部分が後年、非常に役立だった。今回、私の部分を HTML にして公開するのは、Internet を読書の場所にして欲しいからである。加筆訂正は、敢えてほとんど行なっていない。

ISO の正式文書は、IS11172-2 が MPEG-1 であり、IS 13818-2 が MPEG-2 であり、これらはつねに入手可能である。また、その後 IS までの修正については他の文章を参考にすべきである。私を含めたこの数人は、1993 年 5 月から JIS 化の作業に関わった。MPEG-1,-2 の全体のまとめを NTTの渡辺裕氏にお願いし、私は、Video の JIS 策定の主査をした。 MPEG-1 では必須部分は全訳、参考部分は抄訳なので、10 人の MPEG の画像符号化技術の専門家が参加した。 MPEG-2 は抄訳である。国内では、これらの国際標準に対応する日本工業規格 JIS X 4322 と JIS X 4356 が法律に準じる規格として国際標準に優先することに留意されたい。

戻る　開始＝≫

１. 動画像符号化の基礎技術
 ２. 動画像データ
 ２.１ 422 と 420
２.２フィールド画像とフレーム画像
 ２.３ CIF と SIF
３. フレーム間予測と動き補償(MC)
３.１マクロブロック
 ４. DCT (Discrete Cosine Transform)
４.１１次元 DCT
４.２２次元 DCT
５.シーケンスヘッダと GOP
５.１双方向予測
 ５.２処理順、メディア上の順
 ５.３ GOP の独立性、編集性
 ５.４ハーフペル MC
５.５フレーム間隔と動きベクトル
 ５.６スライス
 ６. ブロックとマクロブロック
 ６.１マクロブロックアドレス (MBA)
６.２マクロブロックタイプ
 ６.３動きベクトルの差分符号化
 ６.４マクロブロックパターン (Coded Block Pattern)
７. 量子化と逆量子化
 ７.１量子化マトリックス
 ７.２ DC 予測
 ７.３ジグザグスキャン(走査)と 2 次元 VLC による係数の符号化
 ７.４ IDCT ミスマッチ対策
 ７.５ MPEG デコーダの構造
 ８. 標準化の外の基礎技術
 ８.１動きベクトル検出(MVD)
８.２レートコントロールと符号化制御
 ８.３その他の標準化外の技術
 ９. MPEG-1 のシンタクス補足
 ９.１スタートコード
 ９.２シーケンスヘッダ
 ９.３ GOP レイヤ
 ９.４ピクチャレイヤ
 ９.５スライスレイヤ
 ９.６マクロブロックレイヤ
 ９.７ブロックレイヤ
 １０. MPEG-2 Main プロファイル技術
 １０.１ MPEG-1 から MPEG-2 への経過
 １０.２ MPEG のフレーム構造から MPEG-2 のフィールド構造へ
 １０.３久里浜会合での主観評価
 １０.４ 32 社の提案アルゴリズムから思うこと
 １１. シンガポール会合の結果 TM0
１１.１ TM0 の 422 to 420
１１.２ TM0 のレートコントロール
 １１.３ Frame/field 予測
 １１.４ Frame/field DCT
１２. Haifa 会合の TM1、FAMC と Dual field
１２.１ MPEG-2 のスケジュール
 １２.２ Haifa 会合での種々の問題
 １２.３予測以外について
 １２.４ 10 Mb/s 問題
 １２.５ 10 kb/s 程度
 １２.６ Loss Less Coding
１３. Haifa 会合での 3 つの問題に対するリオ会合での各国の解答
 １３.１ 10 Mb/s 問題
 １３.２ 10 kb/s 程度
 １３.３ Loss Less Coding
１４. TM2 の Frame-picture, Field-picture
１４.１ MV 表現
 １４.２ 422, 444 の CBP の改良
 １４.３予測の Core Experiment
１４.４量子化などの Experiment
１５. ATV 技術の登場
 １５.１予測関連技術
 １５.２量子化関連技術
 １５.３ MPEG-1 の IS 化に伴う動き
 １５.４ソフトウエアデコーダ
 １６. 8 点 DCT 高速アルゴリズム
 １７. プロファイルとレベル
 １７.１コンパティビリティとスケーラビリティ
 １７.２スケーラビリティ
 １７.３ローディレイ
 １７.４ハイレベル
 １８. Main プロファイルのシンタックス
 １８.１ Main プロファイルの予測構造
 １８.２フレームピクチャ、フィールドピクチャ
 １８.３参照フィールドのルール
 １８.４予測(MC)の種類
 １８.５動きベクトル表現
 １８.６ Dual prime
１８.７ DCT type
１８.８ハイクオリティ対応
 １８.９ Alternate Scan
１８.１０ IDCT ミスマッチ対策
 １８.１１エラーレジリアンス
 １８.１２ PMV
１８.１３ TR
１９. ATV の大同盟 G.A.(Grand Alliance) と MPEG
２０. ニューヨーク会合、ブリュッセル会合、ソウル会合
 ２０.１プロファイルとレベルの議論の推移
 ２０.２ビデオの変遷
 ２０.３ MPEG-4
２０.４ベリフィケーションテスト
 ２０.５ MPEG-1 の出版
 ２０.６ ATV の MPEG-2 Main プロファイル High レベルの採用
 ２１. Main プロファイルのシンタクス補足
 ２１.１ Sequence extension
２１.２ Sequence display extension
２１.３ Quant matrix extension
２１.４ Picture coding extension
２１.５ Picture display extension
参考文献

MPEG Video 技術

１. 動画像符号化の基礎技術

２. 動画像データ

２.１ 422 と 420

２.２ フィールド画像とフレーム画像

２.３ CIF と SIF

３. フレーム間予測 と 動き補償(MC)

３.１ マクロブロック

４. DCT (Discrete Cosine Transform)

４.１ １次元 DCT

４.２ ２次元 DCT

５.シーケンスヘッダ と GOP

５.１ 双方向予測

５.２ 処理順、メディア上の順

５.３ GOP の独立性、編集性

５.４ ハーフペル MC

５.５フレーム間隔と動きベクトル

５.６ スライス

６ ブロックとマクロブロック

６.１ マクロブロックアドレス ( MBA )

６.２ マクロブロックタイプ

６.３ 動きベクトルの差分符号化

６.４ マクロブロックパターン (Coded Block Pattern)

７. 量子化と逆量子化

７.１ 量子化マトリックス

７.２ DC 予測

７.３ ジグザグスキャン(走査)と 2 次元 VLC による係数の符号化

７.４ IDCT ミスマッチ対策

７.５ MPEG デコーダの構造

８. 標準化の外の基礎技術

８.１ 動きベクトル検出(MVD)

８.１.１ ブロックマッチング

８.１.２ マッチング窓と探索範囲

８.１.３ フルサーチ

８.１.４ 3 step サーチ

８.１.５ 階層的動きベクトルサーチ

８.１.６ オリジナル同士での動きベクトル

８.１.７ テレスコピックサーチ

８.１.８ ダイレクトフルサーチ

８.２ レートコントロールと符号化制御

８.２.１ ITU-T H.261 RM8 のレートコントロール

８.２.２ MPEG-1 SM3 のレートコントロール

８.３ その他の標準化外の技術

８.３.１ MC/NonMC 判定

８.３.２ Intra/Inter 判定

８.３.３ 可変スレッショルド量子化 ( Variable Threshold )

８.３.４ プリポスト処理

９. MPEG-1 のシンタクス補足

９.１ スタートコード

９.２ シーケンスヘッダ

９.３ GOP レイヤ

９.４ ピクチャレイヤ

９.５ スライスレイヤ

９.６ マクロブロックレイヤ

９.７ブロックレイヤ

１０. MPEG-2 Main プロファイル技術

１０.１ MPEG-1 から MPEG-2 への経過

１０.２ MPEG のフレーム構造から MPEG-2 のフィールド構造へ

１０.３ 久里浜会合での主観評価

１０.４ 32 社の提案アルゴリズムから思うこと

１１. シンガポール会合の結果 TM0

１１.１ TM0 の 422 to 420

１１.２ TM0 の レートコントロール

１１.３ Frame/field 予測

１１.４ Frame/field DCT

１２. Haifa 会合の TM1、FAMC と Dual field

１２.１ MPEG-2 の スケジュール

１２.２ Haifa 会合での種々の問題

１２.３ 予測以外について

１２.４ 10 Mb/s 問題

１２.５ 10 kb/s 程度

１２.６ Loss Less Coding

１３. Haifa 会合での 3 つの問題に対するリオ会合での各国の解答

１３.１ 10 Mb/s 問題

１３.２ 10 kb/s 程度

１３.３ Loss Less Coding

１４. TM2 の Frame-picture, Field-picture

１４.１ MV 表現

１４.２ 422, 444 の CBP の改良

１４.３ 予測の Core Experiment

２.２フィールド画像とフレーム画像

３. フレーム間予測と動き補償(MC)

３.１マクロブロック

４.１　１次元 DCT

４.２　２次元 DCT

５.シーケンスヘッダと GOP

５.１双方向予測

５.２処理順、メディア上の順

５.４ハーフペル MC

５.６スライス

６ブロックとマクロブロック

６.１マクロブロックアドレス ( MBA )

６.２マクロブロックタイプ

６.３動きベクトルの差分符号化

６.４マクロブロックパターン (Coded Block Pattern)

７.１量子化マトリックス

７.３ジグザグスキャン(走査)と 2 次元 VLC による係数の符号化

８.１動きベクトル検出(MVD)

８.１.１ブロックマッチング

８.１.２マッチング窓と探索範囲

８.１.３フルサーチ

８.１.５階層的動きベクトルサーチ

８.１.６オリジナル同士での動きベクトル

８.１.７テレスコピックサーチ

８.１.８ダイレクトフルサーチ

８.２レートコントロールと符号化制御

８.３その他の標準化外の技術

８.３.３可変スレッショルド量子化 ( Variable Threshold )

８.３.４プリポスト処理

９.１スタートコード

９.２シーケンスヘッダ

９.４ピクチャレイヤ

９.５スライスレイヤ

９.６マクロブロックレイヤ

１０.３久里浜会合での主観評価

１１.２ TM0 のレートコントロール

１２.１ MPEG-2 のスケジュール

１２.３予測以外について

１４.３予測の Core Experiment

１４.４量子化などの Experiment

１５.１予測関連技術

１５.２量子化関連技術

１５.４ソフトウエアデコーダ

１７.１コンパティビリティとスケーラビリティ

１７.１.１コンパティビリティ

１７.１.２コンパティビリティの用語の定義

１７.２スケーラビリティ

１７.３ローディレイ

１７.４ハイレベル

１８.２フレームピクチャ、フィールドピクチャ

１８.３参照フィールドのルール

１８.４予測(MC)の種類

１８.５動きベクトル表現

１８.８ハイクオリティ対応

１８.１１エラーレジリアンス

１９. ATV の大同盟 G.A.(Grand Alliance) と MPEG

２０.１プロファイルとレベルの議論の推移

２０.２ビデオの変遷

２０.２.４ Pel Aspect Ratio のセマンティクス(意味)変更

２０.２.５色差のサンプル位置の変更

２０.４ベリフィケーションテスト