MPEG-2 の技術修正と MPEG-4 (1994年)

片山泰男 (Yasuo Katayama)
1994 年 12 月 4 日

１. はじめに
 ２ Paris 会合で MPEG-2 は DIS となる
 ２.１マクロブロックの最大ビット数の設定
 ２.２ 2-3 pull down の progressive (60Hz)への拡張
 ２.３ chroma_420_type の廃棄
 ３. IDCT の精度の話題
 ３.１シーケンスエンドコードの後
 ３.２その他
 ４. Grimstad (Norway) 会合と、Singapore 会合
 ４.１ DIS 投票による IS への進行
 ５. Video の技術的問題と修正
 ５.１ Copyright in bitstream (著作権記述)
５.２ VBR-VBV
５.３ Temporal Reference
５.４ Spatial Scalability の下位レイヤとの GOP 構造
 ５.５ PAL 2-3 pulldown の問題
 ５.６フレーム再配置について (malformed bitstream)
５.７ Video Conformance と IDCT 精度
 ５.８ビットストリームの結合(Concatenated Sequence)
５.９その他
 ６. MPEG-4
６.１超低ビットレート
 ６.２ MPEG-4 の意味
 ６.３ 10 倍の符号化効率
 ６.４ PPD と Call for Proposal

≪＝BACK　TOP∧　NEXT＝≫

１. はじめに

MPEG 報告が多少間を置いて、前回から 1 年ぶりになってしまったので 3 会合まとめての報告になる。 94 年 3 月のパリ会合と 7 月のノルウェーそして 11 月のシンガポールである。私の主要な関心事は、MPEG-2 Video であり、それに次いで MPEG-4 である。 3 会合を通して、 MPEG-2 Video は CD (93 年 11月 Seoul)から技術的内容がどのように修正されるか、無事 IS となって使われる標準となるか見届けたいのである。MPEG-4 はそのタイトルが超低ビットレートとなっている問題がどのように解決されるのか、新たな技術は出てきているのか、などに興味があるのである。

画像符号化技術のなかで標準化に採用されてきた技術は枯れていて実用的な段階に達したものであるが、MPEG-4 にはそれはなんだろうか？やはり、 MC-DCT なのか、アフィン変換まで対応した MC の高級化か、全く考え方の違う Fractal 符号化だろうか、Segmentation 符号化か、Model ベースか、一般の画像を目的にした Generic (汎用) 符号化なのか、目的にあった符号化なのか、多くの人々が様々に憶測するなか Subjective test (主観評価)の日程は 1 年後に近づき、どの技術で攻めてみるかアルゴリズム屋さんは知恵を絞っていることだろう。

ITU-T の short term の標準化では RM (参照モデル)に近いものとして、 TMN2,3,4 と高級化している。ITU-T の long term でもある MPEG-4 はそれより、高級な技術が望まれるだろう。それはなにかである。MPEG-4 については最後に 3 会合まとめて説明する。まずはパリ会合の MPEG-2 の Video からはじめよう。

≪＝BACK　TOP∧　NEXT＝≫

２ Paris 会合で MPEG-2 は DIS となる

94 年 3 月 21 日から 25 日までの行なわれたパリ会合では、各国の National Body は CD 投票による DIS (Draft International Standard) への関門なので技術的変更要求を "コメントつき賛成"、または"コメントつき反対" という手段で要求した。 Editorial コメントはすべて受け入られたが、技術内容に関わるものは議論され、取捨選択された。結果はシンプルで、重要な技術的変更はつぎの 3 点である。

≪＝BACK　TOP∧　NEXT＝≫

２.１マクロブロックの最大ビット数の設定

マクロブロックの最大ビット数の設定は、以前から続く話題であるが、 CD では、 Bitstream の conformace issue とされ、Video part では Informative section に書かれていた。今回は、Adrian Wise 氏(Pioneer) の希望らしく、UK NB と、US NB からの意見となった。

これを定めると、デコーダを容易にするがエンコーダ製作を逆に困難にするというトレードオフがあり、設定は標準の技術内容を変更するものではないと議長は判断し積極的に導入する姿勢をとった。強い反対はなく、最後には Video の合意とされた。次の(1),(2),(3),(4)が比較され、(3)が結論となった。

表 1 マクロ ブロックの最大ビット数の設定
(1)No limit                                               
(2)limit T/MB                                             
(3)No more than 2/row T= 64*6*12/(4:2:0)                  
(4)No limit on I MB, limit T' on P,B MB T'= 64*6*8/(4:2:0)

≪＝BACK　TOP∧　NEXT＝≫

図 1 マクロブロックの最大ビット数の設定制限する bit 数 T bit/MB = 64*6*12 は、FLC を使った最大発生 bit 数 Tmax= 64*6*24 (24: escape(6bit) +run(6bit) +level(12bit))の半分である。

4:2:0 において 64*6*12 = 4608 bit を越えるマクロブロックを禁止するが、 1 row あたり、2 つのマクロブロックまでの制限オーバを許す(図 1 )、という例外付きにすることはエンコーダの処理を簡単なフィードバックで済ませることができるためである。

ついでに VLC が用意されている run-level 対にも Escape + FLC は常に使えるという確認をした。

≪＝BACK　TOP∧　NEXT＝≫

２.２ 2-3 pull down の progressive (60Hz)への拡張

Barry Haskel(ATT) の提案 (MPEG94/103)である。プログレッシブ表示において( progressive_sequence= 1 )、 2-3 pull down が出来るようにしたい(図 2 )。 ATV の progressive のような時、フィルムソースの表示の必要性は理解され受け入られた。ただし、 High ,H-14 レベルの、frame rate が 60 Hz と 59.94Hz のときに制限された。

progressive_sequence = 1 の時、 repeat_first_field = 1なら top_field_first = 0 で 2 回表示、 = 1 で 3 回表示である。

通常の 2-3 pull down はフレームレート 25, 29.97, 30Hz に可能とした。 23.97Hz と 24 Hz には許さない。エンコーダの VBV (Video Buffer Vefifier) 計算に影響するので、そのための document が作成された。なお、MPEG-1 でも使われている自動的 2-3 (automatic 2-3) は MPEG 標準外のポスト処理であるとする。

図 2 2-3 プルダウン

≪＝BACK　TOP∧　NEXT＝≫

２.３ chroma_420_type の廃棄

輝度が interlace 時に色差には interlace と progressive があると Spatial Scalable の下位レイヤが 420 の時、色差の upsample を複雑にするため、 chroma_420_type は pregressive_frame と同義とした。 interlace の色差の扱いを常に interlace とする制限で、色差の縦方向の分解能は低下した。

≪＝BACK　TOP∧　NEXT＝≫

３. IDCT の精度の話題

これには 3 つの話題があった。まずは、ATT から新しいミスマッチ対策の提案かと思われる書類がでたが encoder issue であると Barry Haskel は控えめなコメントをしたため、重大な問題にはならなかった。

2 つめは、Jhone Morris による問題提起で、静止画を DCT の低域係数から例えば各画面に Block に 1 係数ずつ追加していくような再現をすると、静止画がしだいにフォーカスが合ってくるような動画再現になるが、このとき IEEE 規準を満たす精度の IDCT であっても、エンコーダの Frame buffer を変化させない係数を Coded block として送ってしまい、 IEEE 規準をみたすデコーダでもミスマッチが累積する現象あることが e-mail で報告され議論されていた。

対策としての可能性は、 (1) IEEE 規準を厳しいものにする。(2) そのようなエンコーダの frame buffer を変化させない Coded block を送ってはならないと決める。 (3)なにもしない。があったが、Jhone Morris はすでに凍結された標準を変更するつもりはないといい、結論は (2) に近く、 Normative part に注意を促す文章を入れることになった。

もうひとつは GCL から DC 係数は完全な精度で、 AC 係数には低い精度の IDCT をもつデコーダでもかなりの画質が確保できるという結果( 5.5 bit 精度の定数乗算で -0.1dB 程度) が提出され、"IEEE 規準を厳しくすることはやめてほしい。できたら、IEEE 規準を緩めてほしい"という意見がでた。

これは Inter-operability をすべて確認したわけではなく、静止画においては現在のミスマッチコントロールですら、まだ問題が見られる例も議論に上げられ、議長は IEEE 規準は (1)緩すぎるのか、(2) 厳しすぎる (3) 丁度いいの三つの可能性をあげて現在は (3) とせざるをえないとした。

≪＝BACK　TOP∧　NEXT＝≫

３.１シーケンスエンドコードの後

標準がなにも規定していない Sequence End Code の後の問題を Tristan Savatier(TCE) は次のように取り上げていた。

(1) 大抵のデコーダはバッファ内容を捨て去るだろうから最低、 buffer_size 程度のスタッフィングが必要である事。

(2) 画像サイズなど全く変更しなくても、編集によって、 top_field_first が狂うだけでも画像はつながらない。

(3) VBVの整合性をとるためにもスタッフィングは必要である。

"シームレス bitstream" のための結合した VBV 整合をとる方法、を考えなければならないという問題提起であった。

≪＝BACK　TOP∧　NEXT＝≫

３.２その他

Spatial Scalability について、上下のレイヤで同じ GOP 構造、I,P,B 構造をとるとしていたが、base が field で enhancement が frame なら、field をまとめてから up-sample する必要があり、 PTS, DTS も上下で同じ値をとるのは難しい。結果として、上下で同じ frame/field picture 構造をとると定めた。field picture では field で upsample する。また、Nick Wells(BBC) から、 upsample での色差のサンプル位置が WD 型に合わせていて、 CD には合っていないことが指摘された。

D-picture: ドイツ NB から MPEG-1 の Conformance part から D-picture を除外せよという意見がでたが受け入られなかった。

Temporal Scalability : 基本的に記述が不足しているため、Atul Puri (ATT) が document を用意することになった。

Data partitioning: bit_rate, vbv_buffer_size, vbv_delay は全体の stream に対する値とする。

Dual' vector range: dmv の加算の前後ともに制限をいれる。

≪＝BACK　TOP∧　NEXT＝≫

４. Grimstad (Norway) 会合と、Singapore 会合

7 月 18 日から 23 日までノルウェーの南端近くの田舎街グリムシュタット (Grimstad) で行なわれた MPEG会合では、MPEG-2 Video は DIS 投票中なで、 DIS 修正はできない状態のまま、技術的な問題も議論された。技術的問題を列挙し、解決方法を探り、結論は先送りにされて、次会合で、National Body の意見として提出するしかない。そのため、シンガポール会合と内容が重複する説明にならないように、技術内容毎に両会合の結果をまとめて説明する。

MPEG Singapore 会議は 11 月 7 日から 11 日まで Singapore の National Computer Board で行なわれた。DIS から IS になる会合であり、修正の最後のチャンスである。

MPEG-2 は System, Video, Audio (13818-1, -2, -3)の IS への進行を各国の National Body の意見で確認する必要があり、System は技術的問題を解決する必要から技術的な修正がなされ、Audio は MPEG-2 マルチチャネルの性能が低いことが明らかになったのでどうするかが問題になる。Video では技術的修正がどれだけあるかが興味あるところであった。

≪＝BACK　TOP∧　NEXT＝≫

４.１ DIS 投票による IS への進行

Singapore 会合初日の Plenary では各国の NB 意見が提示され、System には Aus, Fr, D, J, Ne, UK, US, Norway の 8 ヶ国が反対票を投じ、 Video には Fr, J の 2 ヶ国、Audio には Aus, Fr, Itl, J, Sweden の反対があった。 70 % の NB が反対しなければそのままでもいいので、Video, Audio はすでに安全圏である。System はその後すぐに D (German NB) が賛成に転じたので、70 % をみたした。反対意見にはコメントが付いていて、それに対応して修正を考慮していくのである。1 週間の会合中に修正は行なわれ、最終日には MPEG-2 は System, Video, Audio とも IS に進行した。出版は 95 年中になるだろう(現実には ISO/IEC 13818-2 は 1996 年 5 月 15 日に発行された)。

≪＝BACK　TOP∧　NEXT＝≫

５. Video の技術的問題と修正

Grimstad で列挙され議論された、MPEG-2 Video の技術的問題については Singapore では各国の意見にしたがって技術内容修正と、Editorial 修正を行なった。以下は重要と思われる順に、技術内容変更をたどる。

≪＝BACK　TOP∧　NEXT＝≫

５.１ Copyright in bitstream (著作権記述)

Copyright については 93 年の NY 会合で NHK から提案が出て、その時はすでに凍結した MP@ML に影響するからと Video では否定され System に入れられたことがある。今回は、 France NB から、Video の bitstream に Copyright 記述 ( ISBN 番号の 64 bit )を入れよという意見である。これに対応するシンタックスが考案され、Start code をもつ、 Extension ID = 4 の extension が用意された。

問題は、すでに設計されたすべての Chip がこれを無視できるかどうかであったが、反対はなく OK となった。結果的に Copyright 記述は System, Audio と Video が 3 つとも異なる形式になった。最終 synatx はつぎの通り(表 2)。 Picture 毎で、picture coding extension の後に許され、その Semantics は 6.3 章にある。

表 2. 著作権記述 (Copyright extension)

extension_start_code_identifier (4 bit)
copyright_flag                  (1 bit)
copyright_identifier            (8 bit)
original_or_copy                (1 bit)
reserved                        (7 bit)
marker_bit                      (1 bit)
copyright_number_1             (20 bit)
marker_bit                      (1 bit)
copyright_number_2             (22 bit)
marker_bit                      (1 bit)
copyright_number_3             (22 bit)

≪＝BACK　TOP∧　NEXT＝≫

５.２ VBR-VBV

Variable Bit Rate (VBR) の Video Buffer Verifier (VBV) について Grimstad では System が 6 月のアトランタ ad-hoc会合で MP@ML の bitrate 上限(15 Mbit/sec)を越えた 18 Mbit/sec の Video 入力を使う問題が System との間で議論された。その後 adhoc group で e-mail で議論された。 Singapore では adhoc group の解決策が発表され、 Video の vbv_delay の意味と Annex C が変更された。

vbv_delay 項目を使う VBR mode とその項目に FFFF を記述するモードの 2 つのモードが使えることになった。FFFF mode では、 bitrate 項目の最大 bitrate でバッファを満たし、一杯になると止める。

vbv_delay 項目を使う VBR mode では picture 毎に一定ビットレートと考えるモードで、 skipped picture では picture 自体がないので Low delay では FFFF mode しか動作しないと記述された。

≪＝BACK　TOP∧　NEXT＝≫

５.３ Temporal Reference

Skipped picture と VBR--VBV の問題にからんで、TR が問題になった。デコーダは skipped picture を知る必要があるが、問題点は、skipped picture の有る場合も、TR は 1 ずつしかあがらず、GOP の先頭で 0 にリセットされる事である。TR ではすでに遅すぎるという問題もある。 Action がとられ、解決策ができた。

Temporal Reference の項目の意味が変更され、H.261 と同じく、 TR は skipped された frame だけ飛ばした番号にした。 GOP の直前で Big picture があり、 skipped picture が例えば 3 枚あった場合、GOP の先頭で TR 値は 3 にリセットする。

TR が Skipped picture のある、 Low delay mode でも有効になったため、 VBR-VBV が解決可能となった。また Spatial Scalability の下位レイヤに skipped picture が禁止されなくなった。次項の System の scalable bitstream 間での PTS と DTS 一致という制限を無くしたことによって、ソウル会合での H.261 との逆方向互換性の崩壊は救われたのかもしれない。

≪＝BACK　TOP∧　NEXT＝≫

５.４ Spatial Scalability の下位レイヤとの GOP 構造

Spatial Scalability では、Frame/field picture 構造の一致だけでなく、 GOP 内の I,P,B 構造が下位レイヤと一致させていたが、System の PTS, DTS の完全一致という制限は厳しすぎるという意見が Mike Nilsson (BT) からあり、下位の同時、直前、low delay でないときはもう一つ前の I,P 画像からも下位からの予測につかえる形になった。

lower_temporal_reference をつかって、次のような上下の関係も可能になる。上の I1, P2, P3 は下の P4 を使え、上の P4 は下の P4 または P7 が使える(図 3）。 Video はシンタックス変更は不要で、意味の修正を行なった(7.7.3.1)。System の記述も改められた。

図 3 空間スケーラビリティの機能変更下位を I,B,B,P 構造で効率的にしておき、上位を I,P,P,... とすると、大きいほう(上位)のフレームメモリーが減り、ぼけた B 画像でなく、 I,P 画像を使うことよる画質向上が期待できる。欠点として、時刻の離れた画像からの MC なし予測の有効性の疑問と、下位 B-picture の buffer が一枚増えることである。

以上、SSP, High, のプロファイルは大きく機能変更したが、今回発表の Verification Test の結果から、Spatial Scalability の性能はかなり高く、 MP@HL と同等程度、チューニングによってはより良い場合があるということで Spatial には期待が高まっている。

≪＝BACK　TOP∧　NEXT＝≫

５.５ PAL 2-3 pulldown の問題

PAL (50Hz フィールド) にも 24 Hz を 25 Hz にする 2-3 pull down が許されているが、MP@ML のデコーダに 601 PAL 画像 (720x576x1.5)を 3 frame 持つと 16 Mbit では余裕がないという問題が Grimstad で問題提起された。 Singapore では、 480 line を越える画像では 2-3 pull down は B-picture にはできないという制限をつけた。

≪＝BACK　TOP∧　NEXT＝≫

５.６フレーム再配置について (malformed bitstream)

I0, B1, B2, P3 のような bitstream (数字は TR とする。B1, B2 は forward prediction しか使っていない) は許さないように、Frame reordering (6.1.1.11) の説明が例を使って説明していたのを論理的要求にした。

≪＝BACK　TOP∧　NEXT＝≫

５.７ Video Conformance と IDCT 精度

Grimstad では Video の 14 の conformance bitstream ができ、さらに拡張されることになった。また、精度調査のための仕組みを Conformance (WD 13818-4) にいれた。これは Singapore では CD となった。

Singapore では、H.261, MPEG-1, MPEG-2 と逆量子化値の最大値がどんどん大きくなっているため、Bitstream によっては IEEE 規準を満たす IDCT でも overflow する危険があることを Video の IS に注意を記述することになった。

≪＝BACK　TOP∧　NEXT＝≫

５.８ビットストリームの結合(Concatenated Sequence)

Paris, Grimstad と問題が明確にされてきたもので、シーケンスの結合について、Sequence end code の後の動作は標準の規定外となっていて、デコーダの動作はなんら規定されていない。

蓄積メディアの用途ではデコーダは動作を停止しても問題ないが、放送用途にはコマーシャルの挿入などにも対応できるように、結合したシーケンスにもスムーズにつながる、"シームレス動作"をさせたい。

なにか目安になるものを与えないとシーケンスの結合ができない。シームレス動作のための望ましい動作をInformative Annex に記述するという方向になり、USNB から次回提案するとした。

Singapore では、Ren Egawa (Panasonic AVTL) が Informative Annex (MPEG94/431) を用意したが、IS には Informative 部分に VBV を overflow させない注意だけが数行書かれただけとなった。

≪＝BACK　TOP∧　NEXT＝≫

５.９その他

1/2.21 AR:
シネマスコープの Aspect Ratio が入っている問題ではすべての Profile で対処しない事になった。Profile Level についての章、Chapter 8 の表現が Scalable の可能な構造を明確にするため大幅に修正されてたが、変更は420 から 422 への Scalability を Spatial scalability のシンタックスでも可能にしたことだけである。

60 Hz in MP@ML:
MP@ML に 60 Hz の progressive を入れる議論で、 720 x 240 x 60 の field を progressive frame として符号化することを導入したいという Norway 提案である。デコーダのリソースの能力としてはそろっているが、デコーダには可能なものと不可能なものが有りえる。 Singapore では最大フレームレートを 60 Hz にするこの提案は否決された。 Progressive 720 x 288 のフォーマットは必要性が低いとされた。

参照 field :
B-picture で 2-3 pulldown が行なわれたとき、top(bottom) field first が入れ替わる。 Singapore では、reference field の記述の Editorial 修正として reference field は最新 2 つの符号化 I,P field でなく、各パリティの最新の符号化 I,P field であると記述した。

Dual':
Dual prime は B picture を含むシーケンスでも、連続した P picture (例えば I,B,P,P の最後の P )に使っていいと Grimstad で確認。

≪＝BACK　TOP∧　NEXT＝≫

６. MPEG-4

93 年 7 月の NY 会合から正式にスタートした MPEG-4、超低ビットレートの次世代符号化の標準化が 5 年間のスケジュールで行なわれている。技術研究のセミナーと Requirement 作業がおこなわれた。Application Oriented Environment (AOE) というグループ名が使われている。

≪＝BACK　TOP∧　NEXT＝≫

６.１超低ビットレート

前回の報告で触れたように、ソウル会合で "Very Low Bitrate" というタイトルを "Very High Compression Rate" とする問題が USNB から提起されたが、94 年 3 月パリ会合ではこのタイトル変更問題は反対多数で否決された。すなわち、MPEG-4 の方向は変更されず、超低ビットレートという目的に進むことになったのである。

4 月から 7 月まで Application list の作成、この領域の Channel characteristics の調査、Object oriented syntax の記述方法について Adhoc group の活動がなされた。セミナーはまだまだ続けていくようであった。 94 年 11 月までに Requirement Document ( Proposal Package Discription と Call for Proposal )を完成させる予定であった。

≪＝BACK　TOP∧　NEXT＝≫

６.２ MPEG-4 の意味

94 年 7 月の Grimstad では MPEG-4 の議論が白熱した。 AOE (議長 Cliff Reader)と Video の合同会合 (7/19 午後)では Video の議長 LeGall(ルガール) は新しい技術などないという次のような否定的議論をした。

AOE の Reqirement の説明を O' Cornell が行なったあと、 H.261, MPEG-1, -2 との Req. の違いが明確でない事を指摘し、 MPEG-4 の意味について議論に移り、"波形符号化ではないか、私も Subband 符号化から来た人間だが、実用的なのは DCT だ。今度もやはり DCT だろう。(LeGall)" "Functionality だ。" "20 kbps への Generic solution がある。" "Video Content 符号化となる。" "PDA である。" "60 % は DCT だ。(LeGall)" "いや 2/3 は DCT とは考えていない。" "DCT なら私が即座に reject する。(Reader)" "なるほどいい考え方だ。(LeGall)" " Segmentation base " "Block base を嫌っても、 DRAM と 16x16 の Block は適合している。Contour base より、 Block base がより低ビットレート向きだ。(LeGall)”

≪＝BACK　TOP∧　NEXT＝≫

６.３ 10 倍の符号化効率

MPEG 議長のキャリリオーネの演説と質疑応答があった。 "既存の標準と重複する Requirement では新たな標準はできない。新たな技術がでないならセミナーなど無駄だ。MPEG-4 を止めてもいい。 10 倍の圧縮率を実現する技術が本当に欲しい。まけても 8 倍である。 MPEG-4 を移動体通信だけとみるのは間違いである。これだけの参加者がそれだけの領域に満足するはずがない。画像データベースも考えなければならない。 Functionality は日本でよく言う"おまけ" であり、中心的技術ではない。本当の Functionality は Coding Efficiency だ。圧縮率が生産をする。 10 倍は可能だ。"

MPEG-4 が互換性を絶ち切るほどの技術を標準化できるなら、それこそ必要なもので、心の沸き立つような気のする演説と私は思ったのだが、 MPEG-4 の実作業をされて来た方にとっては今までの作業を全否定されるものだったのかもしれない。 MPEG-4 の作業成果であった 80 page にもなっていた Reqirement document は完成間近で大変更を余儀なくされた。 PPD は 1page のみになって最終 Plenary に提出された。 Cliff Reader は最終 Plenary 前の議長会合に報告を作成しなかったため、キャリリオーネの最終 Plenary の resolution には "AOE", "MPEG-4" の言葉が完全に消えていた。MPEG-4 の議長 Cliff Reader の立場が難しくなった。この Plenery で Cliff は途中退席した。Adhoc group の議長としてだけの立場が残った。MPEG-4 自体が存在しなくなる可能性もあった。11 月のセミナーは中止となった。

その後、日本でキャリリオーネにお会いする機会があり MPEG-4 について質問したとき、彼は、 "圧縮率か Functionality が既存標準と異なるものがなければ標準化として正当化できない。" といわれ、"Cliff は馘首ですか"という質問には "Cliff にそれほどの緊張を強いたことを知らなかったことを反省している。" と述べられた。

MPEG の標準化は実用になる範囲の、高度な技術の発見が基本となってきた。その意味で、 MPEG-2 は達成目標がより明確で近いものだった。それでも年に 5 回も 6 回も世界中で行なわれた MPEG 会合は技術者にとって困難な戦いであった。客観的な実験結果を持ち寄って独立 2 者以上の同一結果を規準に、技術要素の収束を計ってきたのである。現在の 10 倍もの圧縮率が望まれている MPEG-4 は MPEG-1,2 との連関を切る、高度な技術が必要とされているように思えた。符号化効率を上げるのはまさしく困難な仕事であり、この領域で初めて DCT 以外の登場の可能性がある。Fractal coding の関係者も MPEG-4 には姿を見せている。

≪＝BACK　TOP∧

６.４ PPD と Call for Proposal

Singapore 会合では MPEG-4 の活動をサポートするという US と German NB の意見に支えられて、 PPD version 1 ( 3 月には revised version を作る。) と、 Call for Proposal が無事に作成された。

Tool と Algorithm と Profile という定義をつくり、Algorithm は Tool で構成され、Profile は Algorithm で構成される。Syntax はそれら全てを扱う(図 4)。 95 年 10 月締切、11 月主観評価される Proposal は Tool と Algorithm の提案であり、96 年 11 月の Subjective Test は、 complete system の提案となる。

Functionality は Coding Efficiency を先頭にしたが優先順位はつけない。 Coding Efficiency には、2 倍とかいう数字もない。"既存標準よりよい符号化効率" であり、"ずっとよい" ではない。Content-based scalability, Content-based manipulation とか、Content-based の言葉がキーワードになっている。困難さは多少緩和されたようだ。 MPEG-4 セミナーはなかったが Video との合同会合で技術発表があり、Segmentation base の符号化もデモされ始めた。

図 4 MPEG-4 の要素

MPEG-2 の技術修正と MPEG-4 (1994年)

１. はじめに

２ Paris 会合で MPEG-2 は DIS となる

２.１ マクロブロックの最大ビット数の設定

２.２ 2-3 pull down の progressive (60Hz)への拡張

２.３ chroma_420_type の廃棄

３. IDCT の精度の話題

３.１ シーケンスエンドコードの後

３.２ その他

４. Grimstad (Norway) 会合と、Singapore 会合

４.１ DIS 投票による IS への進行

５. Video の技術的問題と修正

５.１ Copyright in bitstream (著作権記述)

５.２ VBR-VBV

５.３ Temporal Reference

５.４ Spatial Scalability の下位レイヤとの GOP 構造

５.５ PAL 2-3 pulldown の問題

５.６ フレーム再配置について (malformed bitstream)

５.７ Video Conformance と IDCT 精度

５.８ ビットストリームの結合(Concatenated Sequence)

５.９ その他

６. MPEG-4

６.１ 超低ビットレート

６.２ MPEG-4 の意味

６.３ 10 倍の符号化効率

６.４ PPD と Call for Proposal

２.１マクロブロックの最大ビット数の設定

３.１シーケンスエンドコードの後

３.２その他

５.６フレーム再配置について (malformed bitstream)

５.８ビットストリームの結合(Concatenated Sequence)

５.９その他

６.１超低ビットレート