MPEG-2 の技術修正と MPEG-4 (1994年)

片山泰男 (Yasuo Katayama)
1994 年 12 月 4 日


戻る 開始=≫

1. はじめに
2 Paris 会合で MPEG-2 は DIS となる
2.1 マクロブロックの最大ビット数の設定
2.2 2-3 pull down の progressive (60Hz)への拡張
2.3 chroma_420_type の廃棄
3. IDCT の精度の話題
3.1 シーケンスエンドコードの後
3.2 その他
4. Grimstad (Norway) 会合と、Singapore 会合
4.1 DIS 投票による IS への進行
5. Video の技術的問題と修正
5.1 Copyright in bitstream (著作権記述)
5.2 VBR-VBV
5.3 Temporal Reference
5.4 Spatial Scalability の下位レイヤとの GOP 構造
5.5 PAL 2-3 pulldown の問題
5.6 フレーム再配置について (malformed bitstream)
5.7 Video Conformance と IDCT 精度
5.8 ビットストリームの結合(Concatenated Sequence)
5.9 その他
6. MPEG-4
6.1 超低ビットレート
6.2 MPEG-4 の意味
6.3 10 倍の符号化効率
6.4 PPD と Call for Proposal


≪=BACK TOP∧ NEXT=≫

1. はじめに

MPEG 報告が多少間を置いて、前回から 1 年ぶりになってしまったので 3 会合まとめての報告になる。 94 年 3 月のパリ会合と 7 月のノルウェー そして 11 月のシンガポールである。 私の主要な関心事は、MPEG-2 Video であり、それに次いで MPEG-4 である。 3 会合を通して、 MPEG-2 Video は CD (93 年 11月 Seoul)から技術的内容がどのように修正されるか、無事 IS となって使われる標準となるか見届けたいのである。MPEG-4 はその タイトルが超低ビットレートとなっている問題がどのように解決されるのか、 新たな技術は出てきているのか、などに興味があるのである。

画像符号化技術のなかで標準化に採用されてきた技術は枯れていて実用的な 段階に達したものであるが、MPEG-4 にはそれはなんだろうか?やはり、 MC-DCT なのか、アフィン変換まで対応した MC の高級化か、全く考え方の 違う Fractal 符号化だろうか、Segmentation 符号化か、Model ベースか、一般の 画像を目的にした Generic (汎用) 符号化なのか、目的にあった符号化なのか、 多くの人々が様々に憶測するなか Subjective test (主観評価)の日程は 1 年 後に近づき、どの技術で攻めてみるかアルゴリズム屋さんは知恵を絞っている ことだろう。

ITU-T の short term の標準化では RM (参照モデル)に近いものとして、 TMN2,3,4 と高級化している。ITU-T の long term でもある MPEG-4 はそれより、 高級な技術が望まれるだろう。それはなにかである。MPEG-4 については最後に 3 会合まとめて説明する。まずはパリ会合の MPEG-2 の Video からはじめよう。


≪=BACK TOP∧ NEXT=≫

2 Paris 会合で MPEG-2 は DIS となる

94 年 3 月 21 日から 25 日までの行なわれたパリ会合では、各国の National Body は CD 投票 による DIS (Draft International Standard) への関門なので技術的 変更要求を "コメントつき賛成"、または"コメントつき反対" という手段で要求した。 Editorial コメントはすべて受け入られたが、技術内容に関わるものは議論され、 取捨選択された。結果はシンプルで、重要な技術的変更はつぎの 3 点である。


≪=BACK TOP∧ NEXT=≫

2.1 マクロブロックの最大ビット数の設定

マクロブロックの最大ビット数の設定は、以前から続く話題であるが、 CD では、 Bitstream の conformace issue とされ、Video part では Informative section に書かれていた。今回は、Adrian Wise 氏(Pioneer) の希望らしく、UK NB と、US NB からの意見となった。

これを定めると、デコーダを容易にするがエンコーダ製作を逆に困難にする というトレードオフがあり、設定は標準の技術内容を変更するものではない と議長は判断し積極的に導入する姿勢をとった。強い反対はなく、最後には Video の合意とされた。次の(1),(2),(3),(4)が比較され、(3)が結論となった。

表 1 マクロ ブロックの最大ビット数の設定
(1)No limit                                               
(2)limit T/MB                                             
(3)No more than 2/row T= 64*6*12/(4:2:0)                  
(4)No limit on I MB, limit T' on P,B MB T'= 64*6*8/(4:2:0)

≪=BACK TOP∧ NEXT=≫

図 1 マクロ ブロックの最大ビット数の設定
制限する bit 数 T bit/MB = 64*6*12 は、FLC を使った最大発生 bit 数 Tmax= 64*6*24 (24: escape(6bit) +run(6bit) +level(12bit))の半分である。

4:2:0 において 64*6*12 = 4608 bit を越えるマクロブロックを禁止するが、 1 row あたり、2 つのマクロブロックまでの制限オーバを許す(図 1 )、 という例外付きにすることはエンコーダの処理を簡単なフィードバックで 済ませることができるためである。

ついでに VLC が用意されている run-level 対にも Escape + FLC は常に 使えるという確認をした。


≪=BACK TOP∧ NEXT=≫

2.2 2-3 pull down の progressive (60Hz)への拡張

Barry Haskel(ATT) の提案 (MPEG94/103)である。 プログレッシブ表示において( progressive_sequence= 1 )、 2-3 pull down が出来るようにしたい(図 2 )。 ATV の progressive のような時、 フィルムソースの表示の必要性は理解され受け入られた。ただし、 High ,H-14 レベルの、frame rate が 60 Hz と 59.94Hz のときに制限された。

progressive_sequence = 1 の時、 repeat_first_field = 1なら top_field_first = 0 で 2 回表示、 = 1 で 3 回表示である。

通常の 2-3 pull down はフレームレート 25, 29.97, 30Hz に可能とした。 23.97Hz と 24 Hz には許さない。エンコーダの VBV (Video Buffer Vefifier) 計算に影響するので、そのための document が作成された。なお、MPEG-1 でも使われている自動的 2-3 (automatic 2-3) は MPEG 標準外のポスト処理 であるとする。


図 2 2-3 プルダウン

≪=BACK TOP∧ NEXT=≫

2.3 chroma_420_type の廃棄

輝度が interlace 時に色差には interlace と progressive があると Spatial Scalable の下位レイヤが 420 の時、色差の upsample を複雑にするため、 chroma_420_type は pregressive_frame と同義とした。 interlace の色差の 扱いを常に interlace とする制限で、色差の縦方向の分解能は低下した。


≪=BACK TOP∧ NEXT=≫

3. IDCT の精度の話題

これには 3 つの話題があった。まずは、ATT から新しいミスマッチ対策 の提案かと思われる書類がでたが encoder issue であると Barry Haskel は控えめなコメントをしたため、重大な問題にはならなかった。

2 つめは、Jhone Morris による問題提起で、静止画を DCT の低域係数から 例えば各画面に Block に 1 係数ずつ追加していくような再現をすると、静止画が しだいにフォーカスが合ってくるような動画再現になるが、このとき IEEE 規準を 満たす精度の IDCT であっても、エンコーダの Frame buffer を変化させない係数を Coded block として送ってしまい、 IEEE 規準をみたすデコーダでもミスマッチ が累積する現象あることが e-mail で報告され議論されていた。

対策としての可能性は、 (1) IEEE 規準を厳しいものにする。(2) そのような エンコーダの frame buffer を変化させない Coded block を送ってはならないと決める。 (3)なにもしない。があったが、Jhone Morris は すでに凍結された標準を 変更するつもりはないといい、 結論は (2) に近く、 Normative part に注意を促す 文章を入れることになった。

もうひとつは GCL から DC 係数は完全な精度で、 AC 係数には低い精度の IDCT を もつデコーダでもかなりの画質が確保できるという結果( 5.5 bit 精度 の定数乗算 で -0.1dB 程度) が提出され、"IEEE 規準を厳しくすることはやめて ほしい。できたら、IEEE 規準を緩めてほしい"という意見がでた。

これは Inter-operability をすべて確認したわけではなく、静止画においては 現在のミスマッチコントロールですら、まだ問題が見られる例も議論に上げられ、 議長は IEEE 規準は (1)緩すぎるのか、(2) 厳しすぎる (3) 丁度いいの三つの 可能性をあげて現在は (3) とせざるをえないとした。


≪=BACK TOP∧ NEXT=≫

3.1 シーケンスエンドコードの後

標準がなにも規定していない Sequence End Code の後の問題を Tristan Savatier(TCE) は次のように取り上げていた。

(1) 大抵のデコーダはバッファ内容を捨て去るだろうから最低、 buffer_size 程度のスタッフィングが必要である事。

(2) 画像サイズなど全く変更しなくても、編集によって、 top_field_first が狂うだけでも画像はつながらない。

(3) VBVの整合性をとるためにもスタッフィングは必要である。

"シームレス bitstream" のための結合した VBV 整合をとる方法、 を考えなければならないという問題提起であった。


≪=BACK TOP∧ NEXT=≫

3.2 その他

Spatial Scalability について、上下のレイヤで同じ GOP 構造、I,P,B 構造 をとるとしていたが、base が field で enhancement が frame なら、field をまとめてから up-sample する必要があり、 PTS, DTS も上下で同じ値をと るのは難しい。 結果として、上下で同じ frame/field picture 構造をとると 定めた。field picture では field で upsample する。 また、Nick Wells(BBC) から、 upsample での色差のサンプル位置が WD 型に 合わせていて、 CD には合っていないことが指摘された。

D-picture: ドイツ NB から MPEG-1 の Conformance part から D-picture を 除外せよという意見がでたが受け入られなかった。

Temporal Scalability : 基本的に記述が不足しているため、Atul Puri (ATT) が document を用意することになった。

Data partitioning: bit_rate, vbv_buffer_size, vbv_delay は全体の stream に対する値とする。

Dual' vector range: dmv の加算の前後ともに制限をいれる。


≪=BACK TOP∧ NEXT=≫

4. Grimstad (Norway) 会合と、Singapore 会合

7 月 18 日から 23 日までノルウェーの南端近くの田舎街グリムシュタット (Grimstad) で行なわれた MPEG会合では、MPEG-2 Video は DIS 投票中なで、 DIS 修正はできない状態のまま、技術的な問題も議論された。技術的問題を列挙し、 解決方法を探り、結論は先送りにされて、次会合で、National Body の意見 として提出するしかない。そのため、シンガポール会合と内容が重複する説明 にならないように、技術内容毎に両会合の結果をまとめて説明する。

MPEG Singapore 会議は 11 月 7 日から 11 日まで Singapore の National Computer Board で行なわれた。DIS から IS になる会合であり、修正の最後 のチャンスである。

MPEG-2 は System, Video, Audio (13818-1, -2, -3)の IS への進行を各国の National Body の意見で確認する必要があり、System は技術的問題を解決す る必要から技術的な修正がなされ、Audio は MPEG-2 マルチチャネルの性能 が低いことが明らかになったのでどうするかが問題になる。Video では技術的 修正がどれだけあるかが興味あるところであった。


≪=BACK TOP∧ NEXT=≫

4.1 DIS 投票による IS への進行

Singapore 会合初日の Plenary では各国の NB 意見が提示され、System には Aus, Fr, D, J, Ne, UK, US, Norway の 8 ヶ国が反対票を投じ、 Video には Fr, J の 2 ヶ国、Audio には Aus, Fr, Itl, J, Sweden の反対があった。 70 % の NB が反対しなければそのままでもいいので、Video, Audio は すでに安全圏である。System はその後すぐに D (German NB) が賛成に転じ たので、70 % をみたした。反対意見にはコメントが付いていて、それに対応 して修正を考慮していくのである。1 週間の会合中に修正は行なわれ、最終日 には MPEG-2 は System, Video, Audio とも IS に進行した。出版は 95 年中 になるだろう(現実には ISO/IEC 13818-2 は 1996 年 5 月 15 日に発行さ れた)。


≪=BACK TOP∧ NEXT=≫

5. Video の技術的問題と修正

Grimstad で列挙され議論された、MPEG-2 Video の技術的問題については Singapore では各国の意見にしたがって技術内容修正と、Editorial 修正を 行なった。以下は重要と思われる順に、技術内容変更をたどる。


≪=BACK TOP∧ NEXT=≫

5.1 Copyright in bitstream (著作権記述)

Copyright については 93 年の NY 会合で NHK から提案が出て、その時は すでに凍結した MP@ML に影響するからと Video では否定され System に 入れられたことがある。今回は、 France NB から、Video の bitstream に Copyright 記述 ( ISBN 番号の 64 bit )を入れよという意見である。これに 対応するシンタックスが考案され、Start code をもつ、 Extension ID = 4 の extension が用意された。

問題は、すでに設計されたすべての Chip がこれを無視できるかどうか であったが、反対はなく OK となった。結果的に Copyright 記述は System, Audio と Video が 3 つとも異なる形式になった。 最終 synatx はつぎの通り(表 2)。 Picture 毎で、picture coding extension の後に許され、その Semantics は 6.3 章にある。

表 2. 著作権記述 (Copyright extension)
extension_start_code_identifier (4 bit)
copyright_flag                  (1 bit)
copyright_identifier            (8 bit)
original_or_copy                (1 bit)
reserved                        (7 bit)
marker_bit                      (1 bit)
copyright_number_1             (20 bit)
marker_bit                      (1 bit)
copyright_number_2             (22 bit)
marker_bit                      (1 bit)
copyright_number_3             (22 bit)

≪=BACK TOP∧ NEXT=≫

5.2 VBR-VBV

Variable Bit Rate (VBR) の Video Buffer Verifier (VBV) について Grimstad では System が 6 月のアトランタ ad-hoc会合で MP@ML の bitrate 上限(15 Mbit/sec)を越えた 18 Mbit/sec の Video 入力 を使う問題が System との間で議論された。その後 adhoc group で e-mail で議論された。 Singapore では adhoc group の解決策が発表され、 Video の vbv_delay の意味と Annex C が変更された。

vbv_delay 項目を 使う VBR mode と その項目に FFFF を記述するモード の 2 つのモードが使えることになった。FFFF mode では、 bitrate 項目 の最大 bitrate でバッファを満たし、一杯になると止める。

vbv_delay 項目を使う VBR mode では picture 毎に一定ビットレート と考えるモードで、 skipped picture では picture 自体がないので Low delay では FFFF mode しか動作しないと記述された。


≪=BACK TOP∧ NEXT=≫

5.3 Temporal Reference

Skipped picture と VBR--VBV の問題にからんで、TR が問題になった。 デコーダは skipped picture を知る必要があるが、問題点は、skipped picture の有る場合も、TR は 1 ずつしかあがらず、GOP の先頭で 0 に リセットされる事である。TR ではすでに遅すぎるという問題もある。 Action がとられ、解決策ができた。

Temporal Reference の項目の意味が変更され、H.261 と同じく、 TR は skipped された frame だけ飛ばした番号にした。 GOP の直前で Big picture があり、 skipped picture が 例えば 3 枚あった場合、GOP の先頭で TR 値は 3 にリセットする。

TR が Skipped picture のある、 Low delay mode でも有効になったため、 VBR-VBV が解決可能となった。 また Spatial Scalability の 下位レイヤに skipped picture が禁止されなくなった。 次項の System の scalable bitstream 間での PTS と DTS 一致 という制限を無くしたことによって、ソウル会合での H.261 との逆方向 互換性の崩壊は救われたのかもしれない。


≪=BACK TOP∧ NEXT=≫

5.4 Spatial Scalability の下位レイヤとの GOP 構造

Spatial Scalability では、Frame/field picture 構造の一致だけでなく、 GOP 内の I,P,B 構造が下位レイヤと一致させていたが、System の PTS, DTS の完全一致という制限は厳しすぎるという意見が Mike Nilsson (BT) からあり、 下位の同時、直前、low delay でないときはもう一つ前の I,P 画像からも 下位からの予測につかえる形になった。

lower_temporal_reference をつかって、次のような上下の関係も可能にな る。上の I1, P2, P3 は 下の P4 を使え、 上の P4 は 下の P4 または P7 が使える(図 3)。 Video はシンタックス変更は不要で、意味の修正を行なった(7.7.3.1)。System の記述も改められた。


図 3 空間スケーラビリティの機能変更
下位を I,B,B,P 構造で効率的にしておき、上位を I,P,P,... とすると、 大きいほう(上位)のフレームメモリーが減り、ぼけた B 画像でなく、 I,P 画像を使うことよる画質向上が期待できる。欠点として、時刻の離れ た画像からの MC なし予測の有効性の疑問と、下位 B-picture の buffer が一枚増えることである。

以上、SSP, High, のプロファイルは大きく機能変更したが、今回発表の Verification Test の結果から、Spatial Scalability の性能はかなり高く、 MP@HL と同等程度、チューニングによってはより良い場合があるということ で Spatial には期待が高まっている。


≪=BACK TOP∧ NEXT=≫

5.5 PAL 2-3 pulldown の問題

PAL (50Hz フィールド) にも 24 Hz を 25 Hz にする 2-3 pull down が許され ているが、MP@ML のデコーダに 601 PAL 画像 (720x576x1.5)を 3 frame 持つと 16 Mbit では余裕がないという問題が Grimstad で問題提起された。 Singapore では、 480 line を越える画像では 2-3 pull down は B-picture に はできないという制限をつけた。


≪=BACK TOP∧ NEXT=≫

5.6 フレーム再配置について (malformed bitstream)

I0, B1, B2, P3 のような bitstream (数字は TR とする。B1, B2 は forward prediction しか使っていない) は許さないように、Frame reordering (6.1.1.11) の説明が例を使って説明していたのを論理的要求にした。


≪=BACK TOP∧ NEXT=≫

5.7 Video Conformance と IDCT 精度

Grimstad では Video の 14 の conformance bitstream ができ、 さらに拡張されることになった。また、精度調査のための仕組みを Conformance (WD 13818-4) にいれた。これは Singapore では CD となった。

Singapore では、H.261, MPEG-1, MPEG-2 と 逆量子化値の最大値がどんどん 大きくなっているため、Bitstream によっては IEEE 規準を満たす IDCT でも overflow する危険があることを Video の IS に注意を記述することになった。


≪=BACK TOP∧ NEXT=≫

5.8 ビットストリームの結合(Concatenated Sequence)

Paris, Grimstad と問題が明確にされてきたもので、シーケンスの結合に ついて、Sequence end code の後の動作は標準の規定外となっていて、 デコーダの動作はなんら規定されていない。

蓄積メディアの用途ではデコーダは動作を停止しても問題ないが、 放送用途にはコマーシャルの挿入などにも対応できるように、 結合したシーケンスにもスムーズにつながる、"シームレス動作"をさせたい。

なにか目安になるものを与えないとシーケンスの結合ができない。 シームレス動作のための 望ましい動作をInformative Annex に記述するという 方向になり、USNB から次回提案するとした。

Singapore では、Ren Egawa (Panasonic AVTL) が Informative Annex (MPEG94/431) を用意したが、IS には Informative 部分に VBV を overflow させない注意だけが数行書かれただけとなった。


≪=BACK TOP∧ NEXT=≫

5.9 その他

1/2.21 AR:
シネマスコープの Aspect Ratio が入っている問題ではすべての Profile で 対処しない事になった。Profile Level についての章、Chapter 8 の表現が Scalable の可能な構造を明確にするため大幅に修正されてたが、変更は420 から 422 への Scalability を Spatial scalability のシンタックスでも 可能にしたことだけである。

60 Hz in MP@ML:
MP@ML に 60 Hz の progressive を入れる議論で、 720 x 240 x 60 の field を progressive frame として符号化することを導入したいという Norway 提案である。 デコーダのリソースの能力としてはそろっているが、デコーダには可能なものと 不可能なものが有りえる。 Singapore では最大フレームレートを 60 Hz にする この提案は否決された。 Progressive 720 x 288 のフォーマットは必要性 が低いとされた。

参照 field :
B-picture で 2-3 pulldown が行なわれたとき、top(bottom) field first が入れ替わる。 Singapore では、reference field の 記述の Editorial 修正として reference field は 最新 2 つの符号化 I,P field でなく、各パリティの最新の符号化 I,P field である と記述した。

Dual':
Dual prime は B picture を含むシーケンスでも、連続した P picture (例えば I,B,P,P の最後の P )に使っていいと Grimstad で確認。


≪=BACK TOP∧ NEXT=≫

6. MPEG-4

93 年 7 月の NY 会合から正式にスタートした MPEG-4、超低ビットレートの次 世代符号化の標準化が 5 年間のスケジュールで行なわれている。技術研究のセミナー と Requirement 作業がおこなわれた。Application Oriented Environment (AOE) というグループ名が使われている。


≪=BACK TOP∧ NEXT=≫

6.1 超低ビットレート

前回の報告で触れたように、ソウル会合で "Very Low Bitrate" というタイトルを "Very High Compression Rate" とする問題が USNB から提起されたが、94 年 3 月 パリ会合ではこのタイトル変更問題は反対多数で否決された。すなわち、MPEG-4 の 方向は変更されず、超低ビットレートという目的に進むことになったのである。

4 月から 7 月まで Application list の作成、この領域の Channel characteristics の調査、Object oriented syntax の記述方法について Adhoc group の活動が なされた。セミナーはまだまだ続けていくようであった。 94 年 11 月までに Requirement Document ( Proposal Package Discription と Call for Proposal )を完成させる予定 であった。


≪=BACK TOP∧ NEXT=≫

6.2 MPEG-4 の意味

94 年 7 月の Grimstad では MPEG-4 の議論が白熱した。 AOE (議長 Cliff Reader)と Video の合同会合 (7/19 午後)では Video の議長 LeGall(ルガール) は新しい技術などないという次のような 否定的議論をした。

AOE の Reqirement の説明を O' Cornell が行なったあと、 H.261, MPEG-1, -2 との Req. の違いが明確でない事を指摘し、 MPEG-4 の意味について議論に移り、"波形符号化ではないか、私も Subband 符号化 から来た人間だが、実用的なのは DCT だ。今度もやはり DCT だろう。(LeGall)" "Functionality だ。" "20 kbps への Generic solution がある。" "Video Content 符号化となる。" "PDA である。" "60 % は DCT だ。(LeGall)" "いや 2/3 は DCT とは考えていない。" "DCT なら私が即座に reject する。(Reader)" "なるほどいい考え方だ。(LeGall)" " Segmentation base " "Block base を嫌っても、 DRAM と 16x16 の Block は適合している。Contour base より、 Block base がより低ビットレート向きだ。(LeGall)”


≪=BACK TOP∧ NEXT=≫

6.3 10 倍の符号化効率

MPEG 議長のキャリリオーネの演説と質疑応答があった。 "既存の標準と重複する Requirement では新たな標準はできない。 新たな技術がでないならセミナーなど無駄だ。MPEG-4 を止めてもいい。 10 倍の圧縮率を実現する技術が本当に欲しい。まけても 8 倍である。 MPEG-4 を移動体通信だけとみるのは間違いである。これだけの参加者が それだけの領域に満足するはずがない。画像データベースも考えなければならない。 Functionality は日本でよく言う"おまけ" であり、中心的技術ではない。 本当の Functionality は Coding Efficiency だ。圧縮率が生産をする。 10 倍は可能だ。"

MPEG-4 が互換性を絶ち切るほどの技術を標準化できるなら、それこそ必要な もので、心の沸き立つような気のする演説と私は思ったのだが、 MPEG-4 の 実作業をされて来た方にとっては今までの作業を全否定されるものだった のかもしれない。 MPEG-4 の 作業成果であった 80 page にもなっていた Reqirement document は完成間近で大変更を余儀なくされた。 PPD は 1page のみになって 最終 Plenary に提出された。 Cliff Reader は 最終 Plenary 前の議長会合に報告を作成しなかったため、 キャリリオーネの最終 Plenary の resolution には "AOE", "MPEG-4" の言葉 が完全に消えていた。MPEG-4 の議長 Cliff Reader の立場が難しくなった。 この Plenery で Cliff は途中退席した。Adhoc group の議長としてだけの立場 が残った。MPEG-4 自体が存在しなくなる可能性もあった。11 月のセミナーは 中止となった。

その後、日本でキャリリオーネにお会いする機会があり MPEG-4 について質問 したとき、彼は、 "圧縮率か Functionality が既存標準と異なるものがなければ 標準化として正当化できない。" といわれ、"Cliff は馘首ですか"という質問 には "Cliff にそれほどの緊張を強いたことを知らなかったことを反省している。" と述べられた。

MPEG の標準化は実用になる範囲の、高度な技術の発見が基本となってきた。 その意味で、 MPEG-2 は達成目標がより明確で近いものだった。それでも年に 5 回 も 6 回も世界中で行なわれた MPEG 会合は技術者にとって困難な戦いであった。 客観的な実験結果を持ち寄って独立 2 者以上の同一結果を規準に、技術要素の 収束を計ってきたのである。現在の 10 倍もの圧縮率が望まれている MPEG-4 は MPEG-1,2 との連関を切る、高度な技術が必要とされているように思えた。 符号化効率を上げるのはまさしく困難な仕事であり、この領域で初めて DCT 以外 の登場の可能性がある。Fractal coding の関係者も MPEG-4 には姿を見せている。


≪=BACK TOP∧

6.4 PPD と Call for Proposal

Singapore 会合では MPEG-4 の活動をサポートするという US と German NB の意見に支えられて、 PPD version 1 ( 3 月には revised version を作る。) と、 Call for Proposal が無事に作成された。

Tool と Algorithm と Profile という定義をつくり、Algorithm は Tool で 構成され、Profile は Algorithm で構成される。Syntax はそれら全てを 扱う(図 4)。 95 年 10 月締切、11 月主観評価される Proposal は Tool と Algorithm の提案であり、96 年 11 月の Subjective Test は、 complete system の提案となる。

Functionality は Coding Efficiency を先頭にしたが優先順位はつけない。 Coding Efficiency には、2 倍とかいう数字もない。"既存標準よりよい符号化 効率" であり、"ずっとよい" ではない。Content-based scalability, Content-based manipulation とか、Content-based の言葉がキーワードに なっている。困難さは多少緩和されたようだ。 MPEG-4 セミナーはなかったが Video との合同会合で技術発表があり、Segmentation base の符号化もデモされ始めた。


図 4 MPEG-4 の要素