PCSJ 次世代画像符号化プロジェクト レポート

 今年もナイトセッションは符号化に参加してきました.簡単なレポートです.

 H.265と言われる次世代動画像符号化は2012年に規格化終了予定.すでにCfPも出ているとか.なお,名称はVCEG側ではNext-Generation Video Coding(NGVC)を,MPEG側ではHigh Performance Video Coding(HVC)を提案していて,未だ決まらず.

 H.265での主な改善項目は以下の通り.

  • Improved inter predition
  • Adaptive interpolation filter
  • 1/8 pel interporation
  • Motion vector cpmpetition

 インター符号化の改善がメインとなっている.また,イントラ符号化の改善は5%程度にとどまったため,一つも採用されなかったとのこと.イントラ符号化の改善には停滞感が漂っており,静止画像符号化の専門家の参加を欲している.

 以下私見*1.静止画像はウェーブレットに移行しており,いまさらDCTの改善に協力する気はないだろうなぁ.さらにマイクロソフトJPEG-XRをひっさげて乗り込んできて,さらに萎えている感じ.

 イントラ符号化技術では,予測画像(KTAでの採用はゼロ),予測モード,周波数変換,変換係数スキャン,その他が検討された.さらに検討状況.

  • 多くの提案が予測画像生成方法の改善に関連
  • H.264/AVCの方向予測やDC予測改善関連
  • 画像の空間相関にあった変換サイズ,予測残差の特性にあった変換も効果が高い
  • 方向+DCベースの改良が有力 しかし技術が煮詰まりつつあるのでCfPで別の技術が誕生することも期待
  • 変換サイズ拡大の可能性は大きい
  • 平坦領域の画質改善は必須

 予測が近傍のみを使うというのは単純すぎないか,というという問いに対する返答.平均的に良くなる方法が選択されがちである.また,サイド情報があるので(遠方の画素を使うのは)なかなか難しい.

 以下私見.シャープやNTTから提案されている技術は私の同期たちが提案した技術が基になっている and/or 組み込まれている.次世代符号化では採用されているものは少ないかもしれないけど.次々世代符号化ではかなり影響力を増していくというか,世界を動かしていくというか……少し感慨深い.私も遅ればせながらそこに参戦していくのかな.

 次世代符号化のターゲットは超高精細画像で,BT.1769で規格化されている.たとえば7680x4320画素など.Super Hi-Vision(NHK製作)はまだS/Nが悪いので,意外と符号化が大変とのこと.動画で見る分にはよいけど,止めて見るとかなり汚い.フレームレートは今のところ60fpsでほぼ決まりらしい.年末の紅白なんかは,符号化特有の目を覆いたくなるようなノイズが出て困っている.超高画質を標榜しているNHKとしては何とかしたい.PSNRだけでははかれない部分もケアしてほしい.

 skipとinter16x16の中間的な符号化モードが必要であろうと考えられる.なぜなら,8k4kの画像だと中間的なRDポイントが現状存在しない.

 次世代符号化標準に求められるもの

  • とことん圧縮率
    • 現映像サービスが高品位フォーマットへ切り替わる必須条件
    • 高品質映像をコンパクトに,きれいに
    • 信号特性が変わる HDTV〜UHDTV,4:4:4,>8bit/pel,>60fps
    • HDを何とか伝送するから,質感・臨場感を伝える
  • でも演算量は何とかしたい
    • プロセッサはマルチコアへ
    • 並列処理と親和性が高いアルゴリズム

 次世代標準のニーズとは(デジュール vs デファクト

これに対して

  • オープンソースでは,4k2kなんて相手にしてくれないので,標準化の枠組みを活用するべき
  • インフラとして利用するには,標準であることが極めて重要
  • 量産化することでハードウェアのコストを下げる

 標準化プロセスについて

  • ◎ ワーキングモデル
    • ISO/ITU連携による世界統一規格
  • ○ スピード感
  • × 技術評価プロセス
    • R-D性能による競争 これはエコじゃないし,コストがかかる
    • 主観評価のあり方が確立されていない

 以下私見.標準化に関わる研究者は熱かった.自分たちが世界標準を作っているという自負が大きいのかな.あと,マルチコアで投機的な予測画像生成をしつつ,あまり多くの試行錯誤をすると「エコじゃない」のである程度決定的になった方が良いのか.しかしなんというか,H.264のJMは酷いコードだったからなぁ.マルチコア対応の検討とか不可能だろう…….

*1:司馬遼太郎みたいな書き方だな.たぶん読みにくいと思うww