KTAソフトウェアの手引き(続き)
後半は追加されたツールの概要とどれぐらい性能が向上したかの説明.だらだらと続くので,先に興味深い発言(と,私の感想)だけをピックアップします.
イントラの提案は結構あったんだけど,ひどい目にあった
昨年度は日本の各社,イントラ予測の提案がなされていました.全国大会でも見受けられました.しかし,採用されるまでには至らなかったようですね.やっぱり平均的に10%もレート削減するのは困難な様です.
演算精度は符号化効率に影響が大きい
よくTVの高画質化回路では12bitとか言われているが,実は符号化でも同じことがあった 思っていた以上に影響があるとか 補間,変換,デブロッキングフィルタなどに影響がある
そろそろ次世代動画像符号化の標準化がはじまりそう
もう始まってしまうのか!というのが率直な感想.成果物を出すという意味では3年ぐらい検討したので妥当なのか?DCT+MCのフレームワークを壊さないとなると,致し方ないか.次世代というより,半世代更新かなぁ.
アンカーの制約をはずすと20~50%ぐらい良くなる
これはかなり衝撃的な結果.順を追って説明します.以下に述べるツールのうちいずれか4つを組み合わせます.前回述べた画質評価方法では,最強のH.264/AVCと比較することになっています.例えば「階層双方向予測構造」がかなり効いてくるので,既存のAVCと比較しても10~20%ぐらいしか符号量を削減できません.
しかし,階層双方向予測構造は初期のAVCでは考慮されていなかったので,これが使われていることはほとんどないのです.したがって,最強ではなく一般的なAVCと比較する(アンカーの制約を外す)と,符号量を半減できるというわけです.
ちなみに,どの4つかは企業秘密だそうです.でもまぁ,だいたい予想はつきそうですが.
KTAで追加されたツール
適応補間フィルタAIF
- 2次元非分離フィルタ
参照フレームを作るときに任意のフィルタを適用する.送るべき係数は,係数の対称性や,同一フィルタを適用することにより,54個に縮退できる.
- 2次元分離フィルタ
分離型でもほとんど同じ性能を実現できる
- 方向性フィルタ
フィルタ処理の方向を限定し,計算量と係数の数をさらに削減
- 拡張方向性フィルタ
整数部分の含めたオフセット係数付き適応補間フィルタ 720p以上の映像,P-Sliceに効果
高精度補間フィルタ
- 高精度H.264フィルタ
補間フィルタの途中の演算精度を上げたもの(今の補間フィルタは平均値がちょっと上がる.原因は2で割るところ)
- 拡張固定方向性フィルタ
方向性補間フィルタと補間位置によって,±1のオフセット値よりローパスフィルタを採用
- 切り替えフィルタ
三つの補間フィルタの切り替えと補間画素位置ごとのオフセット係数をSlice単位で送る
動きベクトル予測競合(MVC)
Multi View Codingではありませんよ!動きベクトルとスキップベクトルの予測方法を空間方向と時間方向に複数用意して,もっとも良い方法を選択 動きベクトルの符号量削減とスキップベクトルの性能向上
1/8画素精度動きベクトル解像度
動きベクトルは1/8画素精度まで探索 予測効率の向上と動きベクトルの削減
モード依存方向変換
イントラ予測の方向に応じた直交変換 予測残差の効率的な変換
ポストフィルタSEIの拡張
1シーンまとめて最大16個のフィルタを設計してSEIで符号化
レート歪み最適化量子化RDOQ
マクロブロックごとに5つのQP値の調整と,トレリスによる丸めオフセットの最適化 最適化のラムダの誤差を吸収と丸めオフセットの最適化
重み付き予測のオフセット係数の改善(New Offset)
重み付き予測のオフセット係数の新しい求め方 重み付き予測の性能改善
内部画素ビット長拡張
入力画素ビット長よりも内部のデータ長を大きくして符号化 補間フィルタ,変換処理の丸め誤差を低減し,効率向上 12ビットで飽和 ある分野の技術者からは激しい抵抗にあっている(DSP関係者かな?内部演算精度を保証させられるのは大変だろうに……)
その他
- Intra Coding関係
- Intra Prediction多数
- Intra MC
- MV関係
- Template Matching 10%ぐらいあがる(MVを送らない)(これってDoCoMoの提案かな?)
- MC関係
- Geometrical Adaptive block partitioning MC
- 3D-DCT
メモ
「付加情報を送らない,DCT係数でRD」というメモが残っているのだが,何を意味するのか忘れてしまった.特に後者……まぁ,いいか.