一般講演感想 - タンタン的思考

低密度パリティ検査符号と多元Sum-Productアルゴリズムを用いた動画像圧縮法

知らないことだらけで，面白かった．複数フレームに対して，ラスタースキャンはさすがにまずかろうと思う．動き補償を考慮するならば，スキャンをフレーム間に渡って行うといいと思う．

如何せん，LDPCとかSum-Productの理論とか傾向がわからないので，憶測の域を出ない．ざっくりネットを探してみたんだが，よくわからないなぁ．

DCTを利用したH.264/AVCにおけるIntra予測モードの決定手法

DCT後にIntra予測を出来ないものなのかな．行列計算的には出来そうな気がするけど．どれほどのメリットがあるのかは不明．

実験結果の考察（発表時）が不十分すぎ．発表者の符号化に関する理解不足が質疑応答から垣間見えた．

符号化アーチファクトを抑制するH.264符号化モード選択方式

いつもながら，細かくて重要なところを突いてくる研究だった．

Intraでmode0,1が，InterでSkipモードが拡散して主観的な画質劣化を引き起こす．most probable mode優先がまずいので，ちょっぴり条件式を弄る．skipのコスト値が負だったり，ゼロベクトルがあると自分もゼロベクトルになったり，中央値はゼロが多くなったり，と言うのが原因．これを解消しましょう，という提案．

ホントに符号化して，きちんと主観評価している人じゃないと気が付かないなぁ．私のように他人の研究みたり，手元でちょっとした実験をやっているだけでは到底たどり着けない境地．ある意味羨ましかった．

MPEG-2/H.264低遅延HDTVソフトウェアトランスコーダ

1440x1080 4:2:2画像に対して，MPEG-2デコードとH.264/AVCエンコードがXEON3.2G x 4台でリアルタイムエンコードが可能．ただし，動き探索は96画素四方に制限している．

タイトルはトランスコーダなのだが，技術的にはベースバンド信号（復号画像）とフレームタイプ（IPB）しか受け渡しをしていない．研究的にはトランスコーダとは言わないでしょ．最低でも動きベクトルは受け渡しをして処理量を削減しないと．

ただし，遅延時間が理論値程度まで削減されているので，開発としては成功していると考えられなくもない．遅延時間の定義がMPEG-2デコーダのデコード時間を基準にしているので，これも技術的にはおかしい，と会場から疑問の声が上がってた．

ワイプ・DVEのパターン非依存な検出手法

タイトルから中身を想像しにくいな。CGによるシーンチェンジの大部分を検出する方法。差分画像とCannyフィルタを利用。差分画像はちょっと手が込んでいる。3枚利用して2枚ずつ差分画像を作る。さらに差分画像同士でandをとって、有意な領域を抽出する。

メタデータ制作フレームワークの提案とメタデータエディタの開発

要約には、サマリ型とトレーラ型がある。前者は野球のダイジェストのように全体理解が可能であること。後者は15〜30秒のスポット映像にようにこれから見ようとする人向けで、魅力的に見せるようにする。演出も重要。

モジュールのインタフェースは、モジュール制御とデータ操作の2箇所。