信学会の感想

3連休の前(20日〜22日)、火曜日から木曜日(16日〜18日)まで電子情報通信学会の総合大会に参加してきました。今更ですが、参加報告。画像工学とパターン認識を中心に聴講・発表してきました。

発表者の総数はそんなに増減ないけど(関係者の努力の賜ですね、きっと)、不景気のせいか顔ぶれがいつもとだいぶ違う印象でした。画像工学では、D社のいつもお見かけしない方が大挙して押し寄せる一方、N社は全然お見かけせず。どういう社内事情ですかね。

H.265関連では、Adaptive Interpolation Filterの話が2件だけ。あれ、2件だけだったのか。一つは係数設計手法が提案されていた(D-11-1)。最適化問題を解くのではなくて、周波数領域で考えて、カットオフ周波数を適応的に決定しましょうというアプローチ。これは結構筋がよい気がする。もう一つは、AIFをフレームに複数用意する手法が提案されていた(D-11-2)。動きが均一だったり、テクスチャが一定ならば、AIF係数がフレームに一つでいいけど、そうでなければ領域分割しましょうという話。力業で攻めるのがH.265なので、そういう観点ではこれも筋がよさそう。とはいえ、分割方法が水平・垂直のみなので、もうちょい凝っても良いかな。

HDRI(High Dynamic Range Image) or 12bppのコンテンツを符号化する話も面白かった(D-11-7)。といっても、ダイナミックレンジに適応的に8bppに落としてしまうわけだが、これはこれでアリだと思う。

「ウェーブレット変換を用いた学習型超解像」が流行っているのでしょうか?ちがう研究室なのにほとんど同じようなタイトルと内容の発表があった(D-11-36,D-11-57)。どちらもやってみました、な感じの学生発表でしたが。Sonyの近藤さんが開発したDMCと方向性がどう違うのか(実現方法は全く違う)、よくわからず。というか、学習サンプルに依存するわけだし、これだったらPatchMatchとの比較がほしいなぁとかいろいろ考えされられた。

3月に採録された私の発表とほとんど同じ内容の発表もあった。全変動最小化の高速計算手法(D-11-37)。結局(私を含む)凡人の考える高速化なんて同じなわけで、少なからず自信喪失。論文の有意性って多分そこそこチューニングして時間比較を行った点だけにある気がする。そういうわけで、C言語での実装だと実行時間の計測ができないと頑なに主張する人の意図がよくわからない。とりあえずは比較できまっせ。とはいえ、提案されていた手法は面白そうなので、手持ちのプログラムに組み込んで比較してみたい。この段落は感想のみで、中身なしだw

17日のポスター発表にも顔を出してみた。信州大の田中先生の学生さんが面白い発表をしていた(自分も学生だけどね)。局所的な構造再現性を向上させるHalftoning手法でした。ブロック内の任意の2点について画素を入れ替えて、SSIMを入力画像に近づけるというアプローチ。結果画像が非常に素晴らしかった。

ベクタ表現のラスタライズに関する発表が大量に行われていて(D-11-49,53,54)、「自分の時代が来たんじゃね!」と大はしゃぎしてました。メーカーが力を入れてくれると、俄然現実性が高まります。まぁそうなることを予測して研究背景にベクタ表現を入れ続けたわけで、指導教授を含めて予測の正しさが証明されたわけです。大学すごいww

視体積交差法も革新が来てました(D-11-55)。どうも「研究のための研究」のような酷い研究がこれまで多かったのですが、今回はわりと筋がよさそうです。スティックにマーカーをつけて、マーカーを認識させる(ARToolKit)と、凹領域のボクセルも削除できるという代物です。是非ともフィギュアぐらい複雑な対象で試してほしいですww

神奈川大学斉藤先生によるTV正則化研究(D-11-59,60)。いつ聞いてもなんとなく分からなかったのですが、苦節5年、ようやくストンと理解できました。これについては、時間を見つけて語りたいww先輩とも同じタイミングで理解ができたらしく、セッション後に二人で盛り上がってしまった。ゼミのレベルがようやく斉藤先生に追いついたようです。

パターン認識のセッションは、普段あまり行かないので知らない先生がちらほらいて、なおかつ文化が画像工学と違う……。質問ともコメントとも見分けのつかない話をだらだらだらしている教授とか、ちょっぴり的外れな質問をしてくれる学生とかがいたり(多分自分もそうだと思うが、人の振りを見ていると微笑ましい)。そんな中、秀逸だったのが敵意のある表情の検出という研究(D-12-25)。敵意があるときに、ほんの10〜200msecだけ無意識に表情が変わるらしい。それを検出したいというお話。むろんカメラは高速度カメラを使います。でもって、無意識な表情なので、表情筋の一部がちょっと動くだけだろうという仮説。この仮説が素晴らしい!ただ、難しいのはGround Truthを作ること。そりゃそうだww 今後に期待!というわけです。

個別の発表に突っ込みを入れつつだらだらと感想を書いてみました。