Google 日本語入力を支える情報処理技術

東大で行われている情報処理学会の全国大会にちょろっと参加してきた.学生は学会費を払っていれば無料なので行けばいいのに.私の研究分野はどうも情報処理学会になじまないことが分かってきたので,ここ数年は投稿していないけど.というわけで,今回は発表なしのお気軽参加.

お目当てはGoogle日本語入力を開発した工藤拓さんの講演.内容については

などを見てもらえばOK.だいたい話の内容は一緒です.

とはいえ,自分で言ってみると着目点が違うわけで,差分のみ紹介.

IPC(プロセス間通信)で,キー入力や変換結果をやり取りしているとのこと.これって,ネットワークレイテンシーとかが生じる可能性のあるUn*x系では現実的ではないと思うので,今だからとれる戦略だろうなと思う.それと,そもそもプロセス間通信のコストがどれぐらいなのか気になる.

辞書を実行ファイルに埋め込むという話の感想.なかなか合理的だなと思ったんだが,ユーザーが自由に辞書を差し替えることが出来ないわけで,その分柔軟性が低下しているとも言える.機械でも壊れたらモジュールごと交換というのに近い感じがして,なんだが残念な気分になった.部品単位で見ればほとんど壊れていないのに丸ごと交換みないな感じ.でもまぁソフトウェアなので通信コストさえ許せば良い方法かも.

機械翻訳の研究者を募集していた.職種はResearch Scientistとのこと.Engineerじゃないんだ,というところでちょっと新鮮.自分は技術者になるのか,科学者になるのか.後者にあこがれはあるけど,多分前者だろうな.

最後にGoogleブースを覗いてみたら,共同研究を募集していた.フルタイムの大学教員向けに1万から15万ドル支給されるらしい.詳しくは,http://research.google.com/university/relations/research_awards.html 昨年の採択率は1/3程度で,2割のプロジェクトはアメリカ国外から採択されたのこと.

[追記] 4秒ごとにプロセスをkillする例のデモ.話の流れ的に驚けという方がムリだと思う.

というのも,IMEとしてロードされるDLLはstatelessです,と明言している.そのあとにユーザが入力中にconverterのプロセスがkillされても違和感なく入力が出来るデモになる.説明をちゃんと理解していると,statelessのはずなのになんか違うわけで驚きよりも違和感が先に来る.その後,PlayBack機能の説明が入り種明かしとなる.

短時間のプレゼンだと,PlayBackまで思いつく人は少ないと推測される.ここはPlayBackと再起動したconverterプロレスがきちんと連動していることをデモすれば驚きになると思う.まぁ,この順序ならどよめきが起こる保証はないけど,事前に知っていた自分でもスルーしてしまったぐらいなので…….