BMVC 2013 (一日目)

中山です。

British Machine Vision Conference (BMVC)という会議で発表するために、イギリスのブリストルに来ています。
BMVCに参加するのは二回目で、前回は2010年でした。博士論文を完成させる重要な部分を発表した会議だったので思い出に残っています。

(Bristol University, Wills Memorial Building)

BMVCは英国ローカルの国際会議で長い歴史がありますが、最近は欧州を中心に世界各国から投稿が集まるようになっており、レベルが急速に向上しています。今回は、採択論文のうち86%が英国外からの投稿だったそうです。コンピュータビジョンのトップ会議といえばCVPR・ICCV・ECCVの御三家ですが、これに次ぐ準トップとしては頭一つ抜けた位置にあると思います。世界的に有名な研究室からもメジャーな発表の場とみなされているので、精力的に投稿があり、大変勉強になります。同時に、先の3つのトップ会議ではあまり見られないような、独自色の強いテーマ・アプローチや荒削りな内容もけっこう採択されているので、単にトップ会議のコピーにはなっていない点がいいところです。

今回は439本の投稿があり、採択率は30%だったようです。発表数は例年120〜130本くらいで、これくらいの規模だとポスター含め見たいものを全部しっかり見て回れるのも有難いです。査読は年々厳しくなる傾向にあるものの、CVPRなどに比べればまだかなり間口が広く、狙いやすいのではないかと思います。

初日の今日は、deep learningとsubmodularityのチュートリアルがありました。どちらも最前線で活躍している方なので非常に楽しみにしていました。


Deep Learning for Machine Vision by Adam Coates (Stanford)
Adam Coates氏はスタンフォードのAndrew Ng先生のところでPh.Dを取得し、現在ポスドクをされています。この分野の最前線で活躍されている方で、今年はGPUで実装した大規模ネットワークが話題になりました。
最近のdeep learningと、1980年代にブームになったニューラルネットワークは何が違うのか、という点はしばしば指摘されますが、結局のところ(1)データが増えた・計算機が高速化した、(2)初期化や最適化の方法が進歩した、という2点に集約されます。機械学習の手法開発の立場としては後者が仕事になり、現在もいろいろな試行錯誤が行われている状況のようです。さまざまなパラメータのチューニングやノウハウが必要で、やはりまだ誰もがすぐ使えるような技術として確立されるには時間がかかりそうです。ただ、最近の研究は、使いやすいものを目指すというよりは細かなノウハウを突き詰める方向に進んでおり、やや本質から外れつつあるような印象を受けるのが気になります。

Submodularity in Machine Learning and Vision by Andreas Krause (ETH Zurich)
連続値の最適化問題では凸性が重要な性質となるように、離散最適化問題では劣モジュラ性とよばれる性質が鍵になります。目的関数に劣モジュラ性があれば、多項式時間で最適化を行うことができ、実用性の高いアルゴリズムが実現可能になります。このチュートリアルでは、劣モジュラ性の定義からいくつかの簡単な例を通し、具体的な実例に至るまで丁寧に解説をしていました。理論研究の最前線はそう簡単に手が出ないような気がしましたが、離散最適化問題はビジョンの分野でも頻出するので、道具としては使いこなせるようにならないと困りそうです。
http://submodularity.org/ というページにチュートリアルやソフトウェアなど、いろいろな材料が公開されています。