ICME 2013

中山です。

今週は、サンノゼで開催されているICME (IEEE International Conference on Multimedia & Expo) という会議へ参加しています。ICMEは、マルチメディアの分野ではメジャーな会議の一つです。前回この会議に参加したのは2009年だったので4年ぶりとなります。2009年までは採択率が50%近い間口の広い会議だったのですが、2010年から大幅にリニューアルされ、採択率30%程度へと難化しました。
リニューアル後に参加するのは初めてでしたが、以前より全体的なクオリティは確かに向上しているように思いました
*1

(本会議初日のkeynoteIntelのhaswellの話でした。)


マルチメディアの研究分野では、コンテンツ解析や符号化、音楽音声処理、バーチャルリアリティなど多岐にわたりますが、アプリケーションに重点を置いている点が特徴です。特にこの会議では、Multimedia & Expo という名前が示す通り、常設でデモブースが設置されており、実演を楽しむことができます。今回もいろいろとインスピレーションを得ることができました。やはり理論だけで終わるのではなく、このように目に見える形まで完成度を高めることが大切だなあと改めて感じました。

今回私が発表したのは、fine-grained visual categorization と呼ばれる、非常に細かい画像のクラス分類を行う*2問題を扱った手法で、隣接局所特徴の共起情報を次元圧縮してbag-of-wordsへ用いるものです。少し体調を崩していたこともあり、発表に関しては反省点が多いのですが、座長の先生にはご興味持って頂けたようで、コードがあれば欲しいと言って頂きました。こういうチャンスのためにも、発表前にはしっかりしたコードを公開できるようにしておきたいものです。



以下、気になった発表を少しだけ紹介。

MINING VISUALNESS
Zheng Xu, Xin-Jing Wang, Chang Wen Chen
今回のbest student paper。グラフベースのクラスタリングを行い、視覚的な意味概念と対応単語を自動的にマイニングしますが、どの程度視覚化可能か(visualnes)を定義し、評価します。面白く、大事な話だと思いますが、一方でこの手の話題は昔から定期的に出てきています。例えば、電通大の柳井先生がエントロピーを使って同じ話をやられているのですが、定量的な比較はなかったように思います。

TOWARDS REAL-TIME MUSIC AUTO-TAGGING USING SPARSE FEATURES
Yi-Hsuan Yang
スパースコーディングの辞書作成における徹底的な調査を行い、音楽のジャンル識別の精度向上・高速化を行いました。音楽識別は専門外ですが、技術的な内容は参考になります。

DIRECT MINING CO-OCCURRENCE FEATURES FOR VISUAL RECOGNITION: A BRANCH AND BOUND METHOD
Chaoqun Weng, Yuning Jiang, Junsong Yuan
Visual wordの共起パターン(AND,OR)からdiscriminativeなものをAdaboostで選択。学習コストが多少気になりますが、15 scene datasetの識別正解率が91%とかなり高い精度を達成しています。

A LARGE IN-SITU DATASET FOR CONTEXT-AWARE MUSIC RECOMMENDATION ON SMARTPHONES
Yuan-Ching Teng, Ying-Shu Kuo, Yi-Hsuan Yang
実生活におけるスマートフォンのさまざまなセンサ情報を集め、コンテクストアウェアに音楽推薦を行うもの。実験室内ではなく、実生活でのデータを収集している点でかなり好感が持てます。データセットは現状では公開されていませんが、著者に聞いてみるとフルペーパーを出した後公開することを考えているそうです。

VISUALLY SIGNIFICANT QR CODES: IMAGE BLENDING AND STATISTICAL ANALYSIS
Zachi Baharav, Ramakrishna Kakarala
今回のbest poster。QRコードは情報を載せる有用なツールですが、人間にとっては見ただけでは意味解釈ができないことが問題の一つです。この研究ではイメージブレンディングの手法を用い、元のQRコードの誤り訂正能力を低下させることなく、会社のロゴ等の画像をある程度コード内に埋め込むことができています。個人的にかなり面白いと思いました。




(初日のレセプション会場。サンノゼは気持ちのよい気候でした。)

*1:前回参加した2009年は豚インフルエンザの影響で、開催地がメキシコのカンクンからニューヨークへ突然変更になり、ビザが間に合わない人が大量に出てno showだらけになった年でした。これも、リニューアルへ踏み切るきっかけになったそうです。

*2:数百種類の植物の種類識別を行うなど