BMVC 2013 (三・四日目)

こんにちは。本日のお昼すぎに、無事日本へ帰国しました。
BMVCは今回もよくまとまったよい会議でした。チャンスがあれば来年はぜひ学生に通して欲しいところですね。ちなみに、来年はノッティンガムで開催されるそうです。


ブリストル名物のつり橋)

引き続き、三日目と四日目の研究をまとめて紹介します。

The Complete Rank Transform: A Tool for Accurate and Morphologically Invariant Matching of Structures
Oliver Demetz, David Hafner, Joachim Weickert
LBPの記述において、中心点を基準として周囲の点を二値化するだけでなく、相対的なランクを保存することで性能向上。今回の会議ではこの他にもLBP関連の発表が多かったです。

Unsupervised Object Discovery and Segmentation in Videos
Samuel Schulter, Christian Leistner, Peter Roth, Horst Bischof
動画像から自動的に物体クラスを発見し、セグメンテーションまで行います。挑戦的なタスクで面白いですが、オプティカルフローの大きさで動物体を検出しているのでカメラのエゴモーションに弱かったり、物体数はパラメータとして与えなければならない、などの課題もあります。

Unsupervised (parameter) learning for MRFs on bipartite graphs
Boris Flach, Tomas Sixta
観測される変数(ノード)と隠れ変数が二部グラフの形式で結ばれたMRFのパラメータを推定。これ自体が新しいわけではないですが、疑似尤度に基づくEMアルゴリズムによる新しい推定方法を提案しており、従来手法より早く収束し安定であると主張しています。
MRFにはあまり詳しくありませんが、このようなモデルは使いどころが多そうな気がします。

Parsing Clothes in Unrestricted Images
Nataraj Jammalamadaka, Ayush Minocha, Digvijay Singh, CV Jawahar
自由背景、オクルージョンありの一般画像から人物の服を部位ごとに認識し、セグメンテーションします。Poseletという手法で人体部位の認識を行った後、CRFを用います。

Dense, Auto-Calibrating Visual Odometry from a Downward-Looking Camera
Jacek Zienkiewicz, Robert Lukierski, Andrew Davison
移動ロボットのオドメトリを、下向きに備え付けられ床を映すカメラだけから推定します。画像全体の位置合わせに基づく非常にシンプルな方法ですが、カメラを十分床に近づけておくとけっこううまくいくようです。

Depth really Matters: Improving Visual Salient Region Detection with Depth
Karthik Desingh, Madhava Krishna, Deepu Rajan, CV Jawahar
Depth情報を加えたRGBD-saliencyを提案。2Dのsaliency mapよりだいぶ性能がよいとのことですが、実験は明らかに差が出やすそうなものばかりだったような気がします。
ちなみに、今回の会議ではRGBDを用いたsaliencyネタでもう一件発表がありました。

Oriented pooling for dense and non-dense rotation-invariant features
Wan-Lei Zhao, Guillaume Gravier, Herve Jegou
VLADの改良版であるCVLAD(Covariant-VLAD)を提案。プーリングの際、visual wordに加え局所特徴のスケール・オリエンテーション量子化して用いる。局所特徴レベルでスケール・オリエンテーションの情報を捨てず、大域的に用いることでdense featureの識別能力も生かせ賢い方法だと思いますが、量子化のビン数が増えるので画像当たりの局所特徴数が不足しないかが気になるところです。
ちなみに、この方とはポスター発表の際となり合わせだったのですが、だいぶ客が流れて行ってしまいました。やはりVLAD人気ですね。。

Learning Smooth Pooling Regions for Visual Recognition
Mateusz Malinowski, Mario Fritz
物体認識のパイプラインにおいて、局所特徴の記述方法が精力的に研究されてきた一方、プーリングの方は平均値プーリング、最大値プーリングなどが経験的に使われるだけで十分に検証されてきませんでした。 この研究では、プーリングの重みパラメータを学習させることで、ベースラインに比べて大きく識別精度が向上できることを示しています。