A Fast Online Incremental Loop-Closure Detection
           for Appearance-based SLAM
        in Dynamic Crowded Environment



  Noppharit Tongprasit, Aram Kawewong, Osamu Hasegawa
                       東京工業大学
研究背景
近年,「日常生活環境」ロボットの需要が高まっている

  警備              搬送               介護




  セコム : (2005)   富士重・ツムラ (2008)   理研 : RIBA (2009)

 これらのロボットは,常に変化する(動的な)実環境下で自律
 的に行動する必要がある

  マップ
                     ロボットの環境に対する認識
                       事前に与えられることは稀
                       ロボット自身が作る必要がある
                                                     2
本日の内容

PIRF       IEICE

  PIRF-NAV1        IJRR

       PIRF-NAV2
                          3
4
従来法の問題点

• 従来手法(FAB-MAP : Oxford大)の問題点
 – 環境が大きく変化しないことを仮定
 – 辞書はバッチ学習で作成し更新できない
 – 辞書の作成には別途膨大な学習用画像が必要
                    同じ場所だが、トラックが
                    停まっていることで、画像
                    の見え方が変わり、異なる
                    場所と認識してしまう。


                    異なる場所だが、見え方が
                    極めて似ており、同じ場所と
                    認識してしまう。
                                   5
提案手法のポイント
• 環境の大きな変化への対応
 – 独自の画像特徴“Position-Invariant Robust Features
   (PIRF)”を利用
 – PRIF:移動カメラの動画像から安定した点を探索し特徴化

• 辞書は完全にオンラインで作成し更新可能
 – 事前に膨大な学習用画像を集めて長時間学習させ、辞書を
   作る必要が無い
 – 辞書はその場で与えられたデータのみから作り、更新可能
 – 重複する特徴を除外し、必要最低限の特徴のみ辞書に記録
 – 上記の結果、メモリ効率が向上し処理の高速化も実現


                                                6
• 地図上での各地点の表現に工夫
 – PIRF特徴が少ない(画像の識別の手掛かりが少
   ない)場合
 – 類似する画像が存在する(識別が困難な)場合
 – 上記のような場合は、その画像に連続する前後の
   画像も援用し、自動的にPIRF特徴を増やして画像
   を表現する。

             例えば、左図のような異なる場所で見え
             方が極めて類似する場合、この画像に連
             続する前後の画像も用い、手掛かりを増
             やして識別する。


                              7
PIRF とは?




Original Descriptors (SIFT)




Selective Descriptors (PIRF)
                                      8
PIRF: algorithm   Current image




                  過去の画像を参照し、
                  共通するSIFT特徴を
                  抽出して、その位置の
                  特徴表現とする。




                                  9
類似手法との性能比較(PIRF)
    Recognition Rate of Suzukakedai and O-okayama




                                                                    93.46%
                                                                             77.48%
100.00%
 90.00%
 80.00%

                                45.75%
 70.00%




                                             36.71%



                                                          30.22%


                                                                   Suzukakedai
                            31.08%




                                                                   O-Okayama
                   27.59%



 60.00%
          24.54%




                                         22.29%



                                                      18.23%
 50.00%
 40.00%
 30.00%
 20.00%
 10.00%
  0.00%




                                                                                      10
Even With These Strong Changes, PIRF
         Still Works Well !!!




       Highly Dynamic Changes in Scenes




        Illumination Changes in Scenes    11
PIRF-NAV1
                  我々の過去の提案手法
      PIRFを用いた VISUAL SLAM の初期のもの

                         A.KAWEWONG, ET AL,:
"ONLINE INCREMENTAL APPEARANCE-BASED SLAM
           IN HIGHLY DYNAMIC ENVIRONMENTS",
INTERNATIONAL JOURNAL OF ROBOTICS RESEARCH
                                      (IJRR)
                                           12
PIRF-NAV1(Kawewong, A. et al.,IJRR)
• Visual SLAM based on PIRF’s concept
• Characteristics
  – Online
  – Robust to dynamic scene
  – SIFT (128 dimensions) based system




                                            13
PIRF-NAV1: Algorithm
Algorithm                    Data structure



            Image features




                                              14
Results & Experiments: DATASETS
• City Centre




                                   15
Results & Experiments: DATASETS
• New College




                                   16
Result 1: City Centre
                         Vehicle Trajectory
                         Loop Closure Detection




PIRF-Nav (100% Precision) (proposed)              FAB-MAP (100% Precision)
                                                                             17
Result 2: New College
      Vehicle Trajectory
      Loop Closure Detection




PIRF-Nav (100% Precision) (proposed)     FAB-MAP (100% Precision)   18
PIRF-NAV1: City Center Result
         Precision-Recall




                                19
PIRF-NAV1:
    City Center Result(Cont.)
Computation time               Full scale result
                   Method                     PIRF-NAV 1

                            Recall                84%
                        Precision                100%
                     Total time (sec)           12057.4
                     Aver. time (ms)             9746
                       Total words               64618
                     Memory (MB)               33.4 MB

                      Unable to process in real time
                                                           20
PIRF-NAV2
      今回の提案手法

 PIRF-NAV1 の処理速度と
情報処理効率を大幅に改善




                21
PIRF-NAV2 (Tongprasit, N. et al., MIRU’10)
• Improved version of PIRF-NAV 1
• Characteristics
  –Online
  –Robust to dynamic environment
  –Real time process
  –SURF (64 dimensions) based system

                                                 22
PIRF-NAV2: Algorithm (Cont.)


Image features




                                 23
PIRF-NAV2: Modified PIRF




                    Shrink back if number of
                       features is too few

                                       24
PIRF-NAV2:
         City Center Result
                       Precision-Recall
Aerial image




                                          25
PIRF-NAV2: City Center Result(Cont.)
                   PIRF-NAV1との比較
Method                              PIRF-NAV 2

             Recall                80% (-4%)

            Precision                100%
         Total time (sec)   1086.4 (12倍高速化)

         Aver. time (ms)     878.2 (12倍高速化)

          Total words       24410 (約66%削減)

         Memory (MB)         10.9 (約66%削減)
                                                 26
混雑した環境での実験

• 本研究でPIRF-NAV1が高速化し、実用レベルで利用
  可能になったので試みた。

• 場所:食堂(東工大学食)
• 時刻:昼間(12時頃)
  – あえて、食堂が混み合う時間帯に撮影

• 約6分間の動画(692枚の画像)
• 画像サイズ:480 x 270(全方位カメラ画像)

                              27
28
混雑した環境での実験

• 認識率:86.65%(FAB-MAP:17.80%)
• 平均処理時間:264ms / 枚, Matlab(同:577ms/枚)

       入力(テスト)画像   同位置と推定された学習画像




              全方位カメラの画像のため,同位置の画像でも
              撮影時のカメラの向きによって見え方が異なります
                                        29
食堂での実験結果


提案手法




       30
食堂での実験結果




[4] A. Angeli, D. Filliat, S. Doncieux, and J. A. Meyer, “Fast and Incremental Method
for Loop-Closure Detection Using Bags of Visual Words,” IEEE Trans. Robotics, 2008,
24(5), pp. 1027–1037 (オンラインVisual SLAMだが性能面でかなり劣る。)

                                                                                 31
まとめに代えて(予告)
• PIRF-NAV2 の移動ロボットへの実装もほぼ完了。

• 混雑した学食で、全方位カメラ1本のみで、ロボットがオン
  ライン・リアルタイムに地図の作成と自己位置同定(SLAM)
  を行う。

• ロボットは、「レジから下膳口へ」といった言語による指示
  により経路探索し、移動可能(ナビゲーションも実現)。

• 日本ロボット学会学術講演会(9月、名工大)にて発表予
  定。
                                32

More Related Content

PDF
東工大 長谷川修研の環境学習・認識・探索技術
PDF
東工大長谷川修研紹介 2011 (8月1日版)
PDF
「人工脳SOINN」のご紹介
PDF
ロボットによる一般問題解決
PDF
超高速オンライン転移学習
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
PDF
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
東工大 長谷川修研の環境学習・認識・探索技術
東工大長谷川修研紹介 2011 (8月1日版)
「人工脳SOINN」のご紹介
ロボットによる一般問題解決
超高速オンライン転移学習
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~

What's hot (20)

PDF
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
PDF
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
PDF
コンピュテーショナルフォトグラフティの基礎
PDF
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
PDF
SSII2018TS: コンピュテーショナルイルミネーション
PPTX
Camera calibration
PPTX
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
PDF
コンピューテーショナルフォトグラフィ
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
PDF
シリコンスタジオによる HDR出力対応の理論と実践
PPTX
cvsaisentan20141004 kanezaki
PPTX
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
PPTX
3次元計測とフィルタリング
PDF
20160825 IEICE SIP研究会 講演
PPT
20180929 sfm learner&vid2_depth_print
PPT
CEDEC 2005 汎用的なシェーダ設計 イントロダクション
PPTX
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
PPTX
2016/4/16 名古屋CVPRML 発表資料
PPTX
LSD-SLAM:Large Scale Direct Monocular SLAM
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
コンピュテーショナルフォトグラフティの基礎
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
SSII2018TS: コンピュテーショナルイルミネーション
Camera calibration
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
コンピューテーショナルフォトグラフィ
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
シリコンスタジオによる HDR出力対応の理論と実践
cvsaisentan20141004 kanezaki
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
3次元計測とフィルタリング
20160825 IEICE SIP研究会 講演
20180929 sfm learner&vid2_depth_print
CEDEC 2005 汎用的なシェーダ設計 イントロダクション
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
2016/4/16 名古屋CVPRML 発表資料
LSD-SLAM:Large Scale Direct Monocular SLAM
Ad

Similar to PIRF-NAV2 (20)

PDF
ICCV2011 report
PDF
VIEW2013 Binarycode-based Object Recognition
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
PDF
大規模画像認識とその周辺
PDF
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
PDF
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
PPTX
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
PDF
「デザイニング・インターフェース」勉強会 - 第7章
PDF
inet-lab introduction
PDF
20110904cvsaisentan(shirasy) 3 4_3
PPT
Big data解析ビジネス
PDF
RobotPaperChallenge 2019-07
PDF
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
PPTX
RAPiD
PDF
関西CVPRML勉強会 2011.9.23
PDF
画像認識の初歩、SIFT,SURF特徴量
PPTX
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
PDF
Deep residual learning for image recognition
PDF
E-SOINN
PDF
Active Learning の基礎と最近の研究
ICCV2011 report
VIEW2013 Binarycode-based Object Recognition
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
大規模画像認識とその周辺
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
「デザイニング・インターフェース」勉強会 - 第7章
inet-lab introduction
20110904cvsaisentan(shirasy) 3 4_3
Big data解析ビジネス
RobotPaperChallenge 2019-07
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
RAPiD
関西CVPRML勉強会 2011.9.23
画像認識の初歩、SIFT,SURF特徴量
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Deep residual learning for image recognition
E-SOINN
Active Learning の基礎と最近の研究
Ad

More from SOINN Inc. (9)

PDF
PDF
Dr.Kawewong Ph.D Thesis
PDF
SSA-SOINN
PDF
Original SOINN
PDF
PhDThesis, Dr Shen Furao
PDF
SOINN PBR
PDF
SOIAM (SOINN-AM)
PDF
SOINN-AM
PDF
学生さんへのメッセージ
Dr.Kawewong Ph.D Thesis
SSA-SOINN
Original SOINN
PhDThesis, Dr Shen Furao
SOINN PBR
SOIAM (SOINN-AM)
SOINN-AM
学生さんへのメッセージ

Recently uploaded (8)

PDF
20250826_Devinで切り拓く沖縄ITの未来_AI駆動開発勉強会 沖縄支部 第2回
PDF
Yamaha DT200WR Real Enduro ENGINE CYLINDER TRANSMISSION
PDF
20250823_IoTLT_vol126_kitazaki_v1___.pdf
PDF
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual...
PDF
ココロ分解帳|感情をやさしく分解し自分と他者を理解するためのモバイルノートアプリ
PPTX
Vibe Codingを触って感じた現実について.pptx .
PDF
Geminiの出力崩壊 本レポートは、Googleの大規模言語モデル「Gemini 2.5」が、特定の画像と短文入力に対して、誤った地名を推定し、最終的に...
PPTX
Cosense - 整えずして完全勝利!Cosenseが他のwikiツールと違う理由
20250826_Devinで切り拓く沖縄ITの未来_AI駆動開発勉強会 沖縄支部 第2回
Yamaha DT200WR Real Enduro ENGINE CYLINDER TRANSMISSION
20250823_IoTLT_vol126_kitazaki_v1___.pdf
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual...
ココロ分解帳|感情をやさしく分解し自分と他者を理解するためのモバイルノートアプリ
Vibe Codingを触って感じた現実について.pptx .
Geminiの出力崩壊 本レポートは、Googleの大規模言語モデル「Gemini 2.5」が、特定の画像と短文入力に対して、誤った地名を推定し、最終的に...
Cosense - 整えずして完全勝利!Cosenseが他のwikiツールと違う理由

PIRF-NAV2

  • 1. A Fast Online Incremental Loop-Closure Detection for Appearance-based SLAM in Dynamic Crowded Environment Noppharit Tongprasit, Aram Kawewong, Osamu Hasegawa 東京工業大学
  • 2. 研究背景 近年,「日常生活環境」ロボットの需要が高まっている 警備 搬送 介護 セコム : (2005) 富士重・ツムラ (2008) 理研 : RIBA (2009) これらのロボットは,常に変化する(動的な)実環境下で自律 的に行動する必要がある マップ ロボットの環境に対する認識 事前に与えられることは稀 ロボット自身が作る必要がある 2
  • 3. 本日の内容 PIRF IEICE PIRF-NAV1 IJRR PIRF-NAV2 3
  • 4. 4
  • 5. 従来法の問題点 • 従来手法(FAB-MAP : Oxford大)の問題点 – 環境が大きく変化しないことを仮定 – 辞書はバッチ学習で作成し更新できない – 辞書の作成には別途膨大な学習用画像が必要 同じ場所だが、トラックが 停まっていることで、画像 の見え方が変わり、異なる 場所と認識してしまう。 異なる場所だが、見え方が 極めて似ており、同じ場所と 認識してしまう。 5
  • 6. 提案手法のポイント • 環境の大きな変化への対応 – 独自の画像特徴“Position-Invariant Robust Features (PIRF)”を利用 – PRIF:移動カメラの動画像から安定した点を探索し特徴化 • 辞書は完全にオンラインで作成し更新可能 – 事前に膨大な学習用画像を集めて長時間学習させ、辞書を 作る必要が無い – 辞書はその場で与えられたデータのみから作り、更新可能 – 重複する特徴を除外し、必要最低限の特徴のみ辞書に記録 – 上記の結果、メモリ効率が向上し処理の高速化も実現 6
  • 7. • 地図上での各地点の表現に工夫 – PIRF特徴が少ない(画像の識別の手掛かりが少 ない)場合 – 類似する画像が存在する(識別が困難な)場合 – 上記のような場合は、その画像に連続する前後の 画像も援用し、自動的にPIRF特徴を増やして画像 を表現する。 例えば、左図のような異なる場所で見え 方が極めて類似する場合、この画像に連 続する前後の画像も用い、手掛かりを増 やして識別する。 7
  • 8. PIRF とは? Original Descriptors (SIFT) Selective Descriptors (PIRF) 8
  • 9. PIRF: algorithm Current image 過去の画像を参照し、 共通するSIFT特徴を 抽出して、その位置の 特徴表現とする。 9
  • 10. 類似手法との性能比較(PIRF) Recognition Rate of Suzukakedai and O-okayama 93.46% 77.48% 100.00% 90.00% 80.00% 45.75% 70.00% 36.71% 30.22% Suzukakedai 31.08% O-Okayama 27.59% 60.00% 24.54% 22.29% 18.23% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 10
  • 11. Even With These Strong Changes, PIRF Still Works Well !!! Highly Dynamic Changes in Scenes Illumination Changes in Scenes 11
  • 12. PIRF-NAV1 我々の過去の提案手法 PIRFを用いた VISUAL SLAM の初期のもの A.KAWEWONG, ET AL,: "ONLINE INCREMENTAL APPEARANCE-BASED SLAM IN HIGHLY DYNAMIC ENVIRONMENTS", INTERNATIONAL JOURNAL OF ROBOTICS RESEARCH (IJRR) 12
  • 13. PIRF-NAV1(Kawewong, A. et al.,IJRR) • Visual SLAM based on PIRF’s concept • Characteristics – Online – Robust to dynamic scene – SIFT (128 dimensions) based system 13
  • 14. PIRF-NAV1: Algorithm Algorithm Data structure Image features 14
  • 15. Results & Experiments: DATASETS • City Centre 15
  • 16. Results & Experiments: DATASETS • New College 16
  • 17. Result 1: City Centre Vehicle Trajectory Loop Closure Detection PIRF-Nav (100% Precision) (proposed) FAB-MAP (100% Precision) 17
  • 18. Result 2: New College Vehicle Trajectory Loop Closure Detection PIRF-Nav (100% Precision) (proposed) FAB-MAP (100% Precision) 18
  • 19. PIRF-NAV1: City Center Result Precision-Recall 19
  • 20. PIRF-NAV1: City Center Result(Cont.) Computation time Full scale result Method PIRF-NAV 1 Recall 84% Precision 100% Total time (sec) 12057.4 Aver. time (ms) 9746 Total words 64618 Memory (MB) 33.4 MB Unable to process in real time 20
  • 21. PIRF-NAV2 今回の提案手法 PIRF-NAV1 の処理速度と 情報処理効率を大幅に改善 21
  • 22. PIRF-NAV2 (Tongprasit, N. et al., MIRU’10) • Improved version of PIRF-NAV 1 • Characteristics –Online –Robust to dynamic environment –Real time process –SURF (64 dimensions) based system 22
  • 24. PIRF-NAV2: Modified PIRF Shrink back if number of features is too few 24
  • 25. PIRF-NAV2: City Center Result Precision-Recall Aerial image 25
  • 26. PIRF-NAV2: City Center Result(Cont.) PIRF-NAV1との比較 Method PIRF-NAV 2 Recall 80% (-4%) Precision 100% Total time (sec) 1086.4 (12倍高速化) Aver. time (ms) 878.2 (12倍高速化) Total words 24410 (約66%削減) Memory (MB) 10.9 (約66%削減) 26
  • 27. 混雑した環境での実験 • 本研究でPIRF-NAV1が高速化し、実用レベルで利用 可能になったので試みた。 • 場所:食堂(東工大学食) • 時刻:昼間(12時頃) – あえて、食堂が混み合う時間帯に撮影 • 約6分間の動画(692枚の画像) • 画像サイズ:480 x 270(全方位カメラ画像) 27
  • 28. 28
  • 29. 混雑した環境での実験 • 認識率:86.65%(FAB-MAP:17.80%) • 平均処理時間:264ms / 枚, Matlab(同:577ms/枚) 入力(テスト)画像 同位置と推定された学習画像 全方位カメラの画像のため,同位置の画像でも 撮影時のカメラの向きによって見え方が異なります 29
  • 31. 食堂での実験結果 [4] A. Angeli, D. Filliat, S. Doncieux, and J. A. Meyer, “Fast and Incremental Method for Loop-Closure Detection Using Bags of Visual Words,” IEEE Trans. Robotics, 2008, 24(5), pp. 1027–1037 (オンラインVisual SLAMだが性能面でかなり劣る。) 31
  • 32. まとめに代えて(予告) • PIRF-NAV2 の移動ロボットへの実装もほぼ完了。 • 混雑した学食で、全方位カメラ1本のみで、ロボットがオン ライン・リアルタイムに地図の作成と自己位置同定(SLAM) を行う。 • ロボットは、「レジから下膳口へ」といった言語による指示 により経路探索し、移動可能(ナビゲーションも実現)。 • 日本ロボット学会学術講演会(9月、名工大)にて発表予 定。 32