0
| 本文作者: 隔壁王大喵 | 編輯:郭奕欣 | 2017-05-25 20:40 | 專題:ICRA 2017:創新、創業和解決方法 |
雷鋒網AI科技評論按:ICRA全稱為“IEEE International Conference on Robotics and Automation”(機器人與自動化會議),是機器人技術領域最有影響力的國際學術會議之一。ICRA 2017于5月29日至6月4日舉行,雷鋒網AI科技評論將從新加坡帶來一線報道。該會議舉辦期間,雷鋒網將圍繞會議議程及獲獎論文展開系列專題報道,敬請期待。

論文作者:Schmidt, Tanner; Newcombe, Richard; Fox, Dieter
作者主頁:http://homes.cs.washington.edu/~tws10/
相關機構:華盛頓大學
論文摘要:
圖像像素間對應關系的魯棒性估計是機器人技術中一個重要的問題。它被應用于對象、環境和其它代理的跟蹤、映射與識別任務中。對應評估(Correspondence estimation)長期以來都是屬于手工特征工程的領域。但是,最近深度學習技術為從原始數據中學習特征的任務提供了強大的工具。不過深度學習的缺點就是需要大量的(通常需要帶有標簽)訓練數據來支持訓練學習過程。據雷鋒網了解,該論文提出了一種學習密集圖像對應任務(Dense image correspondences)的新方法,其中研究員們利用強大的3D生成模型來實現程序自動標記視頻數據中的對應關系。論文中使用了對比損失來訓練完全卷積神經網絡,以生成視點和照明不變的特征。
作為一個概念證明,研究員收集了兩個數據集:第一個數據集描繪了一個人在各種各樣的環境當中,但是視頻的主體始終是這個人的上身與頭部;第二個則描繪了許多天內的同一間辦公室,而不同時間內辦公室物體擺放方式不同。據悉,該數據集專注于重新訪問相同的對象和環境,并且論文也表明了,僅通過本地跟蹤數據(Local tracking data)訓練CNN,所學習到的視覺描述符能夠分辨出無標簽視頻間的對應關系。
論文鏈接:https://ieeexplore.ieee.org/document/7762851/
論文作者:Garcia Cifuentes, Cristina; Issac, Jan; Wüthrich, Manuel; Schaal, Stefan; Bohg, Jeannette
作者主頁:http://am.is.tue.mpg.de/people/ccifuentes
相關機構:德國斯圖加特的研究所
論文摘要:
據雷鋒網了解,該論文提出了一種概率濾波方法(Probabilistic filtering method),它將聯合測量(Joint measurements)與深度圖像(Depth images)融合,以產生相機框架中末端執行器姿態(End-effector pose)的準確且實時的估計。在組合使用框架與視覺對象跟蹤的時候,這樣做可以避免框架轉換。另外本文中通過對聯合測量中的偏差進行建模和校正,以及機器人模型中的不準確性(比如較差的外置相機校準)來提高精度。

該論文的研究員通過基于坐標粒子濾波器(Coordinate Particle Filter)的異步深度圖像更新和聯合測量的卡爾曼濾波器(Kalman filtering)的原則組合,使得算法在計算效率上更加高效。該論文還在一個自主構建的數據集上定量評估算法,該數據集采集自一個真實的機器人平臺,并且通過運動捕捉系統標注了真實數據(Ground truth)。實驗還表明了,即使在諸如快速運動(Fast motion)、顯著和長期閉塞(Significant and long-term occlusions)以及時變偏差等(Time-varying biases)挑戰性條件下,該算法也具有穩健性和準確性。另外,為了方便其它研究員進行定量比較,該論文作者還將數據集和算法代碼開放了出來。
論文鏈接:https://arxiv.org/abs/1610.04871
論文作者:Byravan, Arunkumar; Fox, Dieter
作者主頁:http://homes.cs.washington.edu/~barun/
相關機構:華盛頓大學
論文摘要:
據雷鋒網了解,該論文介紹了SE3-Nets算法,這是一個旨在從原始點云數據中建模和學習剛體運動的深度神經網絡。據悉,SE3-Nets僅僅依靠伴隨著動作向量的深度圖像(Depth images)序列和點數據關聯(Point wise data associations),就能學會分割受影響對象并且預測出它們由于所施加的外力而導致的運動。SE3-Nets并不是直接學習點流向量(Point wise flow vectors),而是預測場景中不同部分的SE(3)變換。

通過使用桌面場景的模擬深度數據和機器人操縱器,研究員們證明了,相比于傳統的基于流的網絡,SE3-Nets的結構使得它能夠在對象運動預測的任務中產生更加一致的預測結果。另外研究員還進行了其它的實驗,該額外的實驗內容是,使用深度攝像機觀察一個Baxter機器人在桌面上推動物體,并且實驗表明SE3-Nets在真實數據中也能取得很好的效果。
論文鏈接:https://arxiv.org/abs/1606.02378
論文作者:Paul, Mrinal Kanti; Wu, Kejian; Hesch, Joel A.; Nerurkar, Esha; Stergios Roumeliotis
作者主頁:http://www-users.cs.umn.edu/~paulx152/
相關機構:明尼蘇達大學
論文摘要:
本論文提出了一種可應用于Square-root inverse領域的“滑動窗口雙攝像機視覺輔助慣性導航系統(Sliding-window two-camera vision-aided inertial navigation system, VINS)”。據雷鋒網了解,研究員們在兩種情形下評估了該系統的系性能。這兩種情形分別是在兩個攝像機圖像之間的特征匹配被處理和兩個攝像機圖像間的特征匹配沒有任何立體約束(比如,立體圖像與雙目的比較)。

據悉,為了更好地分析實驗結果,該論文還提出了從雙目轉換為立體圖像時信息增益(Information gain)的理論分析方法。另外,論文中還評估了在單眼VINS上使用雙攝像機(立體圖像和雙目)系統的優點。除此之外,論文也嘗試量化了不同圖像處理前端(Image-processing frontends)和估計器設計選擇(Estimator design choices)對最終實現精度的影響。最后,論文還在各種場景和運動曲線下,全面評估了算法的處理需求(即要求在移動處理器上達到實時的效果),同時也提供了與其它算法的準確性比較。
論文鏈接:http://mars.cs.umn.edu/research/stereo_vins.php
Via ICRA 2017
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。