<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給齊鋮湧
      發送

      0

      微分智飛高飛:我們正處于通用飛行智能爆發前夜丨GAIR 2025

      本文作者: 齊鋮湧   2025-12-31 15:55
      導語:“我們想要 answer back 黃仁勛那句「只有三種機器人可以大規模量產,人形機器人、無人機和汽車」。 ”

      過去兩年,具身智能的火熱源于一個共同期待:大語言模型的出色能力有目共睹,若將其接入機器人,有望賦予機器人更聰明的大腦,從而為行業打開新空間。 然而熱鬧兩年后,具身智能仍沒有標準答案,卻出現了很多細分領域,智能飛行機器人就是其中一個重要分支。

      浙江大學控制學院長聘副教授、博士生導師高飛,就是這個領域的一位非常優秀的年輕學者。

      高飛的主研方向包括空中機器人、自主導航、集群協同、具身智能,提出了國際首個非結構化場景下的自主飛行集群系統,發表多篇Science Robotics、TRO等頂級期刊、學術會議論文,并創立了微分智飛。

      高飛是國家優青基金獲得者,獲IEEE TRO、IROS等多項最佳論文提名,入選2023-2024全球前2%頂尖科學家、2025《麻省理工科技評論》“35歲以下科技創新35人”(MIT TR35)亞太區榜單等。

      在剛剛結束的 GAIR 2025,高飛教授在雷峰網舉辦的GAIR大會現場,做了主題為《智能飛行機器人研究進展及產業應用》的分享,他的演講風格極具畫面感:他用《普羅米修斯》的無人機編隊鏡頭引出“分布式集群”終極形態,又用《流浪地球》的混亂場景對比強調“去中心化”的重要性。

      以下是具體內容,雷峰網做了不改變原意的編輯和整理。


      01

      飛行機器人的愿景和無人機技術演進


      我是高飛,來自浙江大學,也是微分智飛的創始人。今天想和大家分享我們對智能飛行機器人這個賽道的理解,以及我們團隊正在做的事情。

      為什么要做“智能飛行機器人”?因為我們認為,通用飛行智能已經到了爆發的前夜。我小時候第一個夢想是開飛機,后來雖然沒當成飛行員,但一直沒放棄用別的方式飛上天。現在,我們想用 AI 打造聰明、安全、能自主決策的飛行平臺,讓它們在各種復雜環境中完成任務。


      大家最熟悉的飛行平臺是旋翼無人機。2015 年以前,無人機更像是高級遙控玩具,主要依賴人工操控。2015 年之后,機器人學開始給無人機賦能,逐漸出現了跟蹤避障、自主導航、集群導航等技術。下一個里程碑,我們認為就是“具身智能”。

      具身智能強調的是一個有實體的智能體,通過 AI 持續學習和信息迭代,實現對環境的理解、任務的執行,以及跨場景的泛化和通用能力。對應到地面的人形機器人,我們也希望有一個通用的飛行載體,能在天上完成各種任務。

      我博士入學時,老師給我播放了電影《普羅米修斯》的片段:一個小型智能飛行器在復雜環境中自主穿梭。老師說,有一天我們要做出這樣的無人機,這是我們團隊的愿景。

      在群體層面,我們希望打造分布式、去中心化的無人機集群——核心是讓集群能夠靈活、自適應地完成大規模任務。這一架構設計的必要性,也在電影《流浪地球》里印證:片中拔掉中心控制器后,幾千架無人機集體墜落——這就是中心化架構的缺陷。我們要做的是無需中心節點也能協同作業的分布式系統。它是很小的一個智能飛行載體,可以在復雜的環境下知道自己該往哪里去,該怎么飛,該怎么感知環境。同樣的,在群體上我們想要它具備規模化、分布式化和高靈活的特性,可以做大規模的任務,可以干很多很多的事情。


      02

      天空端具身智能的四大挑戰


      具體來說,飛行天空端的具身智能和地面端的相比有哪些獨特的挑戰?

      首先是數據很少,前面的嘉賓也一直在討論數據,大家有沒有想過無人機該怎么采集數據?

      答案是沒法采集數據,因為你不可能去雇這么多穿越機的飛手做高精度的飛行控制,幫你去采集數據。在實踐中不具備可行性:第一個是飛手專業技能的習得需要一定的門檻,第二個飛行數據采集過程易發生設備損毀或人員安全事故,導致采集成本與風險不可控。

      第二是場景復雜:無人機被造出來一定是在天上飛,在室內、室外各種各樣的地方飛,所以它的場景跨度大、環境差異顯著。所以從我們設計它的算法的時候,無論是端到端架構還是模塊化的感知方案,均需具備跨場景泛化能力,其核心是實現環境語義的抽象建模:即從差異化顯著的場景中,提煉通用化的環境表征規律,這個事情會很難。

      第三是易受干擾和零容錯,我們知道無人機的飛行需要和空氣高頻的交互,因此它很容易受到氣流的擾動,系統需具備極強的動態抗擾能力;更關鍵的是,無人機在飛行過程中零容錯,一旦發生了任何的剮蹭,會直接 墜毀;它沒有像地面機器人一樣可停駐待機,想清楚了再動作的機會。

      最后是算力很弱、傳感器很弱,它很容易受到各種擾動,也不能支持非常大的模型在端上的實時運行。

      以上這些挑戰,也是我們正在攻克的難關,我想當我們攻克了以后,它也會成為獨特的技術護城河。


      03

      我們團隊在做什么?整個業界進展什么樣?

      我會把我們的工作分為環境感知、小腦本體歸控、大腦端側決策、群體協同智能和飛行操作一體化這幾個方面。

      在歸控方面,我們要跨過傳統飛控的高 latency(高延遲)瓶頸,打破其對推力輸出與底層姿態控制的平均化、低上限約束,最終實現端到端直通電機的高動態極限飛控。

      在感知層面,我們要兼具高動態感知和復雜語義信息的融合,從而為“端側大腦”提供支持,使其具備對復雜長程任務的自主生成能力,以及在未知場景中實現泛化理解與決策的端側智能。

      在集群方面,我們追求分布式的群體協同,大家還記不記得我上一頁 PPT 里面電影《流浪地球》的片段,下一時刻發生了什么呢?他們把中心控制器給拔了,所以天上的幾千架無人機全部掉下來了,那就是不夠去中心化,不夠分布式導致的。

      最后是飛行操作,我們希望不僅可以做飛來飛去的眼睛,也可以是飛來飛去的手。

      所有做的這些目的都是為了 answer back(回應) 黃仁勛的這句話:“只有三種機器人可以大規模的量產,人形機器人、無人機和汽車。”


      04

      展開聊聊五維技術體系:從“小腦”到“群腦”

      接下來就是具體的技術分享。

      第一個是小腦技能,我們正在著力打造敏捷、輕量、多任務的本體運控小腦。

      這里重點介紹的就是我們最近在做的 sim to real (仿真到現實)端到端強化學習技術。我們的無人機可以通過搭載單顆機載攝像頭,在沒有額外的傳感器,沒有深度信號輸入的條件下,直接將視覺圖像映射成為控制指令,這個模型可以在端側跑到超過100Hz的運行頻率,確保無人機通過實時微調自身的姿態去動態適應環境,這些都是真實的場景,不是仿真。

      當然,我們的訓練會大量使用仿真合成數據,即便環境在變化,它也可以很好的從里面穿越,因為它的模型是在端側高頻運行的,所以它不斷的微調,而不是在飛之前提前看清楚環境,規劃好一條航跡,然后一次性的飛過去。我們的無人機也可以 穿越連續多個的狹窄環境,這些完全都是自主的。

      像這樣的飛行能力,我們的系統甚至可以超越人類高水平飛手水平。面對狹窄的不規則縫隙,只要經過少量的 fine tune (微調)也可以很好地適配,這里是一個在白光環境下一鏡到底的拍攝,可以看到全程無人機穩定穿越、應對自如。這一系列優化的核心目標,是確保技術完全滿足實際飛行場景的落地需求,實現全場景可靠適配。

      當然,我們后面會展示一些一腦多形的應用,可以用在地面上或者其他場景,但其中我們最看重的還是飛行,所以我們從day 1開始就要解決數據少以及算力低的問題。這里,我們做了一個長鏈路動作的人機對抗項目,我們還設計了特技飛行,讓這個無人機自主連續穿越 6 個框,在每一次穿框的最高點都要頭朝下地倒轉穿過去,所以它并不是平飛的畫圈,而是倒過來穿過去。這樣的飛行動作是很難的。

      我們請了一個高水平的飛手做對比,左邊是算法自動,右邊是飛手飛的。可以看到兩邊軌跡的質量有非常大的差異。而且,飛手在飛行之前其實已經訓練了三個小時,并不是把他拉到一個從來沒見過的環境就來做對抗,我們也充分地保證這次對抗的公平性。

      我們現在最小的端到端網絡可以跑在一個非常小的飛機上,它的總重量只有 50 克,可以用極低成本的傳感器和算力芯片支撐自己端到端的導航避障,。

      為了支撐小腦(控制層)和大腦(決策層)的數據采集和模式訓練,我們打造了一個高效可靠的自動化數據采集系統和數據合成管線。這里就是一個像素級的數字孿生仿真系統,左邊是仿真系統里渲染的圖像,右邊是真實的實拍畫面,可以看到幾乎可以達到以假亂真的效果。我們的端側感知也可以捕捉快速運動的物體,在極端的情況下可達到 1000 FPS。借助這些優異的規控和感知能力,就可以實現動態環境下的自主作業閉環,比如說動態的車載起降等。

      大腦層面,是我們團隊最近重點關注和投入的方向。

      我們認為具身智能的本質是通用和泛化。所以跨本體和跨場景一定是我們的 ultimate solution(終極解決方案),或者說是本質的追求。

      在整個具身行業內,短期內我們可能會為了落地做一些特定場景的 overfitting(過擬合),但長期核心目標還是要實現跨越本體和場景的通用能力,比如說這里看到,我們自主研發的路徑規劃的大腦,不僅可以支撐各種各樣的旋翼無人機,用在固定翼上也完全沒有問題,當然還需要做少量的適配工作。這項工作甚至可以拓展到地面的輪足機器人等不同載體上。可以看到,我們給該機器人提供走迷宮的路徑規劃技術支持。單次規劃的時間在 10 毫秒以內,而且完全通過神經網絡來直出,輸入的是地圖,輸出的是最優路徑。

      這是我們團隊最近的視覺語言三維重建基礎模型,我們的飛行機器人可以通過語言文字去下達指令,端側和邊緣側都部署著多模態大模型和基礎模型,它可以對環境有很好的認知,并且邊重建邊腦補獲得上帝視角來輔助全局規劃。

      我們會告訴它“你去做外立面的測繪,飛到建筑物內部做探索,去看一下房頂,看一下房門......”它可以把語言里承載的模糊的邏輯信息和它視覺采集到的圖像進行高效對齊,理解你在說什么,完成從 理解、推理到決策的閉環。

      比如說在一些工業場景的應用里面,我們下達“請你飛到四層樓去探索一下這棟建筑”的任務,飛行機器人就會自己飛到第四層樓,沿著樓梯找上去,然后兩邊探索完,最后因為它沒有別的路可以下來,所以會沿著路徑再返回,把環境內的關鍵信息帶回來。在任務的全過程中都是沒有 GPS、沒有人為操作的。在更復雜的環境下,我們甚至可以在礦山內部使用,這是一個非常惡劣、復雜而且事先未知的環境。那為什么要做這個呢?

      因為我們的夢想就是做出普羅米修斯那種突破智能飛行機器人:一方面把無人機越做越小,另一方面也在不斷的挑戰極端場景下的技術極限——在復雜的、沒有信號(包括衛星信號和人的通訊遙控信號)的情況下,實現極致的自主決策和自主導航。這里的核心是“智能”: 你只需要給它一個任務,它便能獨立規劃路徑、避障穿行,穩穩抵達目的地。

      此外,自主決策是說,它并沒有不知道要去哪,它要自己根據自己的任務自主生成 next best target (下一最優目標點)——這是一個復雜的決策任務,對模型的泛化能力要求非常高。否則很難實現遇到一個陌生環境就可以完成這個任務,這里的所有場景對于這個無人機來說都是第一次見。完成了任務后它會自動返航,把里面的信息帶回來。

      第四部分是集群,我們其實在單體以外一直強調分布式集群。集群不僅要追求規模化部署能力,更重要的是具備極致的靈活性與動態自適應性。從 設計之初,我們便將 “分布式協同” 作為集群技術的底層架構核心,確保系統從根源上適配多場景動態需求。

      我定下的目標就是要做一個完全分布式的架構,因為這樣是最靈活的,分布式的架構才能保證任何個體在加入或者退出時,不會影響其他個體的任務執行。就像人一樣,每個人都是在獨立感知環境,獨立地用自己的大腦做決策。但是當我們構成一個群體的時候,我們有共同的上層目標,只要沒有人使壞心往一處使,就能很好的把這個事情完成。

      這也是一個一鏡到底的 demo,10架無人機組成的集群從一側進入這個樹林,再從另一側飛出來——全過程也是沒有人干預的,且是陌生的環境,我們使用的傳感器也只有機上的 Stereo camera( 雙目視覺)、 MEMS 慣導以無源式 UWB 收發裝置(沒有部署基站,通過無人機間點對點測距實現協同定位),無任何額外輔助設備。只用了這三種傳感器,所有的計算都是在端側完成。我們現在最大規模去支撐的分布式的集群可以做到 1, 000 架以上,這里是今年年初發表的一篇 TRO,在論文里面我們呈現了1, 000 個無人機的分布式集群避障。

      當然這是一個仿真實驗,我們現在還沒有實力去做千機的真實實驗,可能未來會實現。可以看到在飛行中,每個個體都需要感知障礙物和周圍其他個體的運動,通過分布式協同決策實現自主導航與實時避障。在地圖的中心區域,大家會聚集在一起,這是一個沖突高發區域,他們會恰好躲開彼此碰撞。這項工作目前是學界考慮了無人機高階動力學的、實時的、分布式的最大規模無人機運動規劃算法框架。

      我們非常強調群體的協同性和個體主觀能動性的結合,比如這個實驗中我們讓 16 個無人機保持某種隊形。如果你牢牢保持這個隊形,前面有障礙物,是不是會撞上去?所以每個個體都需要實時的靈活決策“我現在是不是應該繞行,什么時候再回歸我的隊伍去 reform(調整)成我預先指定的隊形?”同樣的,這些環境都是未知且沒有 GPS的。

      接著說我們做的應用,比如說多機協同三維重建,這里三架無人機在大范圍環境下做協同測繪,它們可以更好地做任務調度,比如說你去測繪這里,我去測繪這里,最后在一個約定的地方做地圖的快速拼接。我們也可以做多機調運,目前我們已經開始了這方面的商業化。這里是我們的實驗演示 demo,上面的三個發光的是無人機,下面那個紅色的是一個載荷。

      這里的實驗對于實時規劃是很難的,因為我們要實時地做力的分配;要保證這幾根繩子不會纏在一起;以及沒有任何一個無人機在偷懶。這項工作剛剛被 TRO conditional 接收,應該很快就會上線。同樣我們要保證這個隊形的協同避障,可以看到在一個狹窄區域下,他們會主動地改變自己的隊形,從里面穿過去,所有的規劃都是可以實時運行的,所以你可以在飛行過程中給它下達新的指令,它們就會規劃出新的航線到達目標點。

      這里面的一個核心貢獻點是我們構建了精細化的動力學模型——考量繩子朝向、拉力大小、力矩大小等關鍵變量,不僅可以保證飛行的穩定安全,甚至會考慮下方載荷的姿態,這樣的話如果里面是液體它也不會傾覆掉。這里是個更大規模的一個 5 機的協同搬運,我們確信沒有一個個體在其中是偷懶的。傳統協同搬運中容易出現無人機在飛,但它的繩子是完全不受力的。

      最后是飛行操作,我的理想是不僅要做一個靈活的飛行的眼睛,還要做飛行手,這個是我們這項技術的 demo。

      我們把大模型部署在邊緣側,這樣就可以和人做各種各樣的交互,它可以理解你的意圖,通過語言、文字甚至動作,來理解你要干什么,幫你拿飲料、拿可樂等等。我們可以看到它是怎么工作的:它其實就是一個手型的無人機,一個欠驅動機械手的構型,它可以通過單電機的神驅裝置讓自己本體發生形變,具備人手的指尖捏取或者掌心抓握的兩種不同的動作模態,因為人的手有很強的包裹性,所以可以抓各種不同的東西。當然這個東西做不了地面操作類機器人的精細操作,因為它自由度很低,只有中間、前后和旋轉的形變這幾個自由度,但是它可以很好地做到“抓了就跑”這個動作。

      比如在戶外我們就可以用它做一些物品的快速投遞,我們正在研發這個樣機,希望在有朝一日我可以坐在辦公室里用它去幫我下樓取咖啡。

      這里其實很多地方都很難,但是可能大家感知不到,比如說可以看到它在抓一個東西之前和抓東西之后飛得都很穩,其實這個非常困難,做過無人機的同學可能知道,別說抓東西了,只要產生了形變,無人機的轉動慣量、質量、各種物理參數都會變化,保持平穩飛行就會很難,更何況它的載荷還在發生很大的波動。此外,我們也可以把它當做人手的空間延伸,借助 第一人稱視角眼鏡和單手遙控,給它下達簡易的指令。我們會做端側的輔助駕駛去修正控制指令,最后幫助完成任務,把東西抓下來。

      以上就是我們的技術進展,我們正在把飛行具身的三腦:大腦、小腦和群腦,做多個方向的技術落地,包括泛測繪-巡檢,去代替人工進入復雜惡劣的場景采集信息;去做特種安防,提供自主作業支撐;去做車用級的飛行 agent,滿足移動平臺協同需求;此外也可以做通用開放的二次開發平臺。

      以上就是我今天報告的內容,謝謝大家(雷峰網(公眾號:雷峰網)


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      微分智飛高飛:我們正處于通用飛行智能爆發前夜丨GAIR 2025

      分享:
      相關文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 久久精品国产久精国产| 亚洲成色www久久网站| 日韩av无码精品人妻系列| 欧美日韩国产综合在线| 中国丰满少妇人妻xxx性董鑫洁| 中文字幕A片免费观看| 亚洲一页在线| 欧美人与动zozo在线播放| 日本午夜久久一区二区| 国产又色又爽又刺激在线播放| 久久国产精品一国产精品| 久久久久国产一区二区| 成人精诚精品| 久久人妻无码AⅤ毛片评价| 亚洲av成人一区二区三区| 亚洲一区二区经典在线播放| 亚洲中文字幕日产无码成人片| 99久久精品一区二区国产| 久艹视频免费看| 色婷婷婷婷| 忘忧草社区在线www| 国产VA网站| 日韩精品人妻系列无码| 密臀av| 女人夜夜春高潮爽a∨片传媒| 色8久久人人97超碰香蕉987| 最近中文字幕2019在线看| 一区二区三区国产| 精品国产精品久久一区| 精品国内自产拍在线观看视频| 金山区| 少妇精品导航| 91瑟瑟| 99噜噜噜在线播放| 久久亚洲视频| 亚洲国精产品一二二线| 日本亚洲国产| 日本人妻中文| wwwjizzjizz| 亚洲资源在线视频| 中文字幕日韩精品有码|