0
“這也太難了吧。”比賽之前,主辦方采訪正在備賽的選手,幾乎每一個人都叫苦連天。
就連比賽的講解員、香港中文大學(xué)竇琪教授,比賽直播一開場也給大家打了一劑預(yù)防針:“這場比賽的四個賽題,瞄準(zhǔn)的都是具身智能領(lǐng)域難以攻克的難題。”
難,就難在考題都太真實了。
別的機(jī)器人賽跑都在公路上,這場比賽機(jī)器人直接去越野了,而且場地還是在香港中文大學(xué)嶺南校區(qū)的一個小徑上。這里路面狹窄,左右只有一米,而且山間小道,路面濕滑,極影響機(jī)器人與地面之間的摩擦力,還有坡度不定帶來的平衡問題,以及樹葉遮擋帶來的光線變化等等,不管是雙足機(jī)器人還是四足機(jī)器人,如果它們能開口的話,肯定會直接說,我不走了。

垃圾分揀題目里面,機(jī)器人面對的三個物體,香蕉模型的難點是柔軟難抓取,塑料瓶的難點是透明不容易識別,紙盒的難點是不受力易形變,哪一個都不是省油的燈。

至于另一邊的澆花題目,不僅要澆在白色的花上才得分,而且機(jī)器人的手拿水壺遠(yuǎn)沒有人類那么方便,一開始就被教授們認(rèn)為是最難的題目。還有吊橋題目,一不小心就會陷入橋板縫隙中,動彈不得。
這么難的題目,到底是誰設(shè)計的?
ATEC 科技精英賽,主打“真實世界極限挑戰(zhàn)”,看到這個主題,大家馬上就知道這是一場什么比賽了。
ATEC 比賽的兩大特點是,聚焦前沿技術(shù)、模擬真實場景,從2020年開始,每屆賽題都基于一個具有社會價值的真實命題,如野生動物保護(hù)、反欺詐、助力實體產(chǎn)業(yè)數(shù)字化、幫助老年人就醫(yī)等。
而本屆賽事面對的真實命題就是:具身智能如何走向真實世界。賽事主席劉云輝院士在比賽前就提出了判斷標(biāo)準(zhǔn):機(jī)器人要具備行走、操作、改造環(huán)境三種核心能力,才能被認(rèn)為真正具備在真實世界中立足的適應(yīng)力。
ATEC2025 正是劉云輝院士所提理念的一次系統(tǒng)性工程實踐,通過全戶外、非結(jié)構(gòu)化的極限環(huán)境,對機(jī)器人“感知-決策-執(zhí)行”全鏈路自主能力的一次高標(biāo)準(zhǔn)壓力測試。
要回答“為什么難”這個問題,我們要先搞清楚,這個比賽究竟難在哪里。
雷峰網(wǎng)觀察到,機(jī)器人賽事歷經(jīng)多年發(fā)展,不少賽事已形成清晰的技術(shù)路徑與穩(wěn)定的呈現(xiàn)模式,這源于其命題設(shè)計邏輯的連續(xù)性,主要體現(xiàn)在三個方面:
第一,場地較穩(wěn)定。絕大多數(shù)比賽場地都在室內(nèi),室內(nèi)是相對穩(wěn)定的環(huán)境,基本不用考慮風(fēng)速、日照、溫度等自然條件,參數(shù)也可以預(yù)先設(shè)置,不需要隨機(jī)應(yīng)變。
第二,聚焦單一能力。很多比賽參考了運動會的比賽方式,只考驗機(jī)器人的某一項“特長”,如跑步、跳遠(yuǎn)、避障等,這樣就便于量化得分,使比賽結(jié)果更直觀。
第三,區(qū)分度不明顯。一般的比賽很少將全自主作為考察重點,比賽選手只需要考慮遙操作這條單一賽道,難以區(qū)分不同機(jī)器人的“智能”程度。
如此看來,ATEC難的原因就找到了。首先他們把場地放在了室外,室外的參數(shù)會不斷變化,從而讓機(jī)器人的判斷受到干擾。以垃圾分揀項目為例,機(jī)器人分揀垃圾必須使用視覺方案,但視覺方案在強光下容易識別失效,無法正確判斷垃圾的位置。
在越野項目中的山道場地上,所有的落葉、流水、泥土,甚至爛泥坑,賽事組都沒有任何處理和改動,就連旁邊的溝渠,都保持了原樣,甚至于有的選手機(jī)器人能夠連續(xù)掉坑里三次。什么叫作真實?山林野道就是真實。
其次,比賽考察的不是單一能力,而是多種能力組成的功能,或者說是一種任務(wù)鏈。比如澆花就是一個任務(wù)鏈,機(jī)器人要先“感知”花和水壺的位置,以及花的顏色;再通過靈巧手精準(zhǔn)“抓取”水壺把手;然后“行走”到花旁邊,一邊澆花一邊移動;澆花過程中還需要“控制”水壺傾斜的角度以應(yīng)對水位變化,水壺作為操作終端也會增加控制難度。

更重要的是,比賽非常鼓勵全自主。從賽制細(xì)則可以看到,用遙操作完成任務(wù)只能拿到基礎(chǔ)分,想要沖刺高分必須用全自主。在這種激勵機(jī)制下,wongtsai、IRMV、CyberPrime、RIL4RobotAI等賽隊均在比賽中嘗試了全自主,展現(xiàn)出知難而進(jìn)的探索精神。
所以,ATEC難就難在更復(fù)雜、更非標(biāo)、更多不確定因素,這是以往的比賽選手不曾遇到的。萬一選手都失敗了怎么辦?甚至在比賽前劉云輝院士就下定了決心:“不管你完成得好不好,完成得有多快,只要完成比賽就是非常重要的里程碑。”
回到剛才的問題,為什么賽組委要把這屆ATEC的題目設(shè)置得這么難?
其實,稍微了解一下ATEC就能知道,歷屆ATEC都倡導(dǎo)“真實命題”,無論是第一屆的“野生動物保護(hù)”,第二屆的“科技反欺詐”還是第三屆的“科技助實”,都面向真實世界存在的問題,給出真正的解決方案。
今年雖然趕上了具身智能大熱,ATEC也選擇了這個方向,但依然堅持了自己的理念,在具身智能領(lǐng)域?qū)ふ摇罢鎸嵜}”。所以題目難的原因,是具身智能在真實世界確實面臨許許多多尚未解決的問題,這是“智能”的本質(zhì)決定的。
什么是智能?智能產(chǎn)生的標(biāo)志之一,就是與環(huán)境進(jìn)行交互,這里有兩個關(guān)鍵詞——“環(huán)境”和“交互”。
環(huán)境,就是真實場景。為什么大家看到機(jī)器人會疊個衣服就覺得很厲害?因為它進(jìn)入了真實場景,進(jìn)入了我們生活的環(huán)境。只不過,這種場景太小了,并不具備泛化性,可能換個地方機(jī)器人就不會干了。
所以,機(jī)器要更強的泛化性,就要走到更廣闊的環(huán)境,走到自然的場景。這就是為什么今年的ATEC要強調(diào)“真實世界”,把賽場設(shè)置在烈日之下、吊橋之上、山林之間。

交互,就是主動與世界互動,適應(yīng)所處的環(huán)境,實現(xiàn)交互就需要自主決策的能力。目前我們能看到大多數(shù)表演的機(jī)器人,背后都有人在遠(yuǎn)程操縱,“具身”有余而“智能”不足。
所以,今年ATEC從賽制上鼓勵全自主,凡是不需要人操縱、能自己完成任務(wù)的機(jī)器人都能拿高分。只有主動適應(yīng)真實的世界、處理通用性的問題才能叫智能,才有新的價值。
這也是為什么賽事主席劉云輝教授要把“行走、操作、改造環(huán)境”三種能力定為ATEC的命題標(biāo)準(zhǔn)。他曾提到:“如果機(jī)器人未來有一天能代替人做一些人不適合做的工作,必須具備這三種能力,最終我還是希望具身智能跟我們的需求,跟實際應(yīng)用結(jié)合起來。”
ATEC前沿科技探索社區(qū)秘書長宋寵在現(xiàn)場演講中也表達(dá)了類似的意思:“ATEC匯聚了來自學(xué)界、產(chǎn)業(yè)界,以及一批愿意在這里花時間的年輕人,在這里對真實問題展開對話、給出自己的答案。”
若想真正稱得上“智能”,機(jī)器人必然要從封閉空間走向開放世界,從機(jī)械執(zhí)行走向社會參與。
我們需要的,不是實驗室產(chǎn)出的幾篇論文和技術(shù)報告,也不是炫酷的demo視頻,更不是某些展覽、幾場表演。如果具身智能永遠(yuǎn)停留在實驗室,它所面對的,只是一種“經(jīng)過消毒的世界”;在這種環(huán)境下成長出來的能力,解決不了真實問題。
未來的具身智能,絕對不可能是困在實驗室的具身智能,也不可能僅僅做一些流水線式、被設(shè)計好的動作,更不可能只針對實驗室環(huán)境去做場景適配。
“實驗室環(huán)境”是高度可控的環(huán)境:燈光恒定、地面平整、場景布置有預(yù)案,所有變量盡量可預(yù)測、可重復(fù)。
這種環(huán)境非常適合做算法驗證、傳感器標(biāo)定和安全性測試,但并不等同于真實世界的復(fù)雜性。
以機(jī)器人走貓步舉例,先不說有沒有合適的實用化場景,如果燈光強度改變,地面平整度、傾斜度改變,現(xiàn)場的障礙物分布改變,可能整個演示效果就完全不同了。
高難度的動作,突破機(jī)械極限的行為,并不是智能的關(guān)鍵。但無論是現(xiàn)在的機(jī)器人公開報道,還是公眾認(rèn)知,都在強調(diào)這些動作有多難。這樣的敘事方式容易把“機(jī)械性能”和“智能水平”混為一談,用視覺沖擊力很強的極限動作,去代表所謂的“技術(shù)突破”。
這就導(dǎo)致了,行業(yè)的關(guān)注點很大程度上仍停留在“硬件層面”:看到的更多是外形、關(guān)節(jié)數(shù)量、傳感器配置、負(fù)載能力等,評價的往往也是“這個機(jī)器人本體有多強”。在這樣的框架下,容易忽略真正決定機(jī)器人“聰明程度”的那一部分——算法與控制策略。
因此,ATEC比賽刻意做了一個重要設(shè)計:統(tǒng)一硬件平臺。也就是說,大家不再通過堆料、改造本體來拉開差距,而是在同樣的機(jī)器人基礎(chǔ)上,比拼誰的算法更高效、更魯棒、更有創(chuàng)造性,比賽的焦點自然就轉(zhuǎn)向“誰的控制與決策方案更通用、更優(yōu)雅”。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))認(rèn)為,這種賽制的目的,就是要引導(dǎo)參賽者跳出具體型號、具體場景的限制,去思考:什么樣的運動控制與決策框架,能夠在不同任務(wù)、不同環(huán)境下復(fù)用?它也在告訴整個行業(yè),我們要做的,是探索具有通用性的機(jī)器人運動控制解決方案,而不僅僅是為單次比賽“調(diào)參刷分”的工程實現(xiàn)。
的確,人工智能早已重塑數(shù)字世界的運行規(guī)則,但要深度參與社會生活改造、延伸人類觸達(dá)極限,必須跨越虛擬與現(xiàn)實的鴻溝。具身智能正是這一使命的核心載體,它讓AI擺脫屏幕的束縛,用感官感知周圍環(huán)境,用雙手改造物理世界,在真實場景中創(chuàng)造價值。
當(dāng)機(jī)器人不再是實驗室里的展品,而是能主動適應(yīng)復(fù)雜環(huán)境、解決實際問題的參與者,才真正擁有了“生命感”,這便是智能賦予機(jī)器人的終極意義。
回過頭看,ATEC通過引入真實世界的復(fù)雜變量,建立了一種考察機(jī)器人“智能”的量化標(biāo)準(zhǔn)。因此經(jīng)過ATEC 這場比賽我們才發(fā)現(xiàn),過去我們對機(jī)器人的能力并沒有一個明確的評估框架,不清楚什么樣的任務(wù)適合交給機(jī)器人完成,也不清楚在什么樣的環(huán)境和條件下,機(jī)器人才能穩(wěn)定、可靠地發(fā)揮作用。
正是這種認(rèn)知上的模糊,讓這場比賽變得格外有意義——它通過一場極限壓力測試告訴大家:能走過山地、完成澆花的機(jī)器人,其技術(shù)深度和系統(tǒng)可靠性,一定程度上優(yōu)于在平整地面完成無數(shù)花式動作的機(jī)器人。這正是在“撇清泡沫”,為“機(jī)器人真正進(jìn)入人類世界”這一終極目標(biāo),建立可信、可衡量、以應(yīng)用為導(dǎo)向的里程碑。
“你不可能在毫無準(zhǔn)備的情況下,就把機(jī)器人投入到真實世界中。挑戰(zhàn),失敗,把失敗當(dāng)作下一個階段的基礎(chǔ),然后繼續(xù)嘗試,這是一個必須經(jīng)歷的過程,而這樣的比賽正是實現(xiàn)這一目標(biāo)過程中非常重要的一部分。”美國國家工程院院士、比賽專家組成員Masayoshi Tomizuka 這句話,說出了我們最深的共識。
連接數(shù)字與物理世界,延伸人類的觸達(dá)極限,具身智能顯而易見將會是未來十年的真命題。接下來的幾年時間內(nèi),ATEC的比賽將在全自主的基礎(chǔ)上,進(jìn)一步加強線上與線下場景的聯(lián)動,每年在難度上提升一個level,著重考察機(jī)器人的泛化能力,讓機(jī)器人的通用性再上一個臺階,離真實世界更近一步。
通過真實世界的比賽所建立的評估標(biāo)準(zhǔn),我們就能清楚我們的“驚艷”應(yīng)該留給哪些真正強大的機(jī)器人。這正是ATEC的意義所在:它并非為了展示已有的技術(shù)成就,而是以真實世界為標(biāo)尺,丈量出機(jī)器人與真正“智能”的距離,讓每一步突破都朝著“機(jī)器人真正邁進(jìn)人類社會”的終極目標(biāo)前行。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。