走向真實世界的機(jī)器人，離真正的「智能」又近了一步

本文作者：高景輝

2025-12-25 14:23

導(dǎo)語：唯有智能，才能讓機(jī)器人活過來

“這也太難了吧。”比賽之前，主辦方采訪正在備賽的選手，幾乎每一個人都叫苦連天。

就連比賽的講解員、香港中文大學(xué)竇琪教授，比賽直播一開場也給大家打了一劑預(yù)防針：“這場比賽的四個賽題，瞄準(zhǔn)的都是具身智能領(lǐng)域難以攻克的難題。”

難，就難在考題都太真實了。

別的機(jī)器人賽跑都在公路上，這場比賽機(jī)器人直接去越野了，而且場地還是在香港中文大學(xué)嶺南校區(qū)的一個小徑上。這里路面狹窄，左右只有一米，而且山間小道，路面濕滑，極影響機(jī)器人與地面之間的摩擦力，還有坡度不定帶來的平衡問題，以及樹葉遮擋帶來的光線變化等等，不管是雙足機(jī)器人還是四足機(jī)器人，如果它們能開口的話，肯定會直接說，我不走了。

走向真實世界的機(jī)器人，離真正的「智能」又近了一步

垃圾分揀題目里面，機(jī)器人面對的三個物體，香蕉模型的難點是柔軟難抓取，塑料瓶的難點是透明不容易識別，紙盒的難點是不受力易形變，哪一個都不是省油的燈。

走向真實世界的機(jī)器人，離真正的「智能」又近了一步

至于另一邊的澆花題目，不僅要澆在白色的花上才得分，而且機(jī)器人的手拿水壺遠(yuǎn)沒有人類那么方便，一開始就被教授們認(rèn)為是最難的題目。還有吊橋題目，一不小心就會陷入橋板縫隙中，動彈不得。

這么難的題目，到底是誰設(shè)計的？

ATEC，來自真實世界的極限挑戰(zhàn)

ATEC 科技精英賽，主打“真實世界極限挑戰(zhàn)”，看到這個主題，大家馬上就知道這是一場什么比賽了。

ATEC 比賽的兩大特點是，聚焦前沿技術(shù)、模擬真實場景，從2020年開始，每屆賽題都基于一個具有社會價值的真實命題，如野生動物保護(hù)、反欺詐、助力實體產(chǎn)業(yè)數(shù)字化、幫助老年人就醫(yī)等。

而本屆賽事面對的真實命題就是：具身智能如何走向真實世界。賽事主席劉云輝院士在比賽前就提出了判斷標(biāo)準(zhǔn)：機(jī)器人要具備行走、操作、改造環(huán)境三種核心能力，才能被認(rèn)為真正具備在真實世界中立足的適應(yīng)力。

ATEC2025 正是劉云輝院士所提理念的一次系統(tǒng)性工程實踐，通過全戶外、非結(jié)構(gòu)化的極限環(huán)境，對機(jī)器人“感知-決策-執(zhí)行”全鏈路自主能力的一次高標(biāo)準(zhǔn)壓力測試。

要回答“為什么難”這個問題，我們要先搞清楚，這個比賽究竟難在哪里。

雷峰網(wǎng)觀察到，機(jī)器人賽事歷經(jīng)多年發(fā)展，不少賽事已形成清晰的技術(shù)路徑與穩(wěn)定的呈現(xiàn)模式，這源于其命題設(shè)計邏輯的連續(xù)性，主要體現(xiàn)在三個方面：

第一，場地較穩(wěn)定。絕大多數(shù)比賽場地都在室內(nèi)，室內(nèi)是相對穩(wěn)定的環(huán)境，基本不用考慮風(fēng)速、日照、溫度等自然條件，參數(shù)也可以預(yù)先設(shè)置，不需要隨機(jī)應(yīng)變。

第二，聚焦單一能力。很多比賽參考了運動會的比賽方式，只考驗機(jī)器人的某一項“特長”，如跑步、跳遠(yuǎn)、避障等，這樣就便于量化得分，使比賽結(jié)果更直觀。

第三，區(qū)分度不明顯。一般的比賽很少將全自主作為考察重點，比賽選手只需要考慮遙操作這條單一賽道，難以區(qū)分不同機(jī)器人的“智能”程度。

如此看來，ATEC難的原因就找到了。首先他們把場地放在了室外，室外的參數(shù)會不斷變化，從而讓機(jī)器人的判斷受到干擾。以垃圾分揀項目為例，機(jī)器人分揀垃圾必須使用視覺方案，但視覺方案在強光下容易識別失效，無法正確判斷垃圾的位置。

在越野項目中的山道場地上，所有的落葉、流水、泥土，甚至爛泥坑，賽事組都沒有任何處理和改動，就連旁邊的溝渠，都保持了原樣，甚至于有的選手機(jī)器人能夠連續(xù)掉坑里三次。什么叫作真實？山林野道就是真實。

其次，比賽考察的不是單一能力，而是多種能力組成的功能，或者說是一種任務(wù)鏈。比如澆花就是一個任務(wù)鏈，機(jī)器人要先“感知”花和水壺的位置，以及花的顏色；再通過靈巧手精準(zhǔn)“抓取”水壺把手；然后“行走”到花旁邊，一邊澆花一邊移動；澆花過程中還需要“控制”水壺傾斜的角度以應(yīng)對水位變化，水壺作為操作終端也會增加控制難度。

走向真實世界的機(jī)器人，離真正的「智能」又近了一步

更重要的是，比賽非常鼓勵全自主。從賽制細(xì)則可以看到，用遙操作完成任務(wù)只能拿到基礎(chǔ)分，想要沖刺高分必須用全自主。在這種激勵機(jī)制下，wongtsai、IRMV、CyberPrime、RIL4RobotAI等賽隊均在比賽中嘗試了全自主，展現(xiàn)出知難而進(jìn)的探索精神。

所以，ATEC難就難在更復(fù)雜、更非標(biāo)、更多不確定因素，這是以往的比賽選手不曾遇到的。萬一選手都失敗了怎么辦？甚至在比賽前劉云輝院士就下定了決心：“不管你完成得好不好，完成得有多快，只要完成比賽就是非常重要的里程碑。”

難就對了！真實世界就是充滿難題

回到剛才的問題，為什么賽組委要把這屆ATEC的題目設(shè)置得這么難？

其實，稍微了解一下ATEC就能知道，歷屆ATEC都倡導(dǎo)“真實命題”，無論是第一屆的“野生動物保護(hù)”，第二屆的“科技反欺詐”還是第三屆的“科技助實”，都面向真實世界存在的問題，給出真正的解決方案。

今年雖然趕上了具身智能大熱，ATEC也選擇了這個方向，但依然堅持了自己的理念，在具身智能領(lǐng)域?qū)ふ摇罢鎸嵜}”。所以題目難的原因，是具身智能在真實世界確實面臨許許多多尚未解決的問題，這是“智能”的本質(zhì)決定的。

什么是智能？智能產(chǎn)生的標(biāo)志之一，就是與環(huán)境進(jìn)行交互，這里有兩個關(guān)鍵詞——“環(huán)境”和“交互”。

環(huán)境，就是真實場景。為什么大家看到機(jī)器人會疊個衣服就覺得很厲害？因為它進(jìn)入了真實場景，進(jìn)入了我們生活的環(huán)境。只不過，這種場景太小了，并不具備泛化性，可能換個地方機(jī)器人就不會干了。

所以，機(jī)器要更強的泛化性，就要走到更廣闊的環(huán)境，走到自然的場景。這就是為什么今年的ATEC要強調(diào)“真實世界”，把賽場設(shè)置在烈日之下、吊橋之上、山林之間。

走向真實世界的機(jī)器人，離真正的「智能」又近了一步

交互，就是主動與世界互動，適應(yīng)所處的環(huán)境，實現(xiàn)交互就需要自主決策的能力。目前我們能看到大多數(shù)表演的機(jī)器人，背后都有人在遠(yuǎn)程操縱，“具身”有余而“智能”不足。

所以，今年ATEC從賽制上鼓勵全自主，凡是不需要人操縱、能自己完成任務(wù)的機(jī)器人都能拿高分。只有主動適應(yīng)真實的世界、處理通用性的問題才能叫智能，才有新的價值。

這也是為什么賽事主席劉云輝教授要把“行走、操作、改造環(huán)境”三種能力定為ATEC的命題標(biāo)準(zhǔn)。他曾提到：“如果機(jī)器人未來有一天能代替人做一些人不適合做的工作，必須具備這三種能力，最終我還是希望具身智能跟我們的需求，跟實際應(yīng)用結(jié)合起來。”

ATEC前沿科技探索社區(qū)秘書長宋寵在現(xiàn)場演講中也表達(dá)了類似的意思：“ATEC匯聚了來自學(xué)界、產(chǎn)業(yè)界，以及一批愿意在這里花時間的年輕人，在這里對真實問題展開對話、給出自己的答案。”

唯有智能，才能讓機(jī)器人活過來

若想真正稱得上“智能”，機(jī)器人必然要從封閉空間走向開放世界，從機(jī)械執(zhí)行走向社會參與。

我們需要的，不是實驗室產(chǎn)出的幾篇論文和技術(shù)報告，也不是炫酷的demo視頻，更不是某些展覽、幾場表演。如果具身智能永遠(yuǎn)停留在實驗室，它所面對的，只是一種“經(jīng)過消毒的世界”；在這種環(huán)境下成長出來的能力，解決不了真實問題。

未來的具身智能，絕對不可能是困在實驗室的具身智能，也不可能僅僅做一些流水線式、被設(shè)計好的動作，更不可能只針對實驗室環(huán)境去做場景適配。

“實驗室環(huán)境”是高度可控的環(huán)境：燈光恒定、地面平整、場景布置有預(yù)案，所有變量盡量可預(yù)測、可重復(fù)。

這種環(huán)境非常適合做算法驗證、傳感器標(biāo)定和安全性測試，但并不等同于真實世界的復(fù)雜性。

以機(jī)器人走貓步舉例，先不說有沒有合適的實用化場景，如果燈光強度改變，地面平整度、傾斜度改變，現(xiàn)場的障礙物分布改變，可能整個演示效果就完全不同了。

高難度的動作，突破機(jī)械極限的行為，并不是智能的關(guān)鍵。但無論是現(xiàn)在的機(jī)器人公開報道，還是公眾認(rèn)知，都在強調(diào)這些動作有多難。這樣的敘事方式容易把“機(jī)械性能”和“智能水平”混為一談，用視覺沖擊力很強的極限動作，去代表所謂的“技術(shù)突破”。

這就導(dǎo)致了，行業(yè)的關(guān)注點很大程度上仍停留在“硬件層面”：看到的更多是外形、關(guān)節(jié)數(shù)量、傳感器配置、負(fù)載能力等，評價的往往也是“這個機(jī)器人本體有多強”。在這樣的框架下，容易忽略真正決定機(jī)器人“聰明程度”的那一部分——算法與控制策略。

因此，ATEC比賽刻意做了一個重要設(shè)計：統(tǒng)一硬件平臺。也就是說，大家不再通過堆料、改造本體來拉開差距，而是在同樣的機(jī)器人基礎(chǔ)上，比拼誰的算法更高效、更魯棒、更有創(chuàng)造性，比賽的焦點自然就轉(zhuǎn)向“誰的控制與決策方案更通用、更優(yōu)雅”。

走向真實世界的機(jī)器人，離真正的「智能」又近了一步

雷峰網(wǎng)(公眾號：雷峰網(wǎng))認(rèn)為，這種賽制的目的，就是要引導(dǎo)參賽者跳出具體型號、具體場景的限制，去思考：什么樣的運動控制與決策框架，能夠在不同任務(wù)、不同環(huán)境下復(fù)用？它也在告訴整個行業(yè)，我們要做的，是探索具有通用性的機(jī)器人運動控制解決方案，而不僅僅是為單次比賽“調(diào)參刷分”的工程實現(xiàn)。

的確，人工智能早已重塑數(shù)字世界的運行規(guī)則，但要深度參與社會生活改造、延伸人類觸達(dá)極限，必須跨越虛擬與現(xiàn)實的鴻溝。具身智能正是這一使命的核心載體，它讓AI擺脫屏幕的束縛，用感官感知周圍環(huán)境，用雙手改造物理世界，在真實場景中創(chuàng)造價值。

當(dāng)機(jī)器人不再是實驗室里的展品，而是能主動適應(yīng)復(fù)雜環(huán)境、解決實際問題的參與者，才真正擁有了“生命感”，這便是智能賦予機(jī)器人的終極意義。

結(jié)語

回過頭看，ATEC通過引入真實世界的復(fù)雜變量，建立了一種考察機(jī)器人“智能”的量化標(biāo)準(zhǔn)。因此經(jīng)過ATEC 這場比賽我們才發(fā)現(xiàn)，過去我們對機(jī)器人的能力并沒有一個明確的評估框架，不清楚什么樣的任務(wù)適合交給機(jī)器人完成，也不清楚在什么樣的環(huán)境和條件下，機(jī)器人才能穩(wěn)定、可靠地發(fā)揮作用。

正是這種認(rèn)知上的模糊，讓這場比賽變得格外有意義——它通過一場極限壓力測試告訴大家：能走過山地、完成澆花的機(jī)器人，其技術(shù)深度和系統(tǒng)可靠性，一定程度上優(yōu)于在平整地面完成無數(shù)花式動作的機(jī)器人。這正是在“撇清泡沫”，為“機(jī)器人真正進(jìn)入人類世界”這一終極目標(biāo)，建立可信、可衡量、以應(yīng)用為導(dǎo)向的里程碑。

“你不可能在毫無準(zhǔn)備的情況下，就把機(jī)器人投入到真實世界中。挑戰(zhàn)，失敗，把失敗當(dāng)作下一個階段的基礎(chǔ)，然后繼續(xù)嘗試，這是一個必須經(jīng)歷的過程，而這樣的比賽正是實現(xiàn)這一目標(biāo)過程中非常重要的一部分。”美國國家工程院院士、比賽專家組成員Masayoshi Tomizuka 這句話，說出了我們最深的共識。

連接數(shù)字與物理世界，延伸人類的觸達(dá)極限，具身智能顯而易見將會是未來十年的真命題。接下來的幾年時間內(nèi)，ATEC的比賽將在全自主的基礎(chǔ)上，進(jìn)一步加強線上與線下場景的聯(lián)動，每年在難度上提升一個level，著重考察機(jī)器人的泛化能力，讓機(jī)器人的通用性再上一個臺階，離真實世界更近一步。

通過真實世界的比賽所建立的評估標(biāo)準(zhǔn)，我們就能清楚我們的“驚艷”應(yīng)該留給哪些真正強大的機(jī)器人。這正是ATEC的意義所在：它并非為了展示已有的技術(shù)成就，而是以真實世界為標(biāo)尺，丈量出機(jī)器人與真正“智能”的距離，讓每一步突破都朝著“機(jī)器人真正邁進(jìn)人類社會”的終極目標(biāo)前行。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

高景輝

編輯

發(fā)私信

當(dāng)月熱門文章