0
過去很長一段時間里,氣候、天氣和地球系統研究,幾乎完全建立在數值模擬之上。超算負責把物理方程一層層算下去,模型的精度、分辨率和穩定性,決定了人類對自然系統能“看清”多少。
而近幾年,隨著算力條件的變化,人工智能開始被不斷引入這些傳統領域。尤其是在氣候和地球系統建模中,AI 被寄予厚望:它是否能補足數值模型難以覆蓋的細節?是否能在有限算力下,把系統看得更細一點?這些問題,正在成為超算與科學計算領域繞不開的討論。
地球系統模型正是其中最具代表性的場景之一。從全球環流到局地天氣,從海洋到大氣,從公里尺度到更細微的變化,模型需要處理的過程極其復雜,也幾乎不可能被完全窮盡。正因為如此,關于 AI 應該如何進入地球系統建模,學界和工程界始終保持著謹慎甚至分歧的態度。
在 GAIR 2025 大會上,圍繞人工智能與科學計算的關系,相關討論再次被集中提及。付昊桓教授在大會期間做了相關分享,結合地球系統模型與超算實踐,討論了數值模擬與 AI 之間的邊界與可能性。
作為清華大學深圳國際研究生院教授、國家超級計算深圳中心副主任,他長期同時參與超算平臺建設和地學計算研究,也因此更關注這些方法在現實體系中“能不能用、該怎么用”。
在GAIR 2025 現場,AI科技評論與付昊桓教授圍繞數值計算與AI 的融合、地球系統模型的復雜性,以及AI 在預報體系中的真實位置進行了深入交流,相關內容AI 科技評論做了不改變原意的編輯整理:
AI 科技評論:您現在在超算這邊,最核心想做的事情到底是什么?
付昊桓:其實如果從一個比較抽象的層面來總結,我們現在最核心想推動的一件事,就是數值計算和人工智能的深度融合。
地球系統只是一個比較典型、也比較容易被大家理解的例子,但并不是唯一的應用場景。類似的問題,其實在很多科學計算領域都會遇到,比如機器人、生物醫藥、材料科學等等。只不過地球系統的復雜性、尺度跨度和社會影響都非常突出,所以它經常被拿出來討論。
我們并不是說要單獨把 AI 拿出來做一個“更聰明的模型”,也不是簡單地去提升某一個模型的精度,而是希望從根本上去思考:在科學計算這樣一個長期以數值模擬為核心的方法體系中,AI 到底應該以什么樣的方式介入,才能真正提升我們理解和預測復雜系統的能力。
AI 科技評論:那為什么地球系統會被您反復作為一個核心例子?
付昊桓:因為地球系統本身,幾乎把科學計算中最難的幾個問題都集中在了一起。首先,它是一個典型的混沌系統。我們常說的蝴蝶效應,本質上講的是系統對初始條件的高度敏感性。哪怕是一個非常微小的擾動,在經過足夠長的時間和足夠復雜的相互作用之后,都可能對整體狀態產生顯著影響。
其次,它是一個極端多尺度的系統。比如說,臺風這種現象,可能發生在數百公里到千公里的尺度上;而強對流降水則發生在公里尺度;龍卷風則是十米到百米尺度;再往下,還有更微觀的過程,發生在米級甚至更小的尺度上。
更重要的是,這些不同尺度的過程,并不是彼此獨立的,而是相互耦合、彼此影響的。你不能只算大尺度而忽略小尺度,也不能只盯著局部而不看整體。正是這種“所有尺度連在一起”的特性,使得地球系統成為一個非常典型、但也極其困難的研究對象。
AI 科技評論:那在這種情況下,有沒有可能去做一個真正意義上的數字孿生?
付昊桓:從現實角度來看,這是基本不可能的。很多人會設想,未來算力如果足夠強,是不是就可以把所有細節都模擬出來。但實際上,問題并不只是算力的問題,而是尺度本身是沒有下限的。
你可以說,未來是不是可以模擬一只蝴蝶?那我會反問:樹葉里的水分是怎么蒸發的?云中的水汽是如何凝結成水滴的?水滴在不同微環境中是如何增長、碰并并最終下落的?
這些過程發生在越來越小的尺度上,而且每一個尺度都會引入新的物理機制。你永遠不可能把所有尺度都納入一個完全精確的數值模型中。所以從一開始,我們就必須承認:地球系統是一個無法被完全窮盡計算的復雜系統。
AI 科技評論:在這種前提下,數值模擬的意義在哪里?
付昊桓:數值模擬的意義,恰恰在于它是我們目前唯一一套系統性地、基于物理規律去理解世界的工具。我常用一個比喻來解釋數值模擬和 AI 之間的關系:數值模擬是骨骼,AI 是肌肉。
骨骼代表的是我們已經理解得比較清楚的那部分自然規律,比如守恒定律、動力學方程、熱力學關系等。這些東西是有明確物理意義的,是可解釋、可追溯的。
而肌肉這一側,指的是那些我們目前很難用嚴格物理模型去描述、或者算力根本支撐不了的部分。這些地方,AI 可能可以發揮更大的作用。
AI 科技評論:能不能用一個更具體的例子來說明這種分工?
付昊桓:比如說臺風預報。當臺風從海上向陸地移動時,在百米甚至公里尺度上,它的整體動力結構是可以用傳統數值模型來刻畫的。但當臺風進入城市環境之后,問題就變得非常復雜。
你想知道某一條街道上,風會怎么走?某一個小區里,降雨會如何分布?這些已經進入了十米、甚至一米尺度,而傳統數值模型在這個尺度上不僅算力不夠,物理參數化本身也變得非常困難。
在這種情況下,如果完全依賴數值模擬,成本是無法承受的。但如果完全依賴 AI,又會失去物理約束。所以一個更現實、也更有前景的方向,是讓 AI 在這些“肌肉層面”去補充數值模型,而不是取代它。
所以我們最終希望看到的,不是數值模型一套、AI 模型一套,而是它們能夠形成一個緊耦合的混合模型。我經常用“齒輪”這個比喻,希望這兩個齒輪能夠真正咬合在一起,一起轉,而不是各轉各的。
AI 科技評論:那在數據如此稀疏的情況下,AI 能發揮什么作用?
付昊桓:AI 非常擅長做的一件事情是:在不完整的數據條件下,給出一個合理的推斷。也就是說,你給它一些稀疏的觀測點,它可以在空間和時間上進行補全,給出一個 best guess。
這種能力,在地球系統這樣觀測受限的領域里,確實非常有價值。但前提依然是:它必須和數值模型結合使用。雷峰網
AI 科技評論:那目前這些模型成果,是如何被氣象部門實際采納和使用的?
付昊桓:現在的天氣預報,本身就是一個高度工程化的混合體系。以華南地區為例,目前常用的是大約一公里分辨率的網格模型。在這個尺度上,動力方程是可以直接計算的;而網格內部無法解析的微物理過程,則通過統計參數化方案來處理。
同時,還會引入多組初始條件、多種模型配置,進行集合預報。最終給出的,并不是單一結果,而是一種帶有概率意義的預報結論。在這樣的體系下,目前 7 天預報是可以實現的,其中 3 到 5 天相對比較可靠。
AI 科技評論:AI 的引入,在這個體系中具體帶來了哪些變化?
付昊桓:從目前的測試結果來看,AI 確實在一些方面帶來了提升。比如,它可以利用更多類型的數據,提升某些變量的預報精度;在部分場景下,也確實可以延長可預報時間的長度。但與此同時,問題也非常明顯。
首先,AI 對極端天氣的預測能力仍然不足。極端事件本身在數據中出現得就不多,而 AI 往往更擅長學習“常態”。
其次,AI 的輸出結果往往偏平滑,這在視覺上可能看起來“合理”,但會掩蓋一些真正重要的極端特征。
第三,它是一個黑盒。對于一線預報員來說,當模型給出一個結果時,他們很難像使用傳統數值模型那樣,追溯每一步計算的物理原因。
此外,傳統數值模型天然包含不確定性評估機制,而 AI 原生并不具備這一能力。這在實際業務中,是一個非常關鍵的差異。
AI 科技評論:所以您認為,數值模擬依然是不可替代的?
付昊桓:是的,我認為數值模擬一定是整個體系的 backbone。它承載的是人類已經理解的物理規律,是可解釋、可驗證的。AI 的角色,不是推翻這一體系,而是在這個基礎上去補充、去增強,甚至在長期發展中,幫助我們逐步“打開黑盒”。
AI 科技評論:現在越來越多科技公司進入氣象和氣候領域,您怎么看?
付昊桓:這個賽道確實開始變得非常“卷”。但從另一個角度看,這也說明大家普遍認為,這個領域未來還有很大的突破空間。氣象和氣候并不是一個“已經被解決的問題”,相反,它仍然存在大量基礎性的挑戰。
AI 科技評論:氣象和氣候的商業價值主要體現在哪里?
付昊桓:我覺得至少體現在三個方面。第一,是季節尺度預報的金融屬性。如果你能提前知道某一年、某一季的大致氣候情況,會直接影響農業產量、大宗商品價格等。
第二,是能源系統。風電、光伏之所以難以穩定利用,很大程度上是因為它們的不確定性。如果預報更準,能源調度和成本控制都會發生根本性的變化。
第三,是碳達峰和碳中和。地球系統模型能力的提升,會對整個上下游產業鏈產生深遠影響。
AI 科技評論:算力和模型規模的不斷擴張,真的帶來了科學價值嗎?雷峰網(公眾號:雷峰網)
付昊桓:從歷史上看,每一輪重大技術變革在初期階段,往往都會伴隨著某種形式的泡沫。這并非偶然,而是技術潛力、資本預期與現實落地之間動態博弈的結果。互聯網的發展過程在一定程度上已經呈現過類似情形。但泡沫過后,一定會留下真正有價值的能力。從長期來看,AI 很可能會像計算機一樣,逐步進入所有行業,并在這個過程中,改變我們解決問題的方式。
AI 科技評論:現在學界越來越強調交叉學科,您怎么看?
付昊桓:我覺得這并不是一個新趨勢,而是科學本身的屬性。學科是成熟知識的沉淀,而真正的新發現,往往發生在學科交叉的地方。
AI 科技評論:未來三年,您個人最期待哪方面的突破?
付昊桓:我個人最期待的是3 到 6 個月尺度的預報能力突破。這是目前天氣預報和氣候預測之間的一個灰區,也是現實中非常重要、但目前還難以解決的問題。
AI 科技評論:最后,您想給準備進入這個領域的年輕人什么建議?
付昊桓:最重要的一點,是先想清楚:你為什么要做科研。如果沒有內驅力,科研會變成一種消耗。我更希望年輕人是主動享受這個過程,而不是被環境推著走。
講座完整視頻,詳見鏈接:https://youtu.be/dw4tRbvoENY
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。