0
| 本文作者: 王強 | 2015-04-10 10:02 | 專題:成為世界最快,中國超算經歷了什么? |
美國封鎖對華超級計算機關鍵技術出口的消息,讓超算這個詞匯又成了媒體關注的焦點。
雖然國產超算“天河2號”已經數度奪得全球性能冠軍,但是為之自豪的網民還很少對“超級計算機”這個概念有比較深入的了解。本文將先為大家介紹超級計算機相關的背景知識,而續篇則會探討美國技術封鎖政策對我國超算發展的影響。
什么是超算?
超級計算機,又稱高性能計算,英文名High Performance Computing,簡稱超算/HPC。HPC是為了解決工業界對大規模計算能力的需求而誕生的技術,現代超算本質上是將大量配置接近普通家用電腦/商用工作站的主機通過高速網絡連接起來的主機集群。它運行的是專用操作系統,每臺主機是一個運算節點;大量節點的運算能力疊加起來,就獲得了遠超單臺或幾臺普通PC的計算能力。
超算的技術特點
經常在超算相關的新聞下面看到這樣的評論:“這么強,跑xxx游戲卡不卡?”普通消費者對“運算速度”的概念通常就是玩一些大型游戲有多少幀率、畫面細節能達到什么檔次。有趣的是,超算執行的任務與3D游戲有不少相似之處。
計算機世界中,“計算”可以分為整數和浮點計算兩大類。8X4是整數運算,而1.5912/0.4就是浮點計算。我們常見的大多數程序都是以整數計算為主,輔之以少量浮點部分;但3D游戲、圖像渲染、視頻特效這類工作則會大量應用浮點代碼。
在科學和工程領域常見的計算任務都是偏浮點化的:典型如大氣模擬、材料應力計算、蛋白質分子模擬、地質模型分析等。這些領域中整數運算所占的比例較小,與我們常見的PC程序有較大差異。
浮點運算任務的一大特點是很容易高度并行化。簡單來說就是一段計算可以拆分給許許多多的計算核心來完成,不像整數計算那樣很多時候只能分給少量幾個核心。另外,密集浮點程序可以大量使用高級浮點指令—例如AVX、FMA等來明顯提升運算速度。相比之下一般消費者使用的程序往往只能用到老舊的SSE、SSE2,不太容易從新指令中獲得加速效果。
因為上述特點,高性能計算領域的應用可以很容易地從CPU的浮點運算能力改進中得益。下圖是Intel幾代Xeon CPU的理論浮點性能對比,可以看出受益于高級指令的增加,每代新品的性能都提升1倍以上;我們普通消費者很難感受到這么大幅度的進步,但科學和工程計算程序就獲益匪淺。

偏重浮點性能、可以大規模并行化的特點使科學計算應用很適合跑在GPU上。GPU可以看作是有很多小核心的一種CPU,犧牲整數性能和單核心性能換來整塊芯片超強的浮點性能。CPU和GPU聯合執行科學計算的方式被稱為異構計算,最近幾年異構計算開始逐漸在業界推廣。
除了執行運算的CPU、GPU核心,超算的另外兩大關鍵技術是內存和互聯網絡。高性能計算任務通常需要大量的內存,而且所需的空間隨計算核心數量的增多而增加;此外,這些內存還要有很高的帶寬來迅速將數據傳遞給處理器核心。互聯網絡則是將成千上萬的主機搭建成超算系統的關鍵,主機數量越多,對網絡的帶寬、延遲和穩定性要求就越高。
超算技術發展現狀
從前面的介紹我們可以知道,超算需要的是浮點性能很強、內存帶寬和容量很高的計算芯片,以及高性能的大規模互聯網絡。高性能芯片的技術被四大巨頭壟斷:Intel、IBM、Nvidia和AMD。其中,Intel和IBM一方面生產CPU,另一方面研制出了類似GPU的超多核心芯片。例如Intel的新一代Xeon Phi處理器就是將數十顆特別加強了浮點性能的Atom核心集成到一起,配上帶寬達到數百GB/s的3D封裝內存制造而成的。一顆新版Xeon Phi的性能達到每秒2萬億次浮點運算,相當于最快的Xeon CPU的3倍。Nvidia和AMD則在自家GPU的基礎上生產專用計算卡Tesla和FirePro,其浮點性能也達到2-3萬億次每秒的水平。

由于制造技術與成本的限制,Tesla和Xeon Phi這樣的芯片的內存不能做到很大容量,無法執行那些需要龐大內存空間的代碼,這也限制了這類芯片的普及率。但由于這些芯片的性能相比一般CPU有明顯優勢,且幾大企業都在努力解決內存空間的問題,未來它們會是業界的主流選擇。Intel希望自己的Xeon Phi在未來能一統天下;Nvidia與IBM合作,將推出Power CPU+Tesla 計算卡的異構解決方案;AMD則力推自家的HSA異構方案,希望Opteron CPU+FirePro計算卡的組合能占據一席之地。目前來看Intel的優勢比較大,而Nvidia/IBM的聯盟也能拿下一定的份額。
互聯網絡方面的技術不像計算芯片那樣高度壟斷。目前有不少企業都在提供超算網絡解決方案,我國在這方面也具備世界一流水平。最先進的超算網絡可以讓數萬計算節點以高達100Gbps的帶寬通信,同時保證穩定性和低延時。
超算對國家的意義
一如前文所述,超算技術主要是服務工業和科學研究的。強大的計算能力對企業、學校和國防研究都有很大的幫助,甚至可以說是不可或缺的。當年美國宣布終止核試驗,其底氣就是超算模擬核試驗技術已經足夠成熟。由于投入巨大、回報周期較長,各國的超算項目主要由政府實施或資助。如今,超算技術和資源水平已經成為一國科研實力的重要指標之一。
中國的超算技術近年來發展迅速,曙光、天河前后多次登上全球超算性能排行榜冠軍。如今美國宣布對華超算技術禁運,無疑是感到了中國在這一領域的威脅。那么美國的禁運政策將對中國有什么影響呢?請看下一篇文章的具體分析。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。