
作者 | 王曄
11月15日至11月17日,SC21國際大學生超級計算機競賽在圣路易斯舉辦。清華大學計算機系新一屆超算團隊再次摘得總冠軍。這也是清華繼SC18、SC19、SC20后拿下的四連冠!總分排行榜中,清華排名第一,上科大次之,南科大第三。同時,南科大獲LINPACK基準測試最高性能獎。克萊姆森大學(Clemson University)
佐治亞理工學院(Georgia Institute of Technology)
波士頓大學、波士頓學院、麻省大學羅維爾校區聯隊(Boston Univ., Boston College, Univ. of Mass. Lowell)
北京大學(Peking University )
上海科技大學(ShanghaiTech University )
南方科技大學(Southern University of Science and Technology )
加利福尼亞大學圣迭戈分校(University of California, San Diego)
維克森林大學(Wake Forest University)
暨南大學(Jinan University)
清華大學(Tsinghua University)
全球超級計算大會(Supercomputing Conference,簡稱SC)是國際超算領域的頂級會議,國際影響力巨大。國際大學生超級計算機競賽(SCC)成立于 2007 年,是超級計算機領域的頂級賽事,今年是舉辦該競賽的第15個年頭。受新冠疫情影響,此次比賽與去年一樣線上進行,可遠程參與。作為Students@SC計劃的一部分,SCC旨在將學生引入高性能計算社區,推動世界各地區超算青年人才交流和培養,提升超算應用水平和研發能力。比賽吸引了來自世界各國家和地區的眾多高校參與,與ASC超算競賽和ISC超算競賽并列為世界最具權威性的三大國際大學生超算競賽,給了學生一個在競爭中展示自己專業知識技能的平臺。幾個月前,清華大學學生超算團隊剛奪得了國際大學生超算競賽(ISC2021)總冠軍和LINPACK 基準測試最高性能獎,獲得雙料冠軍。代表清華參加此次SCC隊伍由6名清華大學計算機系的本科生組成。由于賽事規定參賽隊員必須是本科生,因此團隊組成相較去年有了較大的變動,其中有四名隊員是新成員。對新成員而言,這是他們第一次參加該項賽事,但也是一戰即勝。在得知清華大學學生超算團隊在該項賽事中獲得四連冠后,AI科技評論聯系到了他們,并同他們針對比賽情況進行了交流,對話內容整理如下。在談到今年SCC整體上和去年以及往年有什么不同時,清華超算團隊表示今年賽事和去年都是以線上的形式進行的,線下比賽需要參賽者自行搭建物理比賽集群,線上比賽則需要選手合理選擇云服務資源。“今年和去年對比,今年的比賽「氛圍感」更足了。主辦方提供了在線交流平臺,在比賽中,各個隊伍間、參會人員和隊伍間都可以方便地進行交流互動,讓我們感覺仿佛在線下參加比賽,體驗很好。”和往年一致,今年的賽題設置同樣考察了選手對經典HPC應用的編譯、運行、分析、優化能力。大賽賽題包括基準測試程序LINPACK HPCG IO500,多尺度心臟模擬 Cardioid,量子材料模擬Quantum ESPRESSO,SC20論文復現題以及現場公布的神秘應用“高能中微子物理中的圖像分類應用Cosmic Tagger”。三大基準測試程序中,Linpack 基準測試是計算機浮點執行率的度量。它是通過運行一個計算機程序來確定的,該程序求解了一個密集的線性方程組。它被TOP 500用作對峰值性能進行排名的工具。而高性能共軛梯度 (HPCG) 基準測試項目旨在創建一個用于對 HPC 系統進行排名的新指標。HPCG旨在作為高性能LINPACK(HPL)基準測試的補充,該基準測試目前用于對TOP500計算系統進行排名。除此之外,IO500 基準測試是高性能 IO 的基準測試套件。它利用現有和受信任的開源基準測試(如 IOR 和 MDTest),并捆綁執行規則和多個工作負載,目的是評估和分析各種 IO 模式的存儲設備。清華超算團隊認為LINPACK HPCG IO500是每年不變的必考項目,已經比較熟悉了。多尺度心臟模擬器 Cardioid是一款用于模擬臨床心臟現象的心臟模擬套件。它能夠模擬電生理和機械器官級模擬,并具有用于計算心臟網格,重建軀干ECG和生成逼真的心臟纖維方向的處理工具。,曾在 SC12 入選 Gordon-Bell 獎的 Finalist。Quantum ESPRESSO 也是一個經典的科學計算軟件,在材料等學科有著廣泛使用,屬于超算上的經典應用,也曾在幾年前的 ASC 比賽中出現過。在復現題中,選手需要承擔審查SC20論文的角色。SC21復現題委員會選擇了論文 “A Parallel Framework for Constraint-Based Bayesian Network Learning via Markov Blanket Discovery” 作為今年SCC復現題基準。“我們需要復現實驗結果,并分析與原論文數據間的異同。”團隊成員表示:兩道應用Cardioid和Q-E都是在超算中心上投入使用很多年的程序,組委會通過賽題,不僅考察了隊員的各方面能力,也讓我們有機會了解認識到真正的超算中心上都在解決哪些問題。“去年比賽是第一次線上競賽,我們需要在預算限制下,在 Azure 云服務器上自選機型,搭建高性能集群進行比賽。”不同的是,此次大賽首次提供微軟 Azure 云和Oracle云兩個云平臺供學生進行比賽。學生團隊必須優先考慮和利用 Microsoft Azure 云的預算,并且需要了解如何優化和利用Oracle云提供的特定硬件。這對選手來說是一個新的體驗。“云服務器的特點在于機型種類多,有不同的軟硬件配置。在選擇機型時,我們不僅需要在權衡性價比后選擇最合適的硬件配置,還要為它們安裝正確的軟件(如操作系統等),才能發揮出它最高的性能。這要求同學們必須對軟硬件有深入的了解。”“在比賽中,我們也遇到了一些資源競爭的問題。開賽后我們才發現,某種高性能機型主辦方只提供了8臺,甚至不能保證10個隊伍各有一臺。高性能機型的不足,是我們本次比賽中遇到的最大困難。最終我們調整策略,順利完成了比賽。”團隊成員翟明書、宋澤宇曾參加過ISC21,SC20,ASC21并且取得了很好的成績。今年隊伍中雖有4名同學都是第一次參加,但是他們仍然保持了高水平的發揮。這離不開每個隊員賽前的刻苦訓練,以及賽中充分的交流協作。“要想把比賽打好,我們需要發揮出每個隊員的長處,合理安排比賽策略,在比賽中做到高效交流、冷靜判斷比賽形勢。今年我們做到了這些,也取得了一個好成績。”雖然清華超算團隊已經在SC比賽上取得了四連冠的傲人成績,在外人看來可能會覺得清華奪冠不是一件特別困難的事情,但事實并非如此。“超算比賽只允許本科生同學參賽,所以我們每年隊伍人員變動都不小。SC比賽是每年秋季開學后的第一場超算比賽,對很多超算隊隊員而言,SC比賽都是他們經歷的第一場超算比賽。第一次參賽總是最具有挑戰的,想要在比賽中有好的發揮,離不開賽前充分刻苦的訓練。”清華的“四連冠”,但對新隊員來說是“第一冠”,這絕對不是輕而易舉就可以做到的。“我們希望這是一個好的開始,在接下來的ISC等超算競賽中,爭取獲得好成績。”參考鏈接:
1.https://sc21.supercomputing.org
2.https://studentclustercompetition.us/index.html

雷峰網(公眾號:雷峰網)雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。