<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      專欄 正文
      發私信給Shavvn
      發送

      1

      解讀世界最強超算——太湖之光

      本文作者: Shavvn 2016-06-27 09:53
      導語:本文依據現有公開資料對太湖之光進行深入分析。

      雷鋒網注:本文作者計算機體系結構博士生,原文發表于知乎,經作者再次編輯后授權發布在雷鋒網。ISC2016 公布了中國新一代超級計算機“太湖之光”,取代了天河二號成為Top 500 (超算排行榜)頭名。本文依據現有公開資料對太湖之光進行深入分析。

      解讀世界最強超算——太湖之光

      (圖片來自新華網)

      前幾天,我在辦公室看到太湖之光的消息,非常振奮,當即就去找導師匯報(因為和筆者研究方向相關)

      我:“中國造了一臺新超算,100PFlops!”

      導師的第一反應是:“功耗多少?”

      我:“15MW”

      導師:“Holy sh*t!”(臥槽!)

      我:“他們沒用 Intel 的芯片?!?/p>

      導師:“oh that makes sense”(怪不得)

      我不是黑 Intel,但實在是x86架構的歷史包袱太重了,想要實現 性能/功耗比的重大提升,這是一個邁不過去的坎。 我在 如何看待 19 歲少年想做出在目前 Intel 同等計算性能下降低 80% 功耗的全新電路系統芯片?這個回答中就提到過,Rex Computing 的人在做的事之一就是砍掉Cache (緩存),用 Scratch Pad Memory (相當于是手動管理的快速片上內存) 取而代之。而在太湖之光的眾核架構中的大量 slave core里面,采用了同樣的思路,只保留了instruction cache。

      data cache用Scratch Pad Memory代替,避免了眾核情況下的cache coherence帶來的大量性能和功耗浪費。(Master core 里面有正常的Cache),我覺得這是太湖之光實現高性能/功耗比的一個重要原因。 并且Slave core只支持user mode,于是我猜測它在TLB上面應該也有精簡。但目前 SW26010 芯片還沒有詳細的文檔資料,所以這點我也只能猜測。

      至于采用眾核架構,可以說是大勢所趨。所謂眾核架構,就是在同一個芯片上集成幾十甚至上百個核心,這些核心協同或者獨立工作,大大提高系統可執行的線程數,提高并行性,進而提高性能。神威SW26010 每個芯片上有多達260個核心。相似地,美國一些新的超算系統采用了Intel的眾核Knights Landing芯片,據說性能也很不錯。

      解讀世界最強超算——太湖之光

      圖1:SW26010 的眾核架構

      至于指令集,Jack Dongarra在他的報告里特意強調SW26010 芯片的指令集和 Alpha (美國一家曾經的高性能芯片廠商)的指令集沒有關系,所以哪怕神威前幾代芯片和Alpha 有淵源,但這次應該真沒有。

      然后更令我驚喜的是不光系統搭起來跑了Linpack,而且還有三項應用入圍了Gordon Bell獎的最終名單 (這個可以說是超算界最厲害的獎了)。充分說明太湖之光已經形成戰斗力,可以投入真正的科研應用。

      最后我們冷靜下來談一談不足之處: HPCG的跑分。

      為什么HPCG跑分重要?因為它比Linpack更接近真實應用的場景,更能體現出內存系統的瓶頸。Linpack測試的重點是系統的浮點運算能力,也就是我們前面提到的FLOPS(floating operations per second)這個指標。然而實際的應用中,浮點運算快并不代表系統有很好的性能,因為如果想要浮點運算能力得到發揮,首先需要能在短時間內把大量的數據送給需要處理的單元,這對系統的內存和互連網絡的性能要求更高。而HPCG的跑分則是一個更接近綜合性能的指標。用一個汽車的比喻來講,Linpack的跑分更像是汽車的百米加速指標,而HPCG更像是到真實的賽道上去跑——這時候就不光是加大馬力就能行的了,操控性等其他因素也很重要。

      解讀世界最強超算——太湖之光

      表1:太湖之光,天河二號,以及泰坦(美國)性能對比

      由上表可以看出,太湖之光在HPCG的測試下只達到了它0.3%的峰值性能,總的算下來還不如天河二號。說明其在內存和互連網絡的性能上存在很大的瓶頸。

      結語

      雖然太湖之光取得了很好的成績,可以說是中國超算人的驕傲,但我們還是不能掉以輕心。美國正在大力發展 exa-scale計劃 (1000 Pflops,大約是太湖之光的10倍性能) ,計劃在2023年拿出性能達到exa-scale,功耗小于20MW 的超算。并且還有3臺超過100Pflops的超算正在建設當中 。而我們眼前就有GPU帶來的超算變革,DARPA(美國國防前沿研究計劃) 也為exa-scale計劃投資了不少黑科技的項目, 而且這個太湖之光一出,他們估計跟國會要錢更加容易…… 革命尚未成功,同志仍需努力啊!

      注:文中資料圖均來自Jack Dongarra 的報告 Report on the Sunway TaihuLight System

      雷鋒網注:本文為雷鋒網作者授權發布文章,轉載請聯系授權,不得刪減內容。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

      解讀世界最強超算——太湖之光

      分享:
      相關文章

      計算機民科

      計算機體系結構博士生
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 五月丁香六月激情综合在线视频| 日韩成人无码中文字幕| 国产在线拍揄自揄拍无码男男| 国产精品久久无码不卡黑寡妇| 亚洲人片在线观看天堂无码| 蜜臀av午夜一区二区三区| 成人做爰A片免费看奶头| 熟妇人妻无码中文字幕老熟妇 | 国产精品色哟哟| 五十路熟妇高熟无码视频| 强奷乱码中文字幕熟女一| 久久夜色精品国产网站| 亚洲色大成网站www永久男同| 欧美肏屄视频| 亚洲人妻影院| 日韩av爽爽爽久久久久久| 91嫩草尤物在线观看| 一本一本久久a久久精品综合| 永寿县| 亚洲一人综合| 亚洲爽图| 永久在线观看免费视频| 美女露出奶头扒开尿口免费网站| 中字无码av电影在线观看网站| 国产妇女馒头高清泬20p多| 在线观看日韩av| 国产99久久精品一区二区| 人妻久久久| 午夜dj在线观看免费高清在线| 国产一区二区三区禁18| 久久无码中文字幕免费影院| 久久久久无码精品国产不卡| 国产黄片视频在线观看| 国产白浆一区二区| 亚洲无码在线播放| 午夜理论片yy6080私人影院| 日本熟妇色xxxxx日本免费看| 亚洲精品日产精品乱码不卡| 人与禽交av在线播放| 精品成人毛片一区二区| 国产口爆吞精在线视频2020版|