0

作者 | 包永剛
編輯 | 王 川
2016年AlphaGo與李世石的人際圍棋大戰結束后,芯片工程師劉強感受到了突如其來的變化。
6年沒更新的PCIe3.0標準,在2017年突然升級到PCIe4.0。隨后的2019年和2021年,PCIe5.0和PCIe6.0相繼發布,這個速度讓劉強感到意外。
“通常而言,通信協議標準大概5年演進一代,現在變成了2年就迭代一次。”劉強恍然大悟,AI應用持續爆發帶來的大量數據,讓高性能計算(HPC)和數據中心的數據傳輸帶寬成為了瓶頸。
PCIe這個高速總線標準,就像是HPC和數據中心內部的高速公路,連接著計算、存儲等組件,數據太多導致系統出現了擁塞。
與AI一樣,自動駕駛汽車也考驗著傳統HPC系統。
新思科技總裁Sassine Ghazi在2023新思科技開發者大會上指出:“如今,一輛現代化的汽車上大概運行著1億行代碼,到2030年將超過3億行。3億行是個什么概念呢?比如新思科技,我們已經深耕軟件行業多年,產品種類豐富而全面,我們公司有大約3億行代碼量。”
自動駕駛汽車、AI、云計算、短視頻興起帶來的數據爆炸式增長,像是“突然”改變了HPC行業。
各種應用對數據中心系統計算、存儲和網絡帶寬的性能要求更高,需求還各不相同,此時需要的是最全面的EDA工具和可配置的IP,而新思科技推出的業界領先的全面HPC和數據中心解決方案正是最優解。
數據爆發,高性能計算「突變」
高性能計算(HPC)這個概念在20世紀五六十年代出現時,只有氣象、航天等少數應用有需求。
云計算、AI和自動駕駛汽車的飛速發展,短視頻的興起,在線購物席卷全球,即時通信軟件不斷普及,讓高性能計算不再局限在少數領域。
如果把HPC硬件比作建房子,以前只有幾個人能買得起房子,這是取少數幾個人對房子需求的最大公約數,建出標準化的房子就足夠。現在成千上萬人都有買房子的需求,并且每個人對房子的功能和裝修要求各不相同,必須要造出差異化的房子。
在芯片行業工作了20多年的芯片工程師趙偉,深切感受到這種突變是在短視頻興起之時。
“短視頻興起前,沒人想過同一個視頻會被上千萬人甚至上億人在各種手機、平板電腦、PC上觀看。”趙偉意識到,“短視頻的火爆需要上層軟件對不同客戶端做適配,下層的硬件和網絡帶寬也要做相應的匹配。”
隨著短視頻、線上購物、即時通信等行業的競爭日趨激烈,提升產品體驗和實現差異化功能變成主旋律,上層需求向基座技術傳導,HPC和數據中心硬件設施要全面升級。
服務器和云計算服務的芯片從純CPU單一架構,走向了CPU+GPU,再朝著CPU+GPU+DPU的多架構方向,算力、系統復雜性都呈現指數級增加。
解決復雜問題一定要有系統性思維,作為全球EDA、IP和軟件安全解決方案的領導者,新思科技前瞻性的提出了“SysMoore”理念。
Sassine Ghazi說,“如今,芯片設計已經從規模復雜性向系統復雜性轉變,對軟硬件的交叉點進行優化才是科技創新的真正推動力,因此新思科技提出了‘SysMoore’, 即從系統層面開展芯片設計,在傳統芯片與系統之間進行優化。”
SysMoore時代,芯片行業面臨著軟件復雜性、系統復雜性、能效、信息安全和功能安全以及產品上市時間這五大關鍵挑戰。這在HPC領域的體現尤為突出。
新思科技提供的業界最全HPC和數據中心解決方案,包含從芯片設計到實施部署、半導體IP、光互連,以及從芯片到軟件的驗證等領先技術,幫助開發者優化設計方案,并提升設計效率。
“端到端的解決方案對客戶的支持更全面,能夠降低客戶的使用難度,更好更快地幫助客戶產品落地。”新思科技中國區副總經理姚堯強調端到端解決方案的重要性。
全方位支持,也包括了新思科技能夠提供從系統設計到芯片實現的差異化服務團隊,最大化滿足客戶的所有差異化需求。
新思科技的專家顧問團隊可以為合作伙伴提供差異化的端到端服務咨詢方案,覆蓋從執行專門任務、處理單個模塊到全芯片實現的 SoC 開發全流程。無論開發者是要將設計遷移到先進的 FinFET 工藝節點,還是從 ASIC 切換到 CoT 流程,新思科技都可以通過定制化的服務幫助合作伙伴更快地完成芯片開發工作。
高性能計算追求差異化,需要靈活的PPAL滿足
如同住戶對房子有各種功能需求,也不能跳不出房子最基本的屬性,在芯片行業這個基本屬性就是PPA(Power,Performance,Area)。為了滿足HPC用戶普遍的實時性需求,還得加上低時延(Latency)。
HPC和數據中心最重要性能之一就是算力,這也是AI和自動駕駛汽車快速發展的基石。機構估算,訓練ChatGPT5.0需要5萬張英偉達的H100計算卡,按照一機8卡算,對應6250臺服務器,這相當于一個中型數據中心的規模。
“算力就像是新時代的石油,推動著數智未來加速到來。但它不像石油資源取決于一個國家的誕生地,算力是一種可被生產出來的‘能源’。如果一個國家的算力基礎設施足夠好,算力就可以大量且低成本地生產出來。”姚堯做了一個形象的比喻,“如果一個國家能夠擁有足夠多的低成本的算力資源,就能充分解決藥物研發、天氣預報、疾病治療等科學文明發展的關鍵問題,最終推動該國家乃至整個地球向更高文明等級發展,這是算力發展最重要的意義。這對于整個科技行業的從業者來說,是一個非常令人激動的時代,孕藏著巨大的機會。”
那如何生產出HPC和數據中心客戶所需的高算力?
3DIC是高性能低功耗的最優解
過去幾十年間,提高算力的主要方式是摩爾定律的演進。這種方式現在遇到了瓶頸,先進工藝不僅成本飆升而且技術難度指數級增長,而把芯片做大,良率也是不容忽視的挑戰。
于是,芯片行業轉向了3DIC。形象理解3DIC,就是以前的房子都是一層樓,要更大空間就需要增加房子的長度和寬度以增加面積(性能),而采用3DIC技術后,就可以從高度上增加房子的面積,也就是從2D到3D了。
“很早之前就有人提過2.5D的概念,但那時候摩爾定律一直在發展,業界沒有很強的動力發展2.5D芯片。現在摩爾定律的發展越來越緩慢,大家更有動力發展3DIC。”新思科技的工程師解釋道,“把大芯片做成幾個小芯片,然后堆疊在一起,不僅性能和良率都能做得更高,還能降低功耗。”
3DIC是提升HPC和數據中心芯片PPA的完美選擇,但是,設計3D芯片并非易事,芯片架構要從2D升級到3D,然而芯片開發者過去已經習慣了用自己熟悉的既定方法、工具和工作流來開發SoC,這對于難度和復雜度大幅增加的3DIC架構來說容易出錯。
還有一個明顯的差異,2D芯片設計完成后交給封裝團隊相對簡單,但3D芯片對封裝的要求更加嚴格,架構、設計、實現、IP創建/集成、封裝團隊都需要更緊密的協作。
目前,各種單點工具只能解決復雜的3DIC設計中細枝末節的難題,需要專為3DIC而生的工具。
新思科技3DIC Compiler正是為3DIC而生的統一芯片設計平臺,為3D可視化、路徑、探索、設計、實現、驗證及簽核提供了一體化的超高收斂性環境,全套的自動化功能可以降低設計的難度,減少迭代次數,縮短產品的上市時間。
其中的3D可視化,能夠將復雜的線路更清晰的呈現,不僅能讓開發者的設計更加直觀,效率更高,設計優化也更好。
新思科技預計,2026年約20%的芯片系統將采用多裸晶芯片系統或3DIC技術,到2030年,這一比例將上升到40%。
借助3DIC Compiler,HPC芯片的PPA需求可以被滿足,低延遲需求就需要靠高速接口IP來解決。
最新高速接口IP解決I/O瓶頸
在HPC和數據中心領域特別強調低延遲的理由非常簡單,AI計算中數據搬移消耗的能耗遠高于計算,并且數據傳輸的速度跟不上計算性能的提升,I/O已經成為了發展瓶頸,這也是PCIe和以太網在AI爆發之后會快速迭代的直接原因。

接口IP一直都是新思科技的優勢產品,作為半導體IP領域的全球領導者,新思科技總是能超前地布局新產品的研發。
新思科技IP工程師分享:“標準快速變化的時代,市場只需要PCIe5.0的時候,我到底做一個PCIe5.0還是生態還未成熟的PCIe6.0?這時候了解客戶的需求還不夠,還需要有行業遠見。”
在綜合評估了市場的需求之后,新思科技率先在業界推出了PCIe6.0 IP產品。除了產品定義的難題,還需要把產品做得足夠靈活才能適應未來HPC和數據中心市場的需求。
“PCIe3.0的時代,做好產品客戶會主動來買。”新思科技IP工程師進一步解釋,“現在不一樣了,客戶應用多樣化之后,速率也已經不是唯一的評判標準。我們能做的就是提供可配置的IP,充分滿足客戶不同的需求。”
與PCIe一樣,以太網標準也在近幾年加速迭代。最新一代的以太網標準將可以提供224G的數據速率,為1.6T以太網的發展奠定基礎。
224G以太網的設計面臨著巨大的挑戰,由于數據中心內前面板可插拔模塊的密度已經接近極限,只剩下有限的空間可插拔光學模塊使用,設計224G以太網就需要有功耗等方面的獨特考量。
新思科技率先推出了224G以太網PHY IP,可以滿足不斷增長的高帶寬和低延遲要求,同時提供超過IEEE 802.3和OIF標準電氣規范要求的信號完整性和抖動性能。
在兼顧性能和低時延的同時,新思科技的HPC和數據中心解決方案也提供端到端高能效設計,覆蓋從架構到簽核全過程的低功耗方案能夠滿足高性能計算和數據中心系統目標,基于新思科技獨一無二的Platform Architect,從架構層面就能確定如何做功耗權衡,并加快設計進度。
新思科技可視化的3DIC Compiler、可配置的高速接口IP、覆蓋全流程低功耗解決方案,能夠滿足HPC和數據中心芯片的PPAL和差異化需求。但依舊面臨著芯片計復雜度增加,工作量加大,對芯片工程師要求更高的挑戰,AI將讓這些問題迎刃而解。
用EDA+AI魔法「打敗」復雜性難題
新思科技幾年前就率先在業界開始了EDA+AI方面的探索,并在今年推出了業界首個AI驅動型全棧式EDA解決方案Synopsys.ai,包含了設計空間優化解決方案DSO.ai,驗證空間優化解決方案VSO.ai,測試空間優化解決方案TSO.ai,模擬與制造優化解決方案。簡而言之,它是從設計到制造全流程的全套解決方案。
“HPC和數據中心的系統變得越來越復雜,參與設計的工程師越多,出錯的概率就越大。”新思科技工程師分享了AI技術與EDA工具融合的價值,“通過數據的訓練,用AI去設計復雜的芯片效率更高,也能降低對人力的依賴,這在芯片人才緊缺的大環境下,AI+EDA的價值尤為明顯。”
目前,新思科技DSO.ai已經實現超過270次商業流片。
測試流程用AI的價值也非常明顯。TSO.ai平均能夠降低20%-30%的測試成本。
“如果能將一顆芯片的測試時間從10秒減少到5秒,占用測試機臺的時間減少,成本隨之減少。”該工程師解釋。
從芯片生命周期出發,破除系統穩定性難題
系統的復雜度越高,穩定性就越容易出現問題。想要破除穩定性的難題,最好的方式就是在芯片里裝上多個傳感器,就像是芯片房子里的“攝像頭”。
數據中心里有一個“未解之謎”——靜默數據丟失,也就是一份數據在數次復制之后丟失了,查詢系統日志也無法找到。這個問題的原因在業界一直沒有一個被廣泛可接受的解釋。
給芯片裝上傳感器,對芯片生命周期管理,不僅有助于找到靜默數據丟失的答案,還能提升數據中心從芯片到系統的穩定性。
任何的半導體器件都會出現一些隨機的錯誤,這種隨機的錯誤沒辦法重現,而有了芯片內部的傳感器,有利于收集異常數據。
芯片生命周期管理的價值當然不限于此,傳感器能夠監控芯片的運行環境,更容易發現芯片的問題,也能夠幫助下一代芯片的設計改進,提升復雜芯片和系統的穩定性。
以前只有少數公司能夠高穩定性的HPC產品,如今,新思科技的芯片生命周期管理解決方案(Silicon Lifecycle Management, SLM)可以將芯片設計、測試驗證、制造與部署的每一個階段所產生的大量數據加以連接并整合到統一平臺進行分析,優化包括芯片性能、速度、量產良率、品質管控以及上市時間等重要核心指標,從而幫助更多公司設計出性能更出色、穩定性更佳、具有差異化優勢的芯片產品。
芯片市場的變化,給EDA公司帶來了更多的挑戰,特別是在HPC和數據中心這樣對性能、延遲、穩定性要求更為苛刻的領域,想要解決越來越復雜的系統級挑戰,只有從系統級出發,提供端到端的解決方案才能更好地應對日益復雜的設計挑戰。
HPC的應用早已不再局限在少數應用領域,越來越多的HPC和數據中心的差異化需求之下,一旦硬件的能力跟上應用需求,HPC市場將在短時間內突變。新思科技是讓這場變革的最佳助攻,在充分了解客戶需求,洞見市場的基礎上,率先布局,提供全面的產品,著眼當下也面向未來。雷峰網(公眾號:雷峰網)雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。