0
雷鋒網在去年9月的《單線程性能提升超50%!Arm新款服務器CPU要靠單核打天下?》文章中介紹了其最新的Neoverse N2和Neoverse V1平臺,不過當時Arm并未公布兩款新品更多的產品細節,只是表示對比Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之余單線程性能提升了40%,Neoverse V1的單線程性能可提升超過50%。
本月初發布最新一代架構Armv9后,Arm本周公布了更多關于Neoverse N2和Neoverse V1的技術細節,還發布了Mesh互聯技術Neoverse CMN-700。同時,Arm介紹了更多生態建設方面的進展,包括與騰訊、阿里云、甲骨文等公司合作的進展。

生態建設是Arm向服務器以及基礎設施市場拓展的關鍵,在智能手機市場增速放緩背景下,Arm拓展新市場的節奏似乎也加速了。
Neoverse V1和N2各有絕招
Neoverse V系列的定位是提供最佳性能,整體而言,相比N1,Neoverse V1帶來了 50% 的性能提升、1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化。這背后,是Arm迄今為止設計過的最寬微架構,讓Neoverse V1能夠容納更多運行中的指令,支持高性能和百萬兆級計算等市場應用。

與此同時,Neoverse V1也率先支持了可伸縮矢量擴展(SVE,Scalable Vector Extensions),SVE可基于未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。

Arm基礎設施事業部高級副總裁兼總經理Chris Bergey說:“Neoverse V1寬而深的架構,加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據領先優勢,為芯片設計人員提供可實現的靈活性。”
Neoverse V1率先支持了SVE,Neoverse N2則是第一個具備SEV2功能的平臺,因為Neoverse N2平臺是第一個基于Armv9架構的平臺。

Chris Bergey介紹,在諸如機器學習、數字信號處理、多媒體和5G等廣泛應用場景中,SVE2除了帶來大幅性能提升外,還帶來 了SVE 具備的編程簡易性及可移植性等優勢。
Neoverse N定位就是同時考慮性能、功率、面積(PPA),擅長可擴展,可以應用于從高吞吐量計算到功率與尺寸受限的邊緣和5G應用場景。其單線程的性能提升略低于Neoverse V1,相比N1有40%的提升,能為用戶減少TCO的每瓦性能表現。
計算加互聯,提供平臺級解決方案
Neoverse V1和N2能夠提供相比x86架構CPU更高的單核性能,但數據中心的建設者發現計算性能越來越高的同時,系統間互聯的挑戰越來越大。因此,Arm也在CMN-600的基礎上,發布了升級的Mesh互聯技術CMN-700。

據悉,CMN-700在每個矢量上進一步提升了性能——從內核的數量、緩存的大小,到附加內存及 IO 設備的數量和類型。
Arm的技術專家介紹,“Neoverse產品支持 MPAM(Memory Partitioning and Monitoring)和 C-busy(Completer busy)特性,能夠讓大量的內核可以均衡利用那些DRAM以及系統緩存等共享資源。同時,在支持可擴展性方面我們有CMN-700互連技術,它能實現多達256個內核的可擴展性支持,還能連接到加速器以及合作伙伴的IP等。”
“我們認為和多樣化的加速器進行互聯,比如和AI加速器,對于未來市場非常關鍵,與此同時,互聯技術的靈活性尤為重要。” Chris Bergey表示。

Arm的目標是通過對CCIX和CXL持續不斷的投入,讓合作伙伴可以實現更多的定制方案,具備總線和高核數的可擴展性特色,突破傳統硅限制。
也因此,Arm更強調Neoverse的平臺屬性。Chris Bergey說:“我們發現越來越多的客戶需要完整的解決方案,即一個平臺承載他們的系統,可以在上面添加他們的加速器或其他設備,并且可以對其進行定制。我們要做的就是為客戶提供構建科技大廈所需要的‘磚瓦’,而不只是單個給客戶某一個單獨的IP,單獨的CPU或互聯IP。”
完善軟件生態,抓住四大市場機遇
Arm能夠提供有競爭力的平臺級解決方案,但要真正實現在云計算、高性能計算、5G以及邊緣基礎設施四大市場的基于,軟件的完善程度以及生態合作伙伴的支持非常重要。在EDA工具、數據庫、DevOps以及安全等方面,Arm Neoverse獲得了越來越多的軟件支持,AWS Gravition2在這樣的支持下不斷完善。

另外,甲骨文(Oracle)已宣布計劃在Oracle云基礎設施上采用Ampere Altra CPU。
在國內,Neoverse也吸引了騰訊和阿里云。騰訊專項測試技術中心總監黃聞欣介紹,“去年,我們和Arm正式簽署了一份合作協議,希望通過合作加速Arm Neoverse技術的測評和適配。通過TencentBench測試框架發現,得益于更多可擴展的CPU核心數,Arm服務器比傳統的服務器性能表現更強勁,在AI推理和圖片處理領域優勢非常明顯。”
Arm與阿里在Java方面的合作也有進展。阿里巴巴首席工程師周經森說:“Arm的CPU資源在我們現有的軟件里有兩個考慮的點,一些軟件需要重新編譯,另一些只需要把Java applications在JVM(Java Virtual Machine)運行好。過去一年里,我們與Arm合作提高JVM性能,從JDK8到JDK11,通過阿里巴巴 Dragonwell(OpenJDK的一個發行版),把現有一些Java應用的性能提高了50%。”
對于云原生市場的機遇,Arm基礎設施事業部全球高級總監鄒挺表示:“云原生技術我們看到了很大的機遇,也不斷進行投入,包括與公有云以及其他細分市場的合作伙伴緊密合作。在開源社區方面,我們投入大量工程資源,積極與合作伙伴們進行了諸多云原生方面的協作。同時,在下一代基礎設施方面,我們也展開了大規模的合作,比如說在OSS以及與ISV方面的合作。”
Arm在5G領域的合作伙伴也有所進展,Marvell發布了基于Neoverse N2 的OCTEON系列網絡解決方案,預計2021年底前試產。據悉,相較于前一代的OCTEON解決方案,其性能提升3倍。
在高性能計算市場,印度電子信息技術部(MeitY)已宣布將加入法國芯片公司 SiPearl 和韓國電子通信研究所( ETRI)的行列,采用Neoverse V1驅動國家級百萬兆級高性能計算項目。

小結
相同的產品,Arm在半年內分兩次介紹,這表明了Arm看好新一代基礎設施市場的機遇,是重視,當然也心切。畢竟,智能手機市場的增長正越來越慢,向新的市場拓展對于Am的重要性越來越高。
就像本月GTC 21上黃仁勛發布基于Arm架構AI專用CPU GRACE時所說,英偉達能夠幫助Arm的優勢拓展到移動市場之外。
生態的建設沒有捷徑可走,搶食x86的蛋糕,也困難重重。Neoverse的靈活性和可擴展性帶來的可定制性,以及TCO的優勢,能夠取得多大的勝利?
注,文中配圖來自Arm雷鋒網雷鋒網
相關文章:
單線程性能提升超50%!Arm新款服務器CPU要靠單核打天下?
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。