0
汽車行業正快速朝著智能化的方向發展。汽車的智能化將驅動汽車架構轉向中央計算架構。
中央計算能在降低成本的同時提高通信效率,還可以實現遠程升級(OTA),讓智能汽車也能像智能手機一樣持續升級,擁有更好的智能化體驗。既然是中央計算,芯片的安全性和性能都尤為重要。
“隨著自動駕駛接管車輛的時間越來越長,汽車芯片的功能安全將無法忽視。”Imagination Technologies車載GPU產品線的產品總監章政指出,“在車上用消費級芯片只是短期過渡。”
目前大量的智能汽車雖符合國家的法規要求,但考慮成本等多方面的因素,滿足的是系統級安全,整車符合汽車安全要求,但使用了一些消費級芯片,而非高等級的功能安全芯片,這是為什么?
最核心的原因還是因為成本,傳統方式要實現功能安全,會帶來成倍的成本增加,阻礙了高功能安全等級的汽車芯片普及。
近期Imagination發布了業界高等級功能安全和最高性能的汽車GPU IP DXS。
通過創新的分布式安全機制,Imagination DXS GPU對性能的影響幾乎為零,芯片面積的代價估計僅為10%,實現了ASIL-B功能安全等級。
并且Imagination DXS GPU IP,峰值性能比Imagination上一代汽車GPU提高了50%,可擴展至192 GPixel/s、6 TFLOPS和 24 TOPS,AI性能更是有高達10倍的提升。
Imagination的全新產品無疑將推動高功能安全等級車載芯片在智能汽車中的普及。
用10%的芯片面積代價,實現高等級功能安全
所謂功能安全,指的是確保芯片按照設計的功能運行。如果芯片不能按照汽車設計的功能執行,可能會威脅到駕駛員、乘客、路人的安全。
要達到功能安全,就要付出一定的成本,比如招聘有經驗的設計人員,執行嚴格的功能安全研發流程,進行安全認證等。
對于芯片來說,實現功能安全最重要的成本來自增加的芯片面積,因為所有新功能的實現,都需要增加芯片面積。
實現汽車芯片功能安全有兩種常見的方式,一種雙核鎖步法,另一種是工作負載重復法。

雙核鎖步法用兩個相同的邏輯單元實現同一個功能,同時執行任務比較結果是否一致,如果一致說明邏輯運行正確。通過雙核鎖步法實現功能安全的代價是多一倍的芯片面積。
工作負載重復法,就是把同一個工作執行兩次,對比兩次的結果是否一致,這種方法可以避免隨機錯誤,但難以避免長期錯誤,并且因為要進行兩次重復的工作,相當于性能降低為二分之一。
無論是雙核鎖步法增加一倍的芯片面積,還是工作負載重復法相同的芯片面積性能降低一半,實現功能安全的代價都是十分高昂,自然難以普及。
自動駕駛逐步普及之后,汽車芯片的功能安全就難以被忽略。如何才能用最小成本實現高等級功能安全?
Imagination DXS開創性地實現了僅增加10%的芯片面積,對GPU的性能幾乎零影響,通過分布式安全機制實現了ASIL-B功能安全。

根據ISO 26262汽車安全完整性等級(ASIL)體系,ASIL-A等級的要求最低,ASIL-D等級的要求最全面。
“今天我們可以輕松達到ASIL-B,這個等級基本可以滿足L2級自動駕駛的需求。如果需要更高功能安全等級,可以通過2個ASIL-B系統交叉確認實現。未來我們會進一步提高安全等級。”章政告訴雷峰網(公眾號:雷峰網)。
Imagination DXS能夠以足夠小的代價,實現足夠高的功能安全等級的核心是利用了處理器固有的并行性,以及任何線程都不會被完全利用的事實。
也就是說,DXS會利用一個GPU線程等待的時間,插入安全測試,使用相同的安全測試在另一個線程等待時插入,執行完成后對比結果是否一致。
這是DXS實現高等級功能安全邏輯模塊的功能安全,也是實現整個功能安全的難點所在,需要能夠迅速在模塊中定位錯誤,這只是實現功能安全的其中一半。

DXS另一半的功能安全是內存,包括Cache或SRAM。章政介紹Imagination會通過ECC、parity或者CRC校驗,保證內存的功能正確。
Imagination通過獨特的分布式安全機制(DMS),利用空閑時不停發送很小的測試向量,在ASIL標準設定的時間范圍內識別故障,實現高等級功能安全。
DXS在執行安全相關的任務時,效率是同級別競品的2倍,再借助分布式功能安全機制,DXS的優勢還能翻倍。
Imagination已經為這個機制申請了專利。章政說,“DSM機制不僅可以用于車載電子,對于功能安全要求高的其它的領域,比如航空、醫療和工業,也都適用。”
AI性能的數量級提升
對于自動駕駛汽車芯片,與功能安全同樣重要的是高性能。因為自動駕駛仍在不斷發展,智能化功能在不斷擴展,高性能和可擴展性都非常重要。
得益于增加了一個新的SPU單元,使用5nm節點,算力可從單核0.25 TFLOPS的配置,擴展到1.5 TFLOPS的處理能力,DXS的性能相比上一代XS整體提升了50%。

Imagination為SPU做了很多優化工作,比如增加了2D雙速紋理處理(2D dual-rate texturing),更新了固件處理器(firmware processor),新增了可變分辨率渲染(fragment shading rate)。
整體而言,對于渲染類任務,DXS單位面積的性能高出競品2倍。對于以計算為中心的圖形處理任務,DXS單位面積性能高出競品28%左右。
自動駕駛芯片的AI性能也值得單獨關注,這是實現更高級別自動駕駛的關鍵所在。
4核配置的DXS,用于FP16半精度浮點計算時,DXS能提供12 TFLOPS的性能;用于int8計算時,DXS能提供254TOPS。
“這是運行在1GHz主頻上的數據,如果芯片設計公司后端能力夠強,DXS可以運行在1.2GHz甚至1.5GHz的主頻,其性能將更高。”章政表示,“我們研究發現,大部分AI負載FP16的精度就足夠滿足要求,FP32確實有更高精度,但帶寬會增加一倍,系統可能沒辦法提供這么高的帶寬。當然我們的DXS也支持FP32。”
帶寬也是限制汽車ADAS實現的重要原因, Imagination DXS增加了片上存儲,盡量把所有計算都控制在一個GPU內,大幅降低系統的帶寬需求。
不過對于發揮芯片的AI性能,上層的軟件同樣關鍵。
由于GPU的人才相對匱乏,為了讓開發者充分利用GPU的性能,Imagination開發了一系列庫,比如幾何庫、BLAS庫(imgBLAS),專門的CNN 庫(imgNN),還有專門處理車載工作的庫,如處理雷達數據需要的FFT庫(imgFFT)。
Imagination的目標是幫助軟件開發人員實現高達80%的GPU利用率。
這些庫與新的參考工具包oneAPI和TVM相結合,構成了一個基于開放標準的實用軟件棧,軟件開發人員可以利用該軟件棧輕松地將其計算應用移植到基于Imagination IP的硬件上,并最大限度地提高其性能。
DXS AI性能的提升相比上一代高達近10倍。其中,硬件性能大概提升了50%,所以更大的的提升來自軟件的支持和協同。

“計算庫提升了2-4倍的性能,采用雙速率FP16帶來了3倍提升,所以DXS在典型工作負載上帶來了6-12倍的性能提升。”章政表示,“DXS大模型、路況視覺觀察、駕駛員行為監測、激光雷達系統數據處理等方面已經具備了商用能力。DXS覆蓋從座艙到L2/L3自動駕駛的需求,DXS 8-256 MC1主要用于低成本的HMI應用,最高端的IMG DXS-48-1536 MC4滿足ADAS的這個需求。”

不同的公司可以根據產品定位,靈活選擇合適的配置,甚至可以在下一代產品更新時增加一個新的GPU模塊。
這就離不開DXS硬件和軟件的靈活性。
為了應對高端制程大芯片良率越來越低的挑戰,DXS原生支持小芯片(Chiplet)封裝,這得益于Imagination內核之間的低帶寬總線和對隔離的支持。

軟件層面,基于硬件的虛擬化技術使Imagination GPU能夠同時運行8個操作系統,并通過完全的內存隔離,實現完全安全的GPU多任務處理。
目前Imagination的汽車GPU支持OpenGL ES、Vulkan、OpenGL和OpenCL。它們可運行流行的汽車操作系統,如QNX和Green Hills軟件公司的INTEGRITY RTOS,以及Linux和Android。
隨著高安全等級且高性能DXS的發布,高功能安全的汽車芯片的普及將掃清障礙。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。