1
雷鋒網消息,在不久前的GTC大會慕尼黑站上,NVIDIA發布了虛擬化平臺的Virtual GPU軟件v7.x最新版。昨天,NVIDIA在北京召開溝通會,NVIDIA GPU虛擬化高級解決方案架構師張潔,以及中國區解決方案架構師李浩南詳細介紹了該技術的性能和特點。

如今,GPU已經成為企業非常重要的資本和生產力工具,虛擬化可以很好地幫助企業充分分配GPU資源給更多的用戶。5年前,GRID虛擬GPU(vGPU)平臺,結合VMware Horizon vDGA(虛擬專用圖形加速)平臺,實現了針對Tesla GPU的虛擬化工作。
NVIDIA的虛擬GPU產品包括三款旨在應對數字化工作環境挑戰的產品:面向知識工作者的NVIDIA GRID虛擬PC(GRID vPC)和NVIDIA GRID虛擬應用程序(GRID vApp),以及面向設計師、工程師和建筑師的NVIDIA Quadro虛擬數據中心工作站(Quadro vDWS)。

經過5年多的發展,vGPU從軟硬一體到單純的軟件,從一個只能支持一個明確固定型號的GPU到現支持最新Tesla系列的所有GPU,從對圖形圖像進行支持、解決客戶在使用圖形圖像時的重負載應用時如何在數據中心部署的問題,到如今在虛擬GPU上實現GPU計算部分能力的業務。
據張潔介紹,新的GPU軟件Vgpu 7.x版通過實時遷移等功能確保了可靠性和易管理性,其新功能包括:
基于NVIDIA Quadro vDWS運行多GPU工作負載:通過在單一虛擬機(VM)中集合多達四個NVIDIA Tesla GPU的性能,可體驗到虛擬GPU性能的巨大提升,從而應對圖形及計算密集程度最高的渲染、仿真和設計工作流程。
借助VMware vMotion的實時遷移:IT可在不會對用戶造成影響,也不需要預定停機時間的情況下遷移實時NVIDIA GPU加速虛擬機,從而節省寶貴的時間和資源。
支持NVIDIA Tesla T4 GPU:和上一代Tesla P4采用相同的低剖面、單插槽規格,卻可實現2倍的幀緩沖。
部署NVIDIA GPU Cloud的虛擬機上的AI工作負載:NGC為AI研究人員提供了適用于TensorFlow、PyTorch、MXNet、TensorRT等GPU加速的深度學習容器。

其中,vGPU 7.x最重要的更新在于切片模式,從過去只支持從一塊物理GPU虛擬出多臺VM,擴展為支持將多個物理GPU分配給一個VM。如果用戶對GPU的資源、對算力要求更強,可以在虛擬化平臺里實現多GPU,從而滿足用戶對高算力的要求。
GRID通過分時切片方式提供物理GPU上的各類資源給到系統,調入的顯存數據相互隔離,根據不同GPU性能水平可分割為不同vGPU資源,各vGPU資源對等。vGPU調度的性能損失小、按需分配,充分發揮硬件價值。
多GPU支持的應用場景很多,比如說在原來的圖形工作站中的一些高端場景里會配兩個GPU,如果在CD場景里,一個GPU做3D建模,一個GPU做仿真;在影視后期里,一個GPU用來做動畫建模,另外一個GPU用來做渲染,等等。

同時,vGPU 7.x配合了VMware最新版本的服務器虛擬化解決方案,vSphere 6.7 U1。可配合VMware在數據中心實現帶有GPU的虛擬機可實現動態的熱遷移,在遷移的整個過程當中,用戶的業務是不中斷的。
此外張潔還提到,微軟推出Win10系統后,幾乎所有的系統應用都需要GPU加速。根據 LakesideSoftware, Inc 白皮書,Windows 10 所需的 CPU 資源比 Windows 7 最高要高出 32%。Chrome、Skype和 Microsoft Office 等基本辦公室工作效率應用程序的更新版本對計算機圖形性能的要求也比以往更高。
GPU輕負載應用對于物理機來說并不是什么問題,但是對于虛擬化桌面來說,沒有GPU加速能力將非常影響基本使用。vGPU 7.x針對輕負載應用提供了GPU加速能力,不僅解決了這個問題,還可以提高VM的密度,從而更經濟、更有效的部署虛擬化桌面辦公環境。
雷鋒網在隨后的訪談中了解到,vGPU 7.0還加入了對AI加速的支持,借助可配合簡化AI部署的NVIDIA GPU Cloud,用戶可以從云端快速地把需要做人工智能業務的用戶環境拖下來進行部署。

而在管理方面,vGPU 7.x支持無感熱遷移,管理員可根據用戶權限和資源需求量,動態分配vGPU資源給不同用戶,無需重新載入VM即可得到vGPU資源的動態響應,用戶完全不會感受到切換過程,充分保證使用連續性。
張潔向雷鋒網透露,NVIDIA配合虛擬化廠商做了非常多的工作,來保證GPU資源可以實現熱遷移:第一,通過vGPU解決方案保證從原端的物理服務器到目標遷移的物理服務器顯存的完全同步;第二,保證GPU指令的同步,包括GPU指令緩存的同步,從而保證GPU從原服務器遷移到目標服務器的時候保證其業務不會造成任何中斷。
GPU虛擬化是軟件,依托于GPU硬件,由于穩定而強大的底層GPU的硬件,所以NVIDIA的軟件在快速迭代下也能保證穩定性。未來,NVIDIA還將繼續和VMware密切合作,充分發揮雙方的優勢共同滿足市場的需要。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。