<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      芯片設計 正文
      發私信給曉楠
      發送

      0

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      本文作者: 曉楠 2024-01-11 20:08
      導語:CPU如何玩轉AI?

      如果說2023年是人工智能大模型元年,那么2024年或許就是各形態AI應用大規模落地元年。

      據IDC預測,2024 年全球將涌現出超過5億個新應用,相當于過去40年間出現的應用數總和。

      而作為AI發展基礎之一的算力,面臨著越來越多的挑戰。

      如何打造新一代算力日益成為云廠商在思考的事情。

      1月11日,阿里云宣布第八代企業級通用計算實例ECS g8i算力再升級,國內首發代號Emerald Rapids的第五代英特爾至強可擴展處理器,依托阿里云自研的“飛天+CIPU”架構體系,ECS g8i實例的整機性能最高提升85%,AI推理性能最高提升7倍,可支撐高達72B參數的大語言模型,幫助中小規模模型起建成本降低50%。

      同時,新實例還提供了端到端安全防護,為企業構建可信AI應用提供強有力的隱私增強算力支撐。

      阿里云彈性計算產品線總經理張獻濤表示,“阿里云ECS g8i實例的強勁表現,證明了以CPU為中心的計算體系同樣具備加速AI推理的巨大潛力,公共云不僅可勝任超大規模的AI模型,也為AI應用加速落地開辟了新路徑。”

      英特爾中國數據中心和人工智能集團至強客戶解決方案事業部總經理李亞東表示:“最新上市的第五代英特爾至強? 可擴展處理器每個內核均內置 AI 加速功能,完全有能力處理要求嚴苛的 AI 工作負載。與上代相比,其AI訓練性能提升多達 29%,AI推理能力提升高達 42%。我們希望借由阿里云第八代企業級實例(ECS g8i)共同助力開發者實現技術普惠,讓 AI 技術無處不在。”

      通用算力再提升,整機性能提升85%

      作為企業級通用計算實例,ECS g8i實例在計算、存儲、網絡和安全等能力得到了全方位提升。

      據雷峰網(公眾號:雷峰網)了解,從關鍵參數上看,ECS g8i實例的L3緩存容量提升到320MB,內存速率高達5600MT/s,整機性能提升85%,單核性能提升25%;存儲方面,ESSD云盤提供100萬 IOPS,全面搭載NVMe,存儲延遲低至百微秒;網絡方面,PPS高達3000萬,標配阿里云自研eRDMA大規模加速能力,時延低至8微秒;安全方面,ECS g8i實例支持可信計算與加密計算等特性,全球率先支持機密虛擬機TDX技術,構建了全面的安全防護。

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      在E2E場景下,ECS g8i實例可將MySQL性能提升最高達60%,Redis和Nginx的性能分別提升40%和24%,面向游戲、視頻直播、電商、金融、醫療、企業服務等行業提供強勁的算力支持,滿足其在數據庫、大數據、AI推理等應用場景下對性能的嚴苛要求。

      此外,ECS g8i實例還提供了多種硬件原生加速能力,包括QAT和IAA等加速器。阿里云通過自研技術,將硬件加速能力更細顆粒度透傳至實例虛擬機,小規格的ECS g8i實例也同樣具備加速能力。其中,依托于QAT原生加解密加速器,ECS g8i實例在壓縮/解壓縮場景下性能最大可提升70倍,加解密性能提升4倍以上。

      為AI提速,可支撐72B參數的大語言模型

      生成式AI掀起的技術革命,正在推動計算范式發生根本性的變化。當前,AI大模型推理在算力上依然面臨諸多挑戰,例如首包延遲受限于并行處理能力與浮點運算能力,吞吐性能則受限于內存帶寬和網絡延遲。

      阿里云ECS g8i實例針對這些難題都進行了相當程度的優化,包括內置指令集從AVX512升級到了Intel  AMX高級矩陣擴展加速技術,可讓生成式AI更快地運行。

      據雷峰網了解,相對于AVX512指令集,啟用AMX AI加速后,ECS g8i 實例在int 8矩陣計算的性能最高提升7倍。

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      基于AMX AI加速能力,g8i可更迅速地響應中小規模參數模型,運行知識檢索、問答系統及摘要生成等AI工作負載時,起建成本相比A10 GPU云服務器下降50%。此外,配合阿里云平臺的Spot搶占式實例,成本優勢將進一步凸顯,進一步降低AI推理成本。

      與此同時,基于自研eRDMA超低延時彈性網絡,阿里云g8i實例集群擁有超低延時網絡和高彈性優勢,可輕松支撐72B參數級別的大語言模型分布式推理,推理性能隨集群規模接近線性加速,并可支持超過32batchsize的超大參數規模的AI模型負載,運行文生圖、AI生成代碼、虛擬助手以及創意輔助工具等AI工作負載。

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      以阿里云通義千問開源的Qwen-72B大模型為例,可在g8i實例eRDMA網絡構建的集群實現高效運行,在輸入小于500字情況下,首包延時小于3秒,每秒可生成7個Token。

       為安全加碼,助力企業構建可信AI應用

      安全方面,阿里云在全產品線構建了端到端的安全防護,可保障數據存儲、數據傳輸、數據計算的全流程安全。

      在最底層,基于CIPU的安全架構搭載安全芯片TPM作為硬件可信根,實現服務器的可信啟動,確保零篡改;虛擬化層面,支持虛擬可信能力vTPM,提供實例啟動過程核心組件的校驗能力;在實例可信的基礎上支持不同平臺的機密計算能力,實現了運行態的內存數據隔離和加密的保護。

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      值得一提的是,此次升級的ECS g8i實例全量支持Trust Domain Extension TDX 技術能力,業務應用無需更改,即可部署到 TEE 之中,極大降低了技術門檻,并以極低的性能損耗為大模型等AI應用提供隱私增強算力,護航大模型的云上數據安全。 

      阿里云第八代企業級實例g8i算力升級,整機性能提升85%,AI推理最高提速7倍

      以Qwen-Chat-7B模型為例,啟用TDX后,既確保了模型推理的安全可信,也保護了數據的機密性和完整性。

      “阿里云將不斷深耕技術、持續產品創新,為企業提供更加穩定、強大、安全、彈性的計算服務,推動各行業的AI應用進入全量爆發時代。”張獻濤表示。


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 福利在线视频导航| 亚洲亚洲人成综合网络| 亚洲精品a| 伊人久久综合| 国产九九免费视频| 日韩亚洲精品一卡二卡| 国产偷自视频区视频| 亚洲av日韩aⅴ永久无码| 香蕉av福利精品导航| 莱芜市| 无码人妻精品一区二区三区不卡 | 国产精品久久无码一区| 野花社区日本免费图片| 日韩精品中文字幕无码一区| 四虎www永久在线精品| 亚洲av鲁丝一区二区三区黄| 国产狂喷潮在线观看| 熟女人妻AV| 精品欧美一区二区三区久久久 | 久久精品国产曰本波多野结衣| 国产线播放免费人成视频播放| 在线播放无码后入内射少妇| yy19影院| 欧美情侣性视频| 东京热加勒比久久综合| 人人妻人人躁人人DVD| 成人自拍中文字幕| 人妻 色综合网站| 亚洲第一无码专区天堂| 五月天天天综合精品无码| 丝袜人妖av在线一区二区| 国产精品天堂avav在线| 日韩精品无码中文字幕一区二区| 国产精品av在线一区二区三区| 99久无码中文字幕一本久道 | 亚洲天堂人妻| 亚洲中文字幕AV| 国外少妇视频网站| 亚洲中文字幕AV在线| 97人妻碰碰中文无码久热丝袜| 久久精品日日躁夜夜躁|