0
自2015年左右AI熱潮從學術界轉向產業界,在近6年的時間里,AI已經越來越多地應用到各個領域,但在實際落地的過程中也遇到了各種挑戰,這也導致了過去三兩年間,整個業界對于AI的關注弱了很多。
如何實現AI的規?;l展?英特爾研究院副總裁、英特爾中國研究院院長宋繼強認為,AI產業創新已經到深水區,要更深入地理解如何利用基于數據驅動的人工智能帶來的福利,把產業規模化擴展作為重要發力點。垂直整合、應用驅動是真正可以讓AI把算法創新、硬件創新落到實處,并且是形成一個迭代的滾動放大效應的必由之路。
英特爾院士、大數據技術全球首席技術官、大數據分析和人工智能創新院院長戴金權也向雷鋒網表示,AI的落地是一個系統工程,AI的數據和模型在不斷更新,在落地過程中總是解決一個問題才會有新的問題,解決了關鍵問題才能實現價值。
先數據,再AI
AI的發展需要算力、算法、數據三大要素。宋繼強認為,這一波的AI熱潮是由數據驅動的。他在WAIC 2021的演講中指出:“從量的角度,大量的數據由原來靠人產生,變成由終端、自主設備產生。從質的角度,很多數據不再是結構化數據,也不再是人可以根據固定的數據結構產出,然后用編程去處理,必須依靠AI算法去處理。”

戴金權進一步從大數據的角度說明了為什么業界需要AI。從2006年處理大數據集的Hadoop開源,業界最早關心的是如何存儲處理更多的數據。這個問題后,下一個問題是分析數據,再之后的關注點是數據實時分析。
發展到今天,關注的重點變成了如何在數據上建模、做預測,通過機器學習、深度學習等指導決策或預測未來的趨勢。所以,大數據AI軟件平臺成為了解決大數據發展的關鍵。
“經過過去十多年數據的積累,許多企業在數據的架構,以及數據平臺上已經積累了一定的能力和數據資產。這時候,他們在現實場景有非常多的應用需求要提升效率,更好的AI軟硬件平臺能夠幫助他們提升效率,所以越來越多的公司開始使用大數據AI。”戴金權表示。
但AI的應用面臨重重挑戰,第一個問題是否有數據,以及數據是否有標簽。有了數據,需要明確要解決的問題。但這還不夠,在這個基礎上,要做一個實際落地的項目,需要把算法和大數據系統打通。
“很多時候,算法和大數據系統其實是割裂的,只有解決割裂的問題,才能構建出端到端的模型。還有,日常運行的過程中,不斷會有數據和模型的更新。”戴金權指出。
“實現AI的必由之路就是超異構計算,也就是英特爾一直提的XPU戰略,用不同的架構處理不同類型的數據,根據處理速度的要求、帶寬的要求去優化。”宋繼強表示。
那什么是超異構?異構是一個很早的概念,如今已經比較常見的SoC就是一個異構的系統,包含CPU、GPU、DSP等IP。還有一種常見的異構是板級異構,將CPU、GPU、FPGA等集成到一塊電路板上。
“超異構計算是要體現出它是‘下一個等級’。在一個異構系統中,許多人都忽略了軟件層,但事實證明如果軟件層沒有優化好,底層的硬件再強大也意義不大。所以超異構的‘超‘意思是要把封裝能力考慮進去,同時要考慮軟件?!彼卫^強解釋。

硬件超異構
在這一輪的AI浪潮中,可以看到算法不斷驅動硬件性能的提升,有時甚至成為AI快速提升的阻力。此時,已有處理器性能的提升和計算架構的創新都非常關鍵。CPU是英特爾的看家本領,為了滿足AI的需求,英特爾的CPU也采用了異構的方式,在至強處理器中加入了專門的深度學習加速器件,還有可擴展的一些配置。集成AI的至強處理器讓通用服務器性能已經提升了46%,AI性能提升了74%。
創新的計算架構能夠滿足更高的AI需求,比如神經擬態計算,也叫類腦計算。神經擬態計算最大的優勢是能效比,比如原來可能需要兩千瓦的電才能處理的任務,使用神經擬態計算芯片只需要幾十毫瓦或者幾百毫瓦,整體的效率是現在深度學習加速芯片的1000倍,符合綠色可持續發展的需求。
但傳統以及新型處理器的計算能力提升后,隨之而來的是更多的數據交互,包括處理器之間以及跨服務器節點。此時,I/O就成為瓶頸,這種瓶頸包括尺寸和功耗。
“我們認為光是替代銅的非常好的互連的介質,但光器件體積比較大,光電轉換也比較困難,效率不高。英特爾從幾個方面解決這個問題,首先是把光器件與電器件緊密的封裝在一起,讓它們靠近,減少兩端轉換的損耗;其次是制作收發器,以更小的模式放到服務器當中?!彼卫^強表示。
計算和I/O的問題解決之后,要實現不同類型的處理器、存儲器件的異構集成,就需要先進封裝技術。在這一技術領域,英特爾有EMIB 2.5D的封裝技術。用一個形象的比喻解釋這種技術,就像在兩個平房間去嵌入下水管道將它們連通起來。
“如果想更好地利用三維空間,就可以在多層上把計算的晶圓互連。英特爾的Foveros 3D封裝技術的優勢是可以實現計算晶圓間的互連,而不只是在計算的晶圓和存儲晶圓之間互連,可以讓很多新的芯片很好地進行互連,包括英特爾最新架構的類腦芯片也可以和傳統的CPU、GPU互相組合?!彼卫^強指出。
硬件實現了異構,還需要軟件發揮異構硬件的優勢,才能實現超異構。對于現在的軟件開發者來說,大都只熟悉CPU、GPU或FPGA的開發模式,硬件的異構集成,讓開發者很難發揮XPU的硬件優勢。
宋繼強介紹,英特爾的方案是,聯合企業合作伙伴一起推出了開放的軟件平臺oneAPI,這個平臺是一個開放的產業聯盟,有四五十家企業和大學都在聯盟里。軟件開發者來只需要學習Python或者是只學C++,通過oneAPI就可以利用到異構集成的優勢,M種硬件和N種性能庫和結合將會是M乘以N的倍數提升。如果未來硬件升級替代,軟件也只需要少量的改動就可以發揮硬件升級帶來的提升。

AI方案垂直整合
對于企業來說,如何利用兩個割裂集群的工作流,實現效率的提升是非常大的問題。“我們希望通過Analytics Zoo,把一個割離的架構或者是割離的工作流統一在一起。有了統一的大數據AI集群,就可以在集群上直接處理數據倉庫中的數據,然后進行大規模分布式數據處理,在這個基礎上運行各種AI算法?!贝鹘饳嗾f。
實際上,英特爾2018年推出開源軟件Analytics Zoo的第一個版本時,要解決的是如何在大數據平臺上把深度學習的算法無縫的進行分布式擴展,這時候BigDL、OCR都可以用于解決這一問題。
“當用戶需要把AI落地時,解決了擴展的問題之后,如何更加自動化、更高效地處理數據和建模,需要AutoML的支持。比如一些時間序列分析,可以利用AutoML,實現從數據的處理,包括產生的特征,特征選取,再到模型選取,模型參數調整的端到端平臺?!贝鹘饳嘟榻B。
韓國最大電信公司SK電訊就通過與英特爾的合作,就是通過時間序列分析,垂直整合實現效率提升的典型例子。SK電訊需要對4G、5G基站進行網絡質量的監控、預測、報警燈工作,而一個城市中可能有幾十萬甚至更多基站,借助人工顯然不能實現很好地監控。為此,SK電訊使用Analytics Zoo構建了一個時間序列的處理分析,將數據處理,深度學習的訓練、推理、使用構建了一個統一的流水線,運行在統一的大數據Spark集群上。
“構建這樣一個端到端的流水線,帶來了非常大的端到端的性能提升。AI推理的性能有3倍以上的提升,AI訓練有差不多30%-50%的性能提升。”戴金權說。

其實,英特爾子公司Mobileye也是通過垂直整合發揮AI價值的一個典型例子。Mobileye主要做自動駕駛的ADAS系統,原來只做計算機視覺的算法,整合芯片提供后裝ADAS設備。如今,Mobileye已經發展出垂直整合的一套方案,包含定制的、專門架構的數據系統,有不同的計算架構,也有一些新的傳感器。
通過與全球100多家車廠的合作,垂直整合的方案利用足夠的數據后,能夠對這些信息做抽象歸納,利用很小的數據量但可以進行很好地輔助駕駛決策。
“我們在底層水平功能的基礎上構建非常多針對更多垂直場景的支持,幫助用戶來更容易、更快地去搭建應用,包括AutoML的場景,針對時間序列分析的場景,還有PPML(Privacy Preserving Machine Learning)針對隱私保護的場景?!贝鹘饳噙M一步解釋關于AI的隱私保護。
“隱私保護無論是從個人需求還是合規的角度,都是AI應用的一個痛點。不同的安全需求和不同的安全路線。英特爾通過SGX,在CPU中有內置的安全功能,在此之上通過軟件安全技術提供大數據AI安全平臺實現不同的場景支持?!?/p>
聯邦學習的方式面向的主要場景是希望數據不出企業的防火墻。可信平臺的技術是利用軟硬件的技術提供安全保護,讓數據不管在計算、存儲網絡中,都能在公有云或者私有云中提供安全保護。
不過,垂直整合去推動AI的規?;l展依舊有許多挑戰。宋繼強告訴雷鋒網,“垂直整合的挑戰首先要能夠接觸到多種資源、數據,以及實際應用場景。其次,要有跨層的專家參與其中,既要有算法、硬件設計通用能力的專家,也要有領域相關的專家來協同。最后,產品要經得起市場檢驗,一個原型系統肯定不行?!?/strong>
小結
目前看來,AI在推薦、自然語言處理、視覺領域都有非常多的應用。之前互聯網公司由于有更多的數據,在利用大數據AI構建場景方面的速度更快,但隨著大數據AI的發展,越來越多的傳統企業都更多地應用AI,包括電信、銀行、制造業、餐飲業等等。
戴金權說:“關鍵還是看企業有沒有數據,以及軟硬件架構平臺,并且在平臺上構建一個非常好的應用場景。AI會無處無在,英特爾有能力實現這一愿景?!?/strong>
宋繼強則強調,AI創新要真正的規?;l展起來,一定要很認真嚴肅地做垂直整合。雷鋒網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。