0
| 本文作者: 任然 | 2018-07-24 17:13 | 專題:2018 CCF-GAIR 全球人工智能與機器人峰會 |
雷鋒網按:2018全球人工智能與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了寶安區政府的大力指導,是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智能領域最具實力的跨界交流合作平臺。
7月1日下午的AI芯片專場大咖云集,圓桌討論環節,深圳鯤云信息科技有限公司創始人兼CEO牛昕宇、天數智芯創始人兼CEO李云鵬、NovuMind中國區總裁周斌、AVSdsp CEO沈聯杰四位來自AI芯片領域的重磅嘉賓,在華登國際投資總監蘇東的主持下,就“中國芯的新機會:AI芯片如何實現彎道超車”這一話題展開交流。
圓桌討論結束后,雷鋒網就相關問題對NovuMind中國區總裁周斌進行采訪。

在圓桌討論中周斌曾提到,大概3~5年后,在有限場景、受限場景的自動駕駛會成為比較現實的事情。
然而據雷鋒網觀察,眼下有一些面向自動駕駛領域的AI芯片,其規格往往集中在功耗15~30瓦、算力30~40Tops這個區間內,號稱可實現L4級自動駕駛能力。并且在雷鋒網的觀察中,某些AI芯片公司在介紹其芯片性能時,只說每秒能處理多少幀畫面、每幅畫面包括多少對象,而對底層算力指標避而不談。
對于這種行為,周斌認為“就像某人只說自己能舉重100次一樣無聊,脫離杠鈴重量怎么能看出實際能力?就算要宣傳圖片和對象的處理速度,也要講清畫面分辨率、視角大小、識別距離、對象尺寸等相關參數,要么就老老實實亮出實際的算力有多少。”他表示,40Tops只能勝任L2.X級輔助駕駛(ADAS)系統,想實現L3.X級自動駕駛都是不夠的。
從雷鋒網了解的信息來看,L4級自動駕駛要求平均每10萬英里才需要一次人工干預,目前世界上還沒有任何自動駕駛系統能達到這個指標,即便目前表現最好的谷歌Waymo也只做到了平均5000英里一次人工干預,而特斯拉Autopilot在官方定義中只是L2.X級。
周斌根據目前的情況推算,L3.X級自動駕駛大約需要80Tops的算力,而L4級自動駕駛的門檻至少有100~200Tops之高。在NVIDIA的路線圖中,甚至使用了一套包含兩顆GV100 GPU、算力320Tops、功耗高達500瓦的平臺進行L4級自動駕駛的研發,高級別自動駕駛所需的算力指標之高可見一斑。
他表示,算力是支撐一切算法的硬指標,沒有任何捷徑可走。即便算法再怎么神奇,40Tops算力下所能做的事也是有上限的,“用十分之一功耗實現十倍性能”完全是天方夜譚。
NVIDIA自2006年推出G80架構以來,一直在不遺余力的推廣其CUDA通用計算平臺。時至今日CUDA已經非常成熟,形成了強大的生態系統,這也為NVIDIA擴展其它基于GPU的事業提供了先天便利。事實上,在AI大潮來臨后,NVIDIA確實在AI算法訓練上獲得了很大優勢。
NVIDIA的強大之處,身為中國唯一NVIDIA CUDA Fellow及NVIDIA DLI認證講師的周斌再清楚不過了。但他卻做起了反向思考:CUDA生態過去的強大,在面對AI運算的新任務時,是否能為其創造不可逾越的壁壘?
周斌認為答案是未必。在前不久的CCF-GAIR峰會上他曾講到,他親歷了深度學習的風口過程,在2008年利用CUDA做通用計算時就開始用一些不同的處理器架構來解決新的問題。那時他發現,新的深度學習架構對于新的數據模式、新的數據結構以及數據量,對GPU體系結構產生了非常大的挑戰。
AI芯片是處理AI任務的,任務在不斷的變化,其變化本質、數學模型是什么,哪些是變的、哪些是不變的,這是任何做AI芯片的公司必須首先認可領悟和理解的。芯片中哪些可以固定下來。卷積層是否存在?深度網絡的主流是什么,是CNN還是RNN?下一代Sparking能否用起來?只需要關注深度學習最核心、最本質的地方,剩下的都可以不管。
周斌稱,NovuMind并沒有發明新的芯片模式,而是在GPU的基礎上去掉了所有和深度學習無關的單元。這樣的設計既可以讓芯片高效進行深度學習計算,又避免了直接將算法固化成ASIC芯片應用范圍狹窄的問題。
全美達(Transmeta)Crusoe、Intel安騰(Itanium)、龍芯。
這些處理器的名字看起來毫不相干,之所以列出來,是因為它們之間有一個共同點:本身不是基于X86指令集,但可以通過Emulation技術兼容X86代碼。
近來,隨著“彎道超車”的聲浪越來越高,又有人開始鼓吹Emulation技術,認為這樣可以規避處理器架構方面的弱點,只需設計一個精簡且高效的計算內核,然后套上Emulation層不就計劃通了?
然而對于這種言論,周斌的看法非常簡單:“這一定是行不通的”。他表示,全美達Crusoe、Intel安騰和龍芯,在商業上都失敗了。這些使用了Emulation技術實現X86兼容的處理器,執行X86代碼時的效率都是極其低效的。
以Intel安騰處理器為例,其內核結構為VLIW超長指令字體系,在使用Intel御用Emulation層的情況下,運行X86代碼的效率也不過50%。即便是目前基于驍龍835/845平臺的Win10 PC,也依然沒能改變效率低下的老問題。
“芯片是個非常講究經驗積累和傳承的領域,架構設計不是一天兩天的問題。在大型應用領域,必須要在架構設計上下功夫。”周斌對雷鋒網說到,“現在鼓吹Emulation技術的人,都是想在架構研發上偷懶的人,想靠這個實現‘超車’純屬幻想。”
很多人都聽過“當風很強的時候,連火雞都能飛起來”這句洗腦名言,而在AI這個風口下,也的確有一些公司或團體,僅憑一句AI、一個口號就能拿到大筆融資。
作為旁觀者,我們不免擔心,在浮躁的資本市場中,這些濫竽充數者分流掉的資源會對那些務實的團隊造成怎樣的影響?
在周斌看來,投資是一個優化資源配置的過程,雖然在風口到來時,市場上不可避免的出現了許多投資泡沫,但所有項目都必須在市場上證明其價值,才能獲得成功。一些跟風的投資人,資金投到垃圾項目上,他們損失的將是真金白銀。
他認為,投融資應該是一個雙向選擇的過程,不管是市場成長期還是洗牌期,都是真正的大浪淘沙,把真正有價值、有核心技術、有成長性、有未來的公司選出來,資源會向這樣的公司聚集。“炒快錢的創業公司和投資人一定會被市場淘汰,只有真正能夠發覺價值并與公司互相認可的投資人,才能為公司帶來生命力。”
現在隨便弄幾個人說句AI、喊個口號就能拿到投資的事不存在了,在團隊和市場層面上,有扎實內容、能賺錢的公司反而成為市場的香餑餑,這個洗牌期會逼著洗牌人看清楚這家公司是否有價值。投資人們開始認認真真的看技術,他們關注處理器內核、做IP競調、做專利競調,這個趨勢非常喜人,投資將回歸到價值投資的本質,通過資本市場的力量促成技術到市場的轉化,從而共享收益。
相關文章:
中國芯的新機會:AI芯片如何實現彎道超車?|CCF-GAIR 2018
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。