0
本周二,成立近四年的天數智芯召開名為數應于“芯“的戰略新品發布會,并發布首款AI芯片Iluvatar CoreX I,這款面向邊緣AI推理的芯片具備高精度特性,峰值算力的能效比主流競品提升10倍,應用遷移僅需1-2周(其它芯片需1-3個月),并且是工業級的解決方案。這些技術和性能特色顯然具有很大吸引力,但天數智芯將帶來的改變,不僅來自于硬件。
天數智芯創始人兼CEO李云鵬在發布會上表示,“硬件芯片是一個傳統行業,它的生命周期要求相當的長,我們不僅僅要支持今天火熱以AI為代表的數據驅動應用,也要承載過去長期商務智能等大規模需求,還要應用未來可能發生的算法變化,提供通用性的算力支撐,這是天數智芯產品戰略,軟硬件結合系統產品。”事實上,在技術與產業的融合方面,該方案目前已經得到醫療、安防監控等行業客戶的實際應用,實現了技術的商業化落地。

首款AI芯片的5大亮點
與大多數公司一樣,天數智芯推出AI芯片為的就是滿足數據時代的需求,有所不同的是,天數智芯對于邊緣端AI芯片的理解。天數智芯副總裁梁斌在新品發布會上表示:“我們發現目前邊緣端芯片產品解決方案有四大痛點:第一、大部分產品聚焦于低精度、低功耗、低算力的應用場景,為了追求性價比,在一定程度上犧牲了對精度的要求;第二、大部分AI芯片產品聚焦在消費級產品,不能適應一些工業級的產品要求;第三、由于大部分芯片產品采用自研的硬件架構,通過軟件編譯工具跟主流的框架兼容,造成現有的應用遷移成本很高,耗時耗力;第四、由于芯片的自研架構和自研的開發系統,造成用戶開發門檻高,有很多的端到端需求無法滿足。”

針對這些痛點,天數智芯提出了新的解決方案,Iluvatar CoreX I芯片采用16nm工藝,采用全自研數據流架構,內核可提供32路數據并行處理的能力,有很好的可擴展性,具有五大亮點:
第一,提供FP16的高精度,提升準確率;
第二,在小于5瓦的功耗下,提供單芯片最高4.8TFlops的算力,和每秒1000幀的圖像處理能力;
第三:提供原生TensorFlow的兼容,可透明遷移;
第四:可以滿足高穩定性的工業級需求,也可以滿足高性價比的消費級需求;
第五:提供一站式、端到端的完整解決方案,對于開發用戶,提供軟硬件結合的開發環境。
Iluvatar CoreX I在芯片層面體現出了5大亮點,系統層級則有CPU靈活性和算力可擴展兩大特性,所謂CPU的靈活性,是CoreX I AI加速芯片可以適配x86 CPU、Arm CPU以及國產自研CPU,比如龍芯CPU。可擴展性指的則是與PCIE 4.0充分融合,通過單卡、雙卡、四卡的配置,可以有效線性擴展算力,并保持延時的可控。據悉,在8卡配置,單機可提供超過38TFLOPS的算力。


能效比與應用透明遷移有多重要?
梁斌指出,通過對主流算法的優化,基于數據流的高能效運算,高帶寬、高容量的本地內存,Iluvatar CoreX I有效解決了目前主流競品計算力不足的核心問題。根據梁斌給出的數據,目前市面上15瓦的AI芯片,提供1.5TFLops的算力,能效比大概是0.1,天數智芯Iluvatar CoreX I在低于4.7瓦的功耗下,就提供4.8TFLOPS的計算力,相比主流競品,提供超過十倍的能效比。

在主流的邊緣端應用的基準測試實測中,物體分類場景天數智芯提供超過兩倍的性能提升,能效方面提供超過8倍的提升,在物體識別場景也提供了接近兩倍的性能提升和接近7倍的能效提升。

不過,李云鵬在接受雷鋒網等媒體采訪時表示,客戶對算力的需求是能夠對過去、現在和未來的負載都有很好的支撐。“從我的經驗來看,用戶看的并不是峰值數據,他們更看重實際場景中的性能提升。因此,雖然我們的能效比數據讓大家眼前一亮,但我們更關注用戶的使用。這就包括上面提到的CPU靈活性與可擴展性,當然也還有透明遷移。所謂透明遷移是上層建筑不做任何修改,通過軟件的方式能夠有一個延續性。”

天數智芯創始人、CEO李云鵬
梁斌介紹,通常AI應用包括幾個方面,從底層往上涉及到芯片、軟件庫、TensorFlow運算符,TensorFlow API函數,天數智芯通過與成熟的開發生態系統原生兼容,客戶可以無需任何代碼改動,實現應用的遷移,平均平臺的適配周期1-2周。而市面上第三方的AI芯片產品,大部分芯片產品基于底層軟件庫和自研開發編譯器SDK,客戶的應用通過耗時耗力的代碼轉換,適配周期大多耗時1-3個月甚至更長。
為了更好的滿足客戶需求,天數智芯基于全新AI芯片提供的是邊緣計算系統板和PCIe加速卡兩大方案。雷鋒網了解到,邊緣計算系統板主要面向嵌入式一體解決方案應用在邊緣端的應用場景,比如智能垃圾分類、智能零售、智能監控等。PCIe邊緣端加速卡可以直接配置在邊緣服務器上,單卡配置可以支持一顆芯片,也可以支持兩顆、四顆芯片。

還需指出的是,天數智芯也布局了邊緣端、邊緣云、中心云三個系列的芯片,同樣為了更好滿足AI和5G的需求。梁斌透露:“我們下一款將發布的芯片是高端云端訓練GPGPU芯片,基于7納米工藝,采用全自研GPGPU芯片架構,提供業界最高檔混合精度算力,CUDA原生兼容。第三款將要發布的芯片是中端GPGPU芯片,也將采用先進的工藝制程,提供混合精度算力,CUDA原生兼容,同樣也是全自研的GPGPU架構,聚焦在圖形圖像的邊緣云推理場景。”

軟硬一體化將帶來的變革

天數智芯副總裁梁斌
從軟件角度看,天數智芯已經推出了四代SkyDiscovery,這是一款一站式人工智能軟件平臺,提供一站式服務平臺,提供數據集成,智能數據存儲,模型評估服務部署的一站式服務。SkyDiscovery的作用是銜接開源生態,這個工具可以讓開源生態中各種各樣的應用實現無縫遷移,并且讓已有開源的整套系統解決方案更加可擴展、高可用、可靠、高性能
但這種生態的銜接是否也會讓客戶更容易離開?李云鵬表示,我們在銜接開源生態以后,還會根據客戶的需求,提供一些專用的支持,這一旦做了,它要挪走是有難度的,這也是所有企業級產品公司的必由之路。
從算力的角度,這個平臺要為數據應用程序提供接口樞紐。天數智芯要做的是通用架構處理器,支持所有通用型的并行計算。未來,隨著市場逐漸成熟,可以把AI融合進架構之中。李云鵬透露,天數智芯在芯片架構設計上花了接近一年時間,但具體到一款新品從確定指標到設計和流片只用了不到四個月時間。
顯然,軟硬件天數智芯突出的是標準通用。李云鵬表示:“我們也很難預測三、五年后會是什么樣的算法,以及什么是最有效的提取數據價值的方式。但我們做到了通用性,確保未來也能使用,讓一款芯片能夠有10年、20甚至30年的生命周期。”
李云鵬還表示,我希望花20年時間,把我們的自主知識產權芯片和軟件做到國際一流的入門水平。這也就意味著天數智芯在做一件大事,然而大事就是難事。
就目前而言,天數智芯提供的是軟件和硬件進行融合的邊緣計算系統板卡和PCIe加速卡。李云鵬表示,中國客戶的特征是要解決方案。正是因為在芯片之上,還通過軟件的方式累加了新的價值,從商業上來說也價值更高。
據了解,天數智芯軟硬件結合的方案已經得到醫療、安防監控等行業客戶的實際應用,未來將會在智能制造、智慧新零售、智慧醫療、智慧園區、智能垃圾分類等多個行業及領域應用。發布會現場天數智芯也展示了軟硬件產品在藥品識別、垃圾分類、人臉識別的應用。
不過,李云鵬希望的是與更多合作伙伴一起在石油、天然氣開采、運輸行業、風電為代表的新能源行業,以及船舶制造等大型裝備制造行業,推廣智能化解決方案,最終推動智能制造產業互聯網的發展。

李云鵬也透露,天數智芯剛剛開完務虛會,公司希望三年左右時間實現在中國整個工業制造領域構建一個基于天數智芯的工業互聯網產業聯盟。我們也希望在三年左右時間,能夠不僅僅盈虧平衡,而且能夠有足夠的利潤擴充自己的基礎投入團隊,能夠讓我們有機地發展20年,把自己的產品做到國際一流的入門水平,我覺得這是一個基礎性質的。
雷鋒網小結
兩次采訪李云鵬,每次能夠感受到他的情懷以及清晰而明確的目標。從2015年創立之初就把公司的目標設立為谷歌那樣的系統公司,以高大上公司不愿意做軟件和IT服務開始,獲得用戶和營收,經歷野蠻的生長之后走向芯片的自研。如今AI芯片的發布意味著芯云戰略的落地,也是天數智芯展現軟硬一體優勢新的開始。
這也與發布會地點的選擇的初衷相契合。天數智芯總部位于南京,卻選擇在杭州舉辦發布會,李云鵬說,1949年新中國成立,五年之后毛主席在西子湖畔國賓館內撰寫了我們國家第一部憲法,代表著新中國邁向了新的起點。天數智芯經歷了初創期的懵懂、野蠻生長和碰壁,走過了一條完整的初創型閉環。他表示,之所以選擇在杭州西子湖畔開發布會,是希望天數智芯和它的祖國一樣,站到一個可期的新起點。
相關文章:
終于,有家AI云端芯片初創公司不對標英偉達卻要與Google競爭
天數智芯李云鵬:數據驅動的春天即將來臨 | CCF-GAIR 2019
集產品、方案和云服務為一體,天數智芯如何做到“AI時代芯魂合一”
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。