0
自2022年底以來,ChatGPT引發了一波AI熱潮,大模型經歷了半年的快速發展,競爭已進入激烈階段。
關于大型模型的發展和認知,業界已經沒了早期的陌生感,研究逐漸深入到企業的技術和應用領域。
然而,到目前為止,我們鮮見全面深入的大模型研究報告。
今天,國際數據公司IDC發布了一份《AI 大模型技術能力評估報告》,主要評估了國內14家主流企業的大模型平臺,這也是大模型方向的首份權威評估報告。
該報告主要評估方向是:A.能力、B.服務、C.行業三個大維度,并且詳盡的對9家大模型進行了打分。
近日,國際數據公司IDC發布了首份《AI 大模型技術能力評估報告》(下稱《報告》),主要圍繞能力、服務能力以及行業覆蓋情況三個主要維度。
從三大維度的評分分布來看,該報告至少展示了以下3個結果:
1.大廠是選手,競爭錙銖必較。百度文心大模型、阿里通義千問分數遙遙領先其他,其中百度文心大模型靠著獨占算法模型、行業覆蓋兩點滿分,在這次評比中勝過一籌,成為該報告的大優勢方。2.AI廠家是玩家,做透垂直行業有機會。第四范式、科大訊飛雖然在個別點上也拿到了滿分,但整體分數落后百度、阿里。
3.其他廠雖然也很努力,單從該報告評分來看,確實前途遙遠。
以下,是雷峰網對這份報告的具體解讀。
一、關口拼產品,先發大廠大領先,AI公司有機會
作為大模型的基礎關口,產品能力是服務和行業落地的基礎,對企業而言顯得至關重要。
IDC將產品維度進一步細分為算法模型、通用能力、創新能力、平臺能力和安全可解釋五方面,百度是所評估企業中綜合評分最高的企業,除安全可解釋層面獲得4分(滿分5分)外,其余各項均為滿分;阿里稍遜一籌,在算法模型和安全可解釋層面均拿到4分。
其中,算法模型作為大模型的核心能力,是各大企業角逐的焦點之一。如果我們稍微對行業有些了解,就會明白百度為什么在算法模型層面拿到滿分。
正如IDC在報告中所說,整體還是源于百度在人工智能領域長期的技術積累,百度AI大模型在整體競爭力位于領先水平。而這其中,算法模型無疑是最核心的能力。
在大模型成為行業焦點,百度在AI領域布局十余年,如今眾所周知的文心大模型百度也早已研發多年并在2019年發布。簡言之,百度的算法優勢是基于百度的先發優勢和長期積累:百度具有“芯片-框架-模型-應用”四層技術棧完整布局的獨特優勢:芯片層-昆侖芯、框架層-飛槳、模型層-文心大模型,以及各種AI的落地應用,其中百度自研的深度學習平臺飛槳在大模型的高效訓練和推理上提供了強有力的支撐。
從實際的模型效果和迭代速度來看,作為國內率先推出的預訓練語言大模型,文心一言集知識增強、檢索增強、對話增強技術創新于一體,效果可圈可點。雷峰網了解到,目前,文心大模型已經升級到3.5版本,訓練速度比之前提升2倍,推理速度更是提升了30倍,核心場景推理性能提高50倍,模型效果累計提升超過50%。
IDC報告中,安全可解釋這個維度9家大模型廠商均沒能拿到滿分。雷峰網猜測,這主要有兩方面原因:一方面,基于多方面因素考慮,企業不能對外完全暴露自身的安全能力;另一方面,大模型目前尚處于發展階段,業內還未制定出一套權威的安全標準。
從這個角度看,IDC能夠在安全可解釋緯度上給予百度4分的評估已經充分表現出其對于百度安全能力的認可。不難理解,這得益于百度在搜索等業務在安全領域長年的錘煉與積累。作為對比,阿里在這一維度拿到的分數同樣是4分。
IDC報告本次評估的14家企業,既包括阿里、百度大廠玩家,還包括智譜AI、科大訊飛、第四范式等AI公司。可以看到,在產品維度上,百度的文心大模型在算法模型上依托先發優勢和技術領先性,顯現出明顯的領先優勢。
二、賽點拼服務:老牌服務大廠勝過一籌
產品是基礎,服務是重點。
IDC將服務維度細化為「服務能力」和「生態合作」兩個主要方面,前者主要包括為開發者提供的配套服務、對客戶的理解力等;后者則不僅包括合作伙伴的數量,也包括結構分布、生態支持等。
在生態合作上,百度和阿里均得到滿分。在行業印象中,阿里的生態肯定是優于百度的,因為阿里云的市場規模比百度智能云大很多。但是大模型時代,百度能在生態上打平手,一方面體現了,百度不僅布局大模型產品本身,也提前大力發展生態伙伴。另一方面也說明了,大模型時代下的生態也面臨著大洗牌,會在很大程度上區別于傳統云計算的服務生態,才給了百度機會。
從近期動作,也不難看出百度正在不斷拓展生態,賦能生態伙伴大模型能力。雷峰網(公眾號:雷峰網)了解到,近期,百度已經開始為生態合作伙伴免費提供文心千帆大模型訓練等相關培訓工作,通過一系列的培訓課程,手把手為客戶講解如何基于自身業務場景做相關訓練。這種培訓精細到什么程度呢?從導數據到訓練模型,臺上的講者幾乎是從打開文心千帆后臺開始,一步一步教給客戶。有參與培訓的人士表示,到現在為止,國內已經發布了近百個大模型,給人感受確實是有些混亂。而百度,是國內第一家為客戶提供如此精細化服務的企業。
在服務能力方面,阿里基于過去深厚積累的客戶服務經驗拿到5分。曾經在云領域落后于阿里的百度,在大模型時代不甘示弱。在文心一言發布半個月后,便推出了大模型服務平臺「文心千帆」——全球首個一站式的企業級大模型生產平臺,不但為客戶提供包括文心一言在內的大模型服務及第三方大模型服務,還提供大模型開發和應用的整套工具鏈。
三、終點拼行業,百度在行業覆蓋上優勢大
無論是產品維度,還是服務能力,企業研發大模型的最終目的還是要落地于產業實踐,這也就是IDC評估的第三個重要維度:行業覆蓋。
綜合來看,各家企業都依托于自身優勢在部分垂直行業取得一定分數,但百度和阿里再次成為業內的領先企業,是少有的能夠在部分行業拿到滿分的企業。百度文心大模型領先優勢明顯,在綜合指標行業覆蓋上拿下唯一的滿分。
此外,從垂直行業來看,阿里在電商領域拿到5分毫不意外,而百度在能源和整體行業覆蓋度兩個層面均拿到5分,超出預期。此外,科大訊飛在教育領域拿到5分,其他家再也沒有滿分選手。
百度能在大模型行業覆蓋上拿到唯一的滿分,無疑仍然與其先發優勢關系密切。從文心大模型出發,百度已經在能源、汽車、政務、交通、金融等重點領域布局11個行業大模型,將大模型融入到垂直領域,真正做到產業實踐和商業落地。
而在能源領域能拿到滿分也是基于過去百度的先發布局:早在一年前,全球最大的公用事業企業--國家電網有限公司,就與百度聯合發布了電力行業文心大模型。面向復雜電網的專業場景,基于百度文心大模型,百度與智研院聯合訓練電力行業大模型,在電網設備、客服等實際業務場景進行試點驗證,可以顯著增強電網運營的精細化、自動化、智能化水平。百度也和深圳燃氣聯合發布了燃氣行業大模型,破解燃氣企業運營場景繁雜、安全風險識別困難等難題。
百度在能源領域的落地還不至于電力。2022年12月,百度攜手深圳燃氣發布“深燃-百度·文心”行業大模型,針對燃氣行業中槽車作業、園區生產等場景存在安全隱患的痛點,通過大模型的技術支持,確保工作人員進行安全作業,消除安全隱患,助力燃氣行業智能化升級。
智慧政務方面,百度智能云為大連市打造“一網統管”的運行指揮中心,匯聚全市6.7億條數據,將城市綜合態勢、政務服務、民生服務、城市交通等6大方面的城市運行信息呈現在1個屏幕上,幫助城市管理者實現一屏知全城。此外,在北京,基于文心大模型,百度智能云和海淀區政府正在聯合測試城市智慧平臺的交互式場景,例如,直接問“上個月海淀區12345熱線的處置情況如何?”,就能自動生成分析報表并回答。
在交通領域,百度通過大模型技術為北京亦莊打造的智能交通解決方案,可根據車流量自動調節紅綠燈,從而緩解擁堵。
6月份的世界互聯網大會數字文明尼山對話中,百度創始人李彥宏分享了亦莊智能交通的一個成果:今年五一期間,民眾出游熱情高漲,假期前最后一個工作日,北京城市擁堵指數暴增2.5倍。但在亦莊,得益于部署AI全域信控方案,車流量同樣明顯增加的情況,300多個智能路口能根據車流量自動調節紅綠燈。亦莊也因此成為當時北京不堵車的唯一“綠洲”。
據悉,亦莊的這一智能交通解決方案已經被69個城市采用,能夠將通行效率提升15%-30%,拉動GDP2.4%-4.8%的增長。
“大模型帶來的產業智能化變革已經勢不可擋,現在我們唯一要做的,就是趕快行動起來。”這是百度智能云事業群總裁沈抖做出的判斷,也正逐漸成為業界的共識。
作為國內最早發布預訓練語言大模型文心一言的互聯網大廠,百度在產業落地上亦不遑多讓。IDC在報告中指出,百度文心大模型形成了支撐大模型產業落地的關鍵路徑:在模型層,文心大模型包含數30多個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求。
結語
通覽IDC報告可知,大模型賽道里,大廠優勢雖然大,但競爭更大,廝殺也更激烈。當然,IDC報告對大廠都給予高度評價的同時,但也指出了大廠所面臨的挑戰:作為領先廠商,大廠應更注重模型的可解釋性,并承擔更多技術與行業發展的責任。
百度文心大模型之所以這次評分領先,主要是在算法模型、行業覆蓋兩個方面獨家獲了滿分,這與其先發優勢密切相關。
在雷峰網看來,行業覆蓋這點上的滿分更加值得業界重點關注。這意味著,百度文心大模型在探索大模型應用落地方面已經處于前沿地位。
現在,國內已經有了一百多家大模型公司。對于頭部玩家來說,這已經不再是純粹拼參數、拼算法的階段,大家最終要拼的是誰先獲得足夠市場,誰先形成“市場-資金-技術-市場”的增長飛輪。
因為技術終將趨于平衡,企業間的最終競爭目標是行業滲透率和市場份額。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。