0

作者丨史林
編輯丨董子博
2022年,剛剛試用了ChatGPT,黃偉的第一感覺是懵的。
和不少 AI 行業的同行一樣,看到已經有人把大模型做到了如此程度,黃偉有些惆悵:“就如同一個打了很多年馬蹄鐵的匠人,第一次見到汽車時的震撼——之前的優勢和積累,在這一次技術變革面前幾乎全部歸零。”
自創立云知聲,已有十年光景匆匆過去,這十年里苦練的武功,難道一朝就全部失效?
沉浸在這種沖擊里,黃偉有差不多一個星期的時間,沒緩過勁來。
但很快,這種焦慮,就轉化成了一種“亢奮”。在今天,不少人把這個時點稱作 AI 的“iPhone Moment”,但在黃偉看來,這樣的說法,未免顯得“野心太小”。
“十年前,我創業的時候,還沒有移動互聯網,也沒有深度學習,那時我也沒有商業化的背景和經驗——但今天我的心情,比起十年前更激動。”黃偉這么對AI科技評論表示道。
抱著改變世界的夢想,云知聲也很快加入了大模型的追逐戰中——做自己的大模型,用技術力量打通更多場景,賦能更多的客戶和使用者。
而隨著巨頭紛紛下場、明星IP抓人眼球,這場戰斗對于云知聲來說,算不上輕松。
國內的大模型,在今天發展還遠未完全;對于創業公司,投資機構也大多謹慎。不少人都說,大模型是大公司的生意,中小公司的機會很可能比較渺茫。

這也讓黃偉想到了那句“所愛隔山海,山海皆可平”。5月24日,云知聲發布的大模型,名字“山海”就是從中而來。
踏平“山海”,黃偉和云知聲在大模型之路上求索,正帶著人工智能走向2.0時代。
山海大模型
從3月文心一言發布以來,國內已有不下十個大模型產品,先后發布。個個“能文能武”,但表現出來的能力,卻相差不多。
對這個趨勢,有不少人說,泛化大模型的能力再強,沒法落進場景,也就無法產生生產力甚至行業格局的變革。
大模型落不了地,詩寫得再好、對聯對得再工整,也不過是“自娛自樂”。而云知聲對待大模型,不僅要“山海”在這些“基礎課”中達到及格,更要讓它能夠在B端落地生根,產生實際的價值。

而這些能力,不只源于大模型自身的能力。“我覺得現在的云知聲可以類比為一座金礦,我們的真實能力和技術水平是隱含在交付的產品以及營收數字背后的。”云知聲創始人&CEO黃偉如是說道。
在物聯場景下,云知聲面向物聯網的智能交互芯片,將作為“神經元”把大模型聯通起來,給萬物互聯提供更好的條件。在物聯網場景里,任何一個玩家都需要讓自己的產品在盡可能多的場景,盡可能多的用戶以及盡可能多設備上,以足夠低的成本跑起來。
像過去常常被人詬病“人工智障”的智能音箱,用戶不能和 AI 產生深層次的交互——一聊天,天就被聊死了。而在生成式 AI 的加持下,無論從體驗還是效率上,智能設備都能獲得巨大的改善。
同樣的情況,不僅音箱,從消費電子到車機,都是山海大模型所覆蓋的領域。
在2016年,云知聲就開始組建專業團隊,自己動手打造智能交互芯片。截止目前,芯片和模組出貨量已經超過2000萬片,這也給山海大模型搭建了一個足夠大的舞臺,讓大模型能夠更充分地發揮云知聲在硬件層面上,給物聯網提供的互聯優勢,把過去已有的產品結構打通,甚至是重構。
而在醫療場景中,山海大模型更是輕車熟路。
云知聲2016年就進入醫療行業,當時主要利用AI技術,解決病歷的語音錄入、缺陷檢查、醫保控費等問題。山海大模型幾十億規模的參數,對比現在的主流產品并不算大,在接入生成式 AI 后,醫生對病人的問診,如最近飲食情況等等,這樣的問題就很像對大模型的 prompt 提問,幾分鐘內問過幾個問題后就逐步收斂,通過醫患對話提取關鍵信息,結合專業醫學知識后最終生成病歷。相比傳統問診,這種方式的效率高得多,也會開拓新的商業模式。
“我們做大模型其實并不是為了PR,也并不是說我們只是為了炫技或者展示自己有這樣的能力,”黃偉說道,“公司其實最終還是要靠商業化能力去活著,對吧?所以我們的大模型一定是服務我們這個已有場景里面的一些老客戶。”
除了物聯和醫療,山海大模型的優勢場景還有不少,而這都要得益于云知聲“U+X”戰略的頂層設計——即以 U(AI架構及全棧技術),深度結合X(行業應用場景),解決行業深層問題。
這也讓山海大模型在落地層面上的廣度(物聯,盡可能多鏈接場景、用戶和設備)和深度(醫療,知識密集型行業),都得到了巨大的提升。
另一方面,在過去的11年里,深耕 To B 的云知聲,也積累了大量行業的 Know How,以及核心高質量的訓練數據。
先前,云知聲挑選的落地場景,大多是醫療、保險等嚴肅性很高,容錯率較低的行業——大模型要在這些行業能生根發芽,就容不得一點閃失,胡說八道的問題解決不了,就沒法被行業所認可。
而云知聲在過去為這些行業打造的知識圖譜,就成為了提升“山海”生成內容正確率的重要保證。
還是以醫療領域舉例,在過去,云知聲提供的知識圖譜可以幫助醫生,完成對患者病歷的審核;與此同時,公司積累的語音識別技術,也能讓用戶在一個很嘈雜的環境里(比如人來人往的診室),完成相當準確的自然語音交互。

“如果把GPT-4比作一個不偏科,每門都能考到80分的學生;我們要做的,則是一個可以在某一兩門學科,考到95分甚至更高的學生。”黃偉如是說。
誠然,大模型的發展路徑不止一種,目前見到成果的路徑,是如GPT采用的一樣——更大的模型規模+更多的數據參數,做泛化大模型,再進行行業調優。而黃偉也相信另一種路徑的機會——更高質量的數據+規模適當的數據參數,做行業“中模型”。
老話說“博觀約取,厚積薄發”,很多人都對看得見的“薄發”津津樂道,卻對看不見的“厚積”必要性和重要性置若罔聞。
云知聲在AI 2.0時代的辦法是兩條路子都在走,現在第一條路基本上已經走通,并且效果有目共睹。今年Q3云知聲還會發布對標GPT-3.5的“山海2.0”,數據參數也將達到千億級。
而在Q3,云知聲的“中模型”也即將發布,而具體的成果,還要看到產品,再等待市場檢驗。
踏平“山海”
黃偉經常對團隊講:“能得到好的結果,一定是你做對了什么。”
不少國內有意做大模型的廠商,都是從12月開始組建團隊,用2-3個月訓練模型,再用2-3個月完成調優——起跑線相對一致。但云知聲的山海大模型,卻“搶跑”了。
說山海“搶跑”,是因為云知聲早在不少人還沒注意到大模型的可能性之前,就已經在為 AI 2.0 時代未雨綢繆。

“我們云知聲在過去做 AI 技術積累的時候,恰恰都是外部環境不是最好的時機。”回憶過去的發展歷程,黃偉如是說道。
近幾年國內相當一部分高新科技企業,最終都落入了To B項目制的窠臼:產品跟著甲方需求走,自己毫無話語權;等到甲方的問題解決了,投入也隨之降低,企業卻在核心技術和通用性解決方案上難有積累,只能再去找下家接方案,形成惡性循環。
然而,云知聲看得卻更遠。成立伊始,公司的英文名字Unisound,就包含了創始人們對于公司發展的期許:
“Sound”是云知聲的主要技術——聲音、語音;而“Uni”則代表著,公司要用相對統一的技術,去服務不同的行業的普通客戶。
此后,“統一技術標準+具體行業場景”,就成為了云知聲堅定不移的戰略。不被外界紛擾,不被風口誘惑,成為了云知聲在路徑規劃上的堅守。
從“感知”到“認知”的技術轉型,盡管已經被普遍認為是必然的趨勢,對于不少當時的 AI 公司,是眼前的“茍且”與“詩和遠方”之間的進退兩難。
先掙到錢,還是先為未來布局,黃偉和云知聲選擇了后者。做認知智能,是公司技術發展的必選項,率先在醫療行業實現認知智能,成為了云知聲在當時的目標。
因此,現在也不難發現,“山海”在醫療場景中積累的種種能力,完全不足為奇,一切都是順理成章,順水推舟。
2017年,另一件決定了“山海”命運的大事,是云知聲開始籌建屬于他們自己的超算中心——Altas。
一年前,AlphaGo 擊敗一眾圍棋高手時,深度學習+超算平臺的連攜思路,也讓云知聲深受啟發,很快展開第二次技術升級,涉足超算中心——一個團隊當時還完全陌生的領域。
“能同時調度上千塊GPU去完成一個任務的能力,將會是一家AI公司的重要壁壘。”黃偉和云知聲的高層如此判斷道,但外界大多對他們不抱信心。
決定做超算中心,不僅是公司的新股東,甚至連老股東都在質疑:這筆巨大的投入,如何能讓他們見到成效。而當時,對于驅動 AI 的計算能力,大多數人還沒看到它的價值。
“當時甚至幾個月前,還能聽說大機構在市場上賣 A100 顯卡。”黃偉回憶道,“但今天一家公司,要從零開始做高性能計算平臺,沒有兩三個月的工夫是搞不定的。”
對技術路徑的判斷,AI科技評論在和不少 AI 從業者的交流中,都聽到過一個相似的概念——“技術直覺”,即基于有限的信息和樣本,能夠對未來技術路徑做出正確規劃的能力。
這種直覺越強,就能越早走上正確的技術路徑,為未來趨勢作準備,也能越少在沒有前景的項目上走彎路。
此前曾有投資機構的合伙人考察過云知聲,最終卻因為種種原因放棄了投資。
巧合的是,云知聲有位合作專家與這位合伙人是同學,在得知此事后,意味深長地說:“你的問題,在于你認為云知聲只是家語音處理技術公司。”
當問到黃偉時,他自謙道,自己并沒有很敏銳的“技術直覺”。但是,黃偉卻可能是中國 AI 圈子里,最早一批發現 GPU 重要性的創業者。
2011年,在意大利佛羅倫薩,黃偉受邀參加了一次學術會議。在會上,黃偉與微軟前首席人工智能科學家鄧力,微軟研究院前首席研究員、今天騰訊AI Lab副主任俞棟結識,暢談 AI 在當下的發展。
在交流中,三人都有想法,當時應用比較廣泛的統計學習,不過是“繡花”的功夫,研究已經接近了天花板。然而,要做當時還相當冷門的深度學習,則需要有更大算力的支持。
也是受了此二人的影響,第二年,黃偉創業后,第一件事,就是把深度學習作為公司的立根之本;而第二件事,就是買了兩塊英偉達顯卡,來處理深度學習的計算。
在當時,顯卡甚至還沒有 GPU 這個響當當的名字;而十多年過去,做 AI 的人,誰又離得開 GPU?數年后,云知聲力排眾議建設超算中心,也算是與這兩塊顯卡一脈相承。

事實上,早在2月,云知聲就跑通了自研大模型閉環的產品流程——從預訓練,到任務對齊、指令增強等等,模型本身也出現了涌現能力。
但黃偉和云知聲不想讓“山海”以一個半成品的形態面世,總覺得對產品不夠滿意,便生生地,把發布日從2月拖到了5月底。
“其實,二三月份國內廠商們做出來的 Alpha 版本,大家無論是進度上還是能力上,都相差不多。”黃偉對AI科技評論說道,“這幾個月來,真正能夠開發布會,而且做現場演示的廠商少之又少了——我們可能聽到很多大模型的名字,但真正能看到的其實并不是特別多。”
5月24日,云知聲山海大模型暨成果發布會在北京舉辦,現場實測山海大模型十大核心能力,并發布一系列面向不同行業需求的產品應用。
北京金隅智造工場的發布會現場,臺下座無虛席,現場賓客盈門。黃偉站上演講臺時引來一陣歡呼,衣著干練簡潔,氣質溫和,這個打扮走在街上并不起眼,但在此刻卻與主人的從容不迫,躊躇滿志相得益彰。
發布會現場,圍繞山海大模型的十大核心能力,即語言生成、語言理解、知識問答、邏輯推理、代碼能力、數學能力、安全合規能力七項通用能力及插件擴展、領域增強、企業定制三項行業落地能力,云知聲通過語音輸入、實時互動的方式進行講解演示。
黃偉在臺上講,身后的大屏幕上實時展示山海的語音輸入并轉換成文字,既展示自身實力,又方便了現場觀眾。
也是在發布會上,云知聲與中建電子、京東科技、360達成戰略合作,與各合作伙伴展開深度合作,推動山海大模型在各領域的落地應用,一道邁入AGI時代浪潮。
在這個 AI 技術幾乎日新月異、每周都有新技術面世的時代,一定是“幾家歡喜幾家愁”。
某些技術產品和業務模式,正不可避免地被生成式 AI 淘汰;而對于云知聲,AI 大模型給了他們升級已有商業模式的機會,正直面著再一次擴大規模的重要機會。
山海大模型的發布,對于云知聲來說,并不是終點,而是公司邁向 AI 2.0時代重要的起點。至于“山海”這個名字,“山”是高山仰止,大智知止,象征大模型符合社會與人類的道德和價值觀。“海”是海納百川,有容乃大,象征對人類龐大知識體系的理解與總結,也象征著AI的無限可能性。
此外,“山海”也代表著云知聲的堅持,所愛隔山海,山海皆可平。幾個月前外界都說大模型是巨頭才能做的,現在大家都看到了山海大模型。
“對于今天的我們,一定是幸福大于煩惱的——而且 AI 在今天的機會,甚至遠遠大出我在四個月之前的想象。”在說出這句話時,黃偉臉上滿是壓抑不住的興奮。
更多內容,點擊下方關注:


未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。