0
今年 3 月,「借著」 2024 全球開發者先鋒大會的場子,「國內最后一家通用大模型公司」——階躍星辰發布了 Step 系列通用大模型,包括 Step-1 千億參數語言大模型、Step-1V 千億參數多模態大模型以及 Step-2 萬億參數 MoE 語言大模型預覽版,正式進入大眾視野,并成功躋身國內六大大模型獨角獸行列。
另外五家分別是月之暗面、智譜、MiniMax、百川、零一萬物。
當時雷峰網就報道過,階躍星辰給外界的第一印象是低調、神秘,雖然早在 2023 年就成立,但出現在公眾視野的也只有微軟出身的 CEO 姜大昕,對于團隊核心成員、技術進展、產品研發等信息,外界一概不知。直到臨近一周年之際,正式提交第一份成績單的時候,一切才浮出水面。
當然,這一份成績很是亮眼,一舉將國內大模型卷到萬億參數賽道(預覽版)。可即便如此,階躍星辰依舊低調。
進入 2024 年以來,大模型行業的熱鬧明顯更為多樣化,大模型落地應用的主旋律下,行業模型、端側模型變熱;世界模擬器 Sora 的亮相,引爆多模態大模型的流行;走得更早更靠前的 OpenAI 遲遲沒有將 GPT-5 公之于眾,發布的 GPT-4o,雖然有強大交互能力,但也未能化解大眾對其技術進化速度放緩的質疑、失望……
圍繞「技術信仰派」VS「市場信仰派」、「模型做大」VS「模型做小」、「Scaling Law 是不是第一性原理」等話題,各路大儒「辯經」不止……
仔細看,階躍星辰的聲音似乎很少。
為此,當雷峰網(公眾號:雷峰網)得知階躍星辰也將出席此次的 WAIC 時,充滿期待、好奇,希望探究一下階躍星辰是如何看待當下關于 AGI 的各種共識與非共識問題。
不過沒想到的是,這次「借著」 WAIC 的場子,階躍星辰又交出了第二份答卷——發布 Step-2 萬億 MoE 語言大模型正式版、Step-1.5V 多模態大模型、Step-1X 圖像生成大模型。
而此次的產品升級,距離上次僅僅過去 100 天。
將國內大模型升級到「萬億參數時代」的Step-2長啥樣
3 個多月前,當階躍星辰宣布 Step-2 萬億參數 MoE 語言大模型預覽版的時候,大家很是好奇,想一覽其真實面目。而今天,在 WAIC 大會現場,吊足了大家胃口的 Step-2 萬億參數 MoE 語言大模型正式版亮相了,它采用當前熱門的 MoE (Mixture of Experts)架構,又稱「混合專家」,是一種模塊化的稀疏激活,可以讓模型在增大參數規模的同時,計算成本遠低于相同參數規模下的稠密模型,實現高效訓練。
目前,在通往 AGI 的道路上,業界大多數人堅信 Scaling Law 定律——模型越大,性能越強,階躍星辰也是其中一家。但是現實問題是,模型的升級迭代離不開算力的支撐,而算力的不足和匱乏,顯然是當下業界為數不多的共識之一。
因此,在意識到 MoE 可以解決這一難題時,一些大模型從業者相繼推出基于 MoE 架構的大模型,比如國外的Mistral AI、 xAI,國內的 MiniMax、元象科技、DeepSeek AI、階躍星辰等。而階躍星辰是其中少有的、早早將 MoE 架構用在萬億參數規模大模型的玩家。
姜大昕告訴雷峰網,階躍星辰在完成 Step 系列千億模型的訓練后,就開始開始訓練萬億模型。而想把模型參數擴大到萬億的話,MoE 幾乎是一個必選項。「就像做科研或者做工程,很多決策就是各個維度之間的最佳平衡,MoE 也是在性能、參數量、訓練成本、推理成本這些維度權衡下的最佳選擇。」
而在設計 Step-2 MoE 架構的過程中,階躍星辰還對算法架構進行了創新。
具體而言,當前 MoE 模型的訓練方式主要有兩種,一種是基于已有模型通過 upcycle(向上復用)開始訓練,即將一個已經訓練好的大模型的前饋神經網絡權重復制若干份,每一份作為一個 expert(專家),組合后就可以把一個非 MoE 模型變成 MoE 模型,參數量增大的同時,算力需求會小幾個量級,訓練效率高。但弊端是上限低,基于拷貝復制得到的 MoE 模型容易造成專家同質化嚴重。
另一種是從頭開始訓練,很顯然,缺點在于訓練難度高,但優勢是能夠獲得更高的模型上限。
而階躍星辰的選擇是完全自主研發從頭開始訓練,通過部分專家共享參數、異構化專家設計等創新 MoE 架構設計,讓 Step-2 中的每個“專家模型”都得到充分訓練。結果就是不僅總參數量達到了萬億級別,每次訓練或推理所激活的參數量也超過了當前市面上的大部分 Dense 模型。
此外,在 Step-2 訓練過程中,階躍星辰系統團隊還突破了 6D 并行、極致顯存管理、完全自動化運維等關鍵技術,讓整體的訓練過程更為高效。
據階躍星辰透露,目前,Step-2 萬億參數 MoE 語言大模型在數理邏輯、編程、中文知識、英文知識、指令跟隨等方面體感全面逼近 GPT-4。

此次,除了 Step-2 萬億參數 MoE 語言大模型,階躍星辰還發布了 Step-1.5V 多模態大模型,在多模理解和生成統一的技術路線上實現了快速突破。
在理解上,相較于此前的 Step-1V 多模態大模型, Step-1.5V 的優勢主要體現在三個方面。
一是感知能力全面提升,創新圖文混排訓練方法;能夠理解復雜圖表、流程圖、準確感知物理空間復雜的幾何位置;能夠處理高分辨率和極限長寬比的圖像。二是基于最新的 Step-2 萬億參數模型當老師,推理能力大幅提升,能夠根據圖像內容進行各類高級推理任務,如解答數學題、編寫代碼、創作詩歌等。三是具備出色的視頻理解能力,不僅能夠準確識別視頻中的物體、人物和環境,還能夠理解視頻的整體氛圍和人物情緒。
在生成上,階躍星辰發布 Step-1X 圖像生成大模型,全鏈路自研的 DiT(Diffusion Models with transformer)模型架構, 可支持 600M、2B 和 8B 三種不同的參數量;具備更好的文本 prompt 和生成圖片的語義對齊能力、 指令跟隨能力。另外,該模型還支持針對中國元素的深度優化,使生成內容更適合國人的審美風格。
比如,階躍星辰在會場展示的「AI+大鬧天宮」現場互動,游戲背后調用了多個階躍星辰自研的 Step 系列大模型,融合了圖像理解、風格遷移、圖像生成、劇情創作等多種能力,豐富立體地展現了階躍星辰行業領先的多模態水平。
動畫片《大鬧天宮》大家一定很熟悉,而今年正是《大鬧天宮》制作完成 60 周年之際。
因此,在這一具有重要紀念意義的時刻,階躍星辰團隊聯合上影推出了「AI+大鬧天宮」這一款 AI 互動體驗產品,試圖將最先進的 AIGC 和大模型技術與《大鬧天宮》情境深度融合,用當代的全新視角來展現中國傳統文化的魅力、回顧經典動畫作品的藝術成就,同時也為廣大創作者打開更為廣闊的想象空間、創作空間。
具體而言,在互動過中,用戶需要上傳一張個人照片,基于大模型生成的劇情選擇角色,并與之交談,算法會識別照片的特征,然后結合《大鬧天宮》的畫風和角色進行風格遷移生成新的肖像。同時,還將根據用戶的選擇和回答進一步分析用戶的「MBTI」人格,給用戶在天庭「安排」一個差事。
整體交互過程好玩有趣,且極具個性化,吸引了現場大量觀眾的參與互動。
感興趣的朋友,可以掃描下方圖片二維碼參與互動體驗,「測測你是哪路神仙」。

階躍星辰攀頂 AGI 的決心
階躍星辰在 3 月推出的 Step 系列模型,是將近醞釀了一年的成果,而現在距離上一次不過一百天,就實現了對Step 系列模型矩陣的全新升級。可以看出來,在通往 AGI 的漫長旅途中,階躍星辰這是從「走路入場」變為「跑步前進」了。
當前,盡管業界一次次探討、爭論 AGI 的定義、路徑,但不可否認,在這兩個問題上,至今并未形成一個明確而具體的共識,甚至在未來的一段時間內也不會有,每個路線上的攀登者都認為自己將會是最終達到 AGI 終點的選手。姜大昕也是這樣認為的。
從成立一開始,階躍星辰就明確了自身通往 AGI 的路線圖——單模態—多模態—多模態理解和生成的統一—世界模型—AGI。
換句話說,就是以實現 AGI 為目標,專注研發多模態基礎大模型,基于自研基礎大模型打造新一代「AI +」應用。
在這過程中,姜大昕認為,攀登 AGI 巔峰「萬億參數」和「多模融合」缺一不可!
怎么理解?
一方面,多模態理解和生成的統一是通向 AGI 的必經之路。
另一方面,模型參數量決定模型能力上限,Scaling Law 全面跨入萬億參數是通向 AGI 的另一核心。這也是為什么當初在完成 Step 系列千億模型的訓練后,階躍星辰就馬不停蹄開始訓練萬億模型。
據了解,此次階躍星辰 Step 系列通用大模型獲得了 WAIC 2024 SAIL 之星稱號。SAIL 獎(Super AI Leader,卓越人工智能引領者)是 WAIC 最高獎項,致力于從全球范圍發掘在人工智能領域中具有高度認可和美譽、并具有提升人類福祉意義的項目。
不僅是模型要做好,在應用上,階躍星辰也沒有松懈。從成立之初,階躍星辰的策略就是技術和產品「兩手抓」。因為姜大昕堅信,模型需要應用作為牽引和數據的補充,具體到某個應用的時候一定要通過模型與它深度綁定,這樣應用才能做到極致,反之亦然。
「我不覺得一個光做應用的公司,沒有一個模型跟它深度綁定的話,它能做到極致。」
為此,基于 Step 系列大模型,階躍星辰通過自研產品和生態合作產品逐漸形成豐富的產業應用生態圈,并在重點行業領先落地。
比如躍問和冒泡鴨,這是階躍星辰自研產品的兩個代表。躍問是一款 AI 聊天類應用,定位為個人效率助手;冒泡鴨則是一款由劇情和角色構成的 AI 開放世界,可以為用戶提供娛樂和社交。據了解,目前,兩款產品均已全面開放使用。
而在生態合作方面,階躍星辰已在金融、網絡文學、知識服務、游戲、數字人、影視等領域與合作伙伴達成深度合作,共同探索面向 C 端用戶的創新應用。
比如這次現場展示的「大鬧天宮」AI 互動體驗,就是階躍攜手上影在影視領域達成的生態合作伙伴關系,全程由AI 多模態大模型生成,以大鬧天宮 IP 動畫為情景,以 AI + IP 生動展示多模態大模型的底座能力。
接下來,階躍星辰還將繼續積極探索,并持續擴大生態圈,結交更多生態伙伴。
寫在最后
今年 3 月份,階躍星辰作為新星正式亮相時,憑借在大模型領域的技術實力,一舉改變了彼時大模型的「五虎」格局,成功上位,成為「六大獨角獸」一員。
如今,階躍星辰的萬億參數大模型正式亮相,并不斷獲得行業、資本市場的認可,或許在不久后,國內大模型的格局、位置,又該動一動了。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。