^{<sub id="jgr5k"></sub>}

千問3登頂全球權威開源模型榜

本文作者： Nemo

2025-05-06 17:10

導語：在最新一期的LiveBench榜單上，千問3表現與o4-mini、Claude3.7等頂尖閉源模型相當，并超越DeepSeek-R1取得了全球開源模型冠軍。

5月6日消息，國際權威大模型測評榜LiveBench公布了最新一期排名，阿里巴巴開源的新一代通義千問模型Qwen3（簡稱千問3）斬獲全球開源模型冠軍，并在指令遵循（Instruction Following）這一關鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級閉源模型位列全球第一。

千問3登頂全球權威開源模型榜

圖示 5月6日LiveBench榜單官網截圖

據了解，LiveBench榜單由圖靈獎得主、Meta首席AI科學家楊立昆（Yann LeCun）聯合紐約大學等機構推出，從數學、推理、編程、語言理解等多個復雜維度全面評估大模型，并因其采用動態更新的題庫而被譽為“全球首個無法作弊的模型基準測試”。在最新一期的LiveBench榜單上，千問3表現與o4-mini、Claude3.7等頂尖閉源模型相當，并超越DeepSeek-R1取得了全球開源模型冠軍。同時，千問3還斬獲指令遵循這一細分領域的全球冠軍，這說明千問3具備全球頂級的語言理解和生成能力。

千問3于4月29日凌晨開源，是國內首個“混合推理模型”，其參數量僅為DeepSeek-R1的1/3，性能全面提升的同時成本還大幅下降，引發大模型產業鏈連夜適配和接入浪潮：英偉達、英特爾、高通、聯發科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺都已完成了千問3的適配，北上津杭等十余地算力平臺也已接入千問3。截至目前，阿里通義已開源200多個模型，全球下載量超過3億次，千問的衍生模型數量超10萬，遠超美國Llama，成為全球第一開源模型。

*附LiveBench榜單官網鏈接：https://livebench.ai/#/

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

Nemo

編輯

發私信

當月熱門文章