0
| 本文作者: 徐咪 | 2025-04-30 10:05 |
4月29日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3),在美國硅谷技術圈引起熱議。蘋果機器學習科學家奧維尼·漢農(Awni Hannun)第一時間就在蘋果處理器芯片上完成千問3全系列模型測試,認為“有很酷的特性”,并表示蘋果機器學習框架與千問3是最佳搭檔,開發者可以在蘋果多終端上適配部署千問3,包括Mac、 iPhone等。
奧維尼·漢農的測試數據顯示,在M2 Ultra芯片運行235B混合專家模型(MoE)時,僅需132GB內存即可實現每秒28個token的生成速度;而在M4 Max芯片上,部分模型版本最高吞吐522.43 tokens/s,最低內存占用僅0.44GB。
所有千問3模型都是混合推理模型,可通過API設置預期最大思考深度,實現「快思考」與「慢推理」的模式切換,為不同場景提供靈活的性能成本方案。這個技術特性讓奧維尼·漢農覺得“很酷”。
鑒于千問3與蘋果芯片平臺展現出良好的適配性,奧維尼·漢農表示,MLX(蘋果機器學習框架)與千問3是最佳搭檔。開發者已可通過mlx-lm在蘋果多終端部署千問3全系列模型,涵蓋從iPhone到Macbook Pro直至工作站級設備的多款產品。

雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。