0
作者 | 李梅
編輯 | 陳彩嫻
AI 科技評論獲悉,阿里 M6 大模型的原帶頭人楊紅霞,已于 9 月初因個人家庭原因從阿里巴巴達摩院智能計算實驗室離職。
楊紅霞常年深耕在產業化大規模落地的人工智能相關技術,在任資深算法專家期間帶領團隊探索阿里在下一代人工智能突破性技術-認知智能的技術發展與場景應用落地。

楊紅霞 2007 年本科畢業于南開大學,獲統計學學士學位。其后她去往美國杜克大學統計科學系攻讀博士學位,師從 David Dunson 教授。
博士畢業后,楊紅霞先入職 IBM 全球研發中心任 Watson 研究員,之后入職雅虎公司,擔任首席數據科學家。
2016 年,楊紅霞結束她在美國近 10 年的留學及工作生涯回國,去往杭州加入阿里巴巴集團。
楊紅霞領導的阿里巴巴達摩院 M6 團隊致力于認知智能方向,目前研發了 AliGraph、M6、洛犀等較為有影響力的人工智能開源平臺和系統,發表頂級會議、期刊文章超過 100 篇,美國和中國專利超過 30 項。她曾帶領團隊獲 2019 世界人工智能大會最高獎卓越人工智能引領者(Super AI Leader,簡稱 SAIL 獎),2020 年國家科學技術進步獎二等獎和 2020 年杭州市創新領軍團隊。2022年6月,楊紅霞入選 2022 福布斯中國科技女性50榜。
大模型 M6 是楊紅霞在任期間的最突出成就。據了解,她離職是因為個人家庭原因,而非行業問題。達摩院大模型 M6 團隊的后續工作不受影響。
M6 于 2021 年 3 月首次發布,是國內首個千億參數多模態大模型。當時,OpenAI 前政策主管 Jack Clark 曾贊揚道:這個模型的規模和設計都非常驚人。這看起來像是眾多中國的 AI 研究組織逐漸發展壯大的一種表現。
作為通用性 AI 大模型,M6 擁有多模態、多任務能力,尤其擅長設計、寫作、問答,在電商、制造業、文學藝術、科學研究等領域都具有廣泛應用前景。楊紅霞曾在接受采訪時表示:“多模態預訓練是下一代人工智能的基礎,M6 模型實現了訓練效率和生成精度等多項突破,是當前眾多中文多模態下游任務最優模型。”
6 月份,楊紅霞團隊又發布萬億參數的 M6,僅使用 480 塊GPU,就能實現萬億參數體量的智能運算。相比原來的百億參數模型,功耗降低 8 成,效率提升 11 倍。
M6 在當年 10 月再次突破極限,楊紅霞團隊使用 512 GPU,在 10 天內訓練出 10 萬億模型。與大模型 GPT-3 具有同等參數規模,但能耗僅為其 1%。
據了解,M6 已經在阿里新制造平臺-犀牛制造中得到應用,它服務內部近 50 個部門,并在阿里云對外產品中投入使用,還被收錄在 MIT Tech Review 2021 年度中國 AI 突破技術報告。
參考鏈接:https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc
http://www2.stat.duke.edu/~hy35/home.html

雷峰網(公眾號:雷峰網)
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。