<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給洪雨欣
      發送

      0

      斯坦福 AI 指數報告發布:2024年美國 AI 私人投資約為中國的 12 倍、GPT3.5 級別模型推理成本下降 280 倍

      本文作者: 洪雨欣   2025-04-11 16:48
      導語:權威報告數據顯示,中美 AI 差距進一步縮小。


      4 月 7 日,斯坦福大學以人為本的人工智能研究所 (HAI) 發表了新的《2025年人工智能指數報告》,多項數據統計表明:中美 AI 的差距正在縮小,AI 技術的創新速度是過去十年的數倍之快。

      該報告總篇幅接近 450 頁,主要亮點包括:

      首先,報告指出,過去一年中美的 AI 投資都有了極大增長。其中,美國 AI 私人投資金額增長至 1091 億美元,幾乎是中國的 12 倍(93 億美元)與英國的 24 倍(45 億美元)。AIGC 創業的全球融資規模是 339 億美元,相比 2023 年增長了 18.7%。

      其次,AI 模型正在變得肉眼可見地高效。在高效小模型的驅動下,GPT-3.5 級別的模型推理成本從 2022 年 11 月到 2024 年 10 月已經下降 280 倍,硬件成本每年下降 30%。

      同時,企業界在 AI 研究上明顯領先學術界。報告指出,2024 年幾乎 90% 的知名 AI 模型都是來自企業界,相比之下 2023 年是 60%。但盡管模型的參數規模在持續擴大,模型的性能差距卻在縮小:數據顯示,全球最頂尖的 AI 模型與排名第 10 的模型之間的性能差距在一年內從 11.9% 縮小到了 5.4%。

      此外,去年的指數報告重點指出了閉源與開源LLM之間顯著的性能差距,而在今年,這個差距被縮小至1.7%。

      AI Infra 突飛猛進

      報告統計顯示:每美元的人工智能性能已經大幅提高。一個相當于GPT-3.5的人工智能模型的推理成本,從2022年11月的每百萬個token 20.00美元下降到2024年10月的僅每百萬個token 0.07美元(Gemini-1.5-Flash-8B),在大約1.5年的時間里減少了280多倍。

      Epoch估計,固定性能級別的硬件成本每年下降30%,這使得人工智能訓練變得日益經濟實惠、可擴展,并有助于模型改進。報告還稱,機器學習(ML)硬件的能效隨時間推移顯著提升,每年約提高40%。

      根據Epoch AI數據,2024年企業界貢獻了55個知名AI模型,而同年學術界未產生任何知名模型。值得注意的是,企業和學術合作產生的模型數量正持續增長。過去十年間,源自產業界的知名AI模型占比呈穩定上升趨勢,至2024年已達到90.2%。

      2024年,主要貢獻機構為OpenAI(7個模型)、谷歌(6個)和阿里巴巴(4個)。自2014年以來,谷歌以186個知名模型位居榜首,其次是Meta(82個)和微軟(39個)。在學術機構中,卡內基梅隆大學(25個)、斯坦福大學(25個)和清華大學(22個)自2014年以來的模型產出量最為突出。

      隨著模型參數量的增長,AI系統的訓練數據規模也同步擴大。Meta于2024年夏季推出的旗艦大語言模型Llama 3.3,訓練token量更是突破15萬億大關。

      據Epoch AI研究顯示,大語言模型的訓練數據集規模約每8個月翻一番。這一指數級增長趨勢與模型復雜度的提升形成協同效應,持續推動AI性能邊界擴展。

      Epoch估計,重要AI模型的訓練算力約每5個月翻倍一次,數據集每8個月翻倍,能耗每年增長,這一趨勢在過去五年尤為顯著。

      OpenAI當前最先進的GPT-4o基礎模型,其訓練算力高達380億petaFLOP。

      這種資源門檻使得學術界難以企及,導致企業界持續主導AI前沿研發。盡管今年差距略有收窄(去年AI指數報告首次指出該趨勢),但這一分化態勢仍在延續。

      2024年12月推出DeepSeek V3模型引發了廣泛關注,其核心突破在于:在實現頂尖性能的同時,所需計算資源顯著低于多數主流大語言模型。下圖對比了中美兩國知名機器學習模型的訓練算力,揭示出一個關鍵趨勢:美國頂級AI模型的算力需求普遍遠超中國同類產品。

      據Epoch AI數據顯示:

      中國頭部語言模型的訓練算力增長自2021年底保持約3倍/年的增速

      全球其他地區自2018年以來維持著5倍/年的增速水平

      這一差距折射出兩國在AI研發路徑上的差異化選擇:中國團隊更注重算法效率優化,而國際同行則傾向于通過算力堆砌推動性能突破。不過值得注意的是,DeepSeek V3的成功案例表明,計算效率的提升可能成為未來AI競賽的新賽道。

      但是,AI指數的數據也驗證了近年來的行業猜測:模型訓練成本正呈現顯著上升趨勢。

      2024年,少數可估算模型之一Llama 3.1-405B,訓練成本高達1.7億美元。訓練成本的高升主要為以下三點因素:

      競爭加劇導致企業減少訓練過程披露,成本估算難度增加

      訓練成本與計算需求呈直接正相關

      計算需求越大的模型,其訓練成本呈幾何級數增長

      各個大模型性能差距縮小

      2024年1月初,領先的閉源模型性能超出頂級開源模型8.0%。至2025年2月,這一差距已縮小至1.7%。

      這一快速進步主要得益于Meta在夏季發布的Llama 3.1,以及隨后推出的其他高性能開源模型,如DeepSeek的V3版本。

      下圖展示了截至2025年1月Chatbot Arena排行榜前十名模型的概況。值得注意的是,2023年榜首模型與第十名模型的Elo技能評分差距為11.9%。而到2025年,這一差距已縮小至僅5.4%。

      盡管思維鏈等推理機制的引入顯著提升了大語言模型(LLM)的性能表現,但這類系統仍存在以下關鍵局限:

      可靠性缺陷

      無法穩定解決可通過邏輯推理驗證正確性的問題(如算術運算、任務規劃等)

      面對超出訓練數據規模的實例時表現尤為不佳

      應用制約

      嚴重影響系統的可信度評估

      限制其在高風險場景(如金融決策、醫療診斷等)的應用可行性

      OpenAI發布的o1模型在PlanBench測試中,對于需要至少20步解決的復雜實例,o1僅能完成23.6%。

      規劃本質上是組合優化問題,解決長序列問題所需時間必然超過線性增長。這一特性解釋了當前模型在復雜規劃任務上的性能局限。

      早期模型雖展現潛力,卻存在明顯缺陷:畫質低下、缺乏音頻支持、視頻時長過短等(通常僅能生成2-4秒片段)。2024年,這一領域迎來重大突破——多家科技巨頭相繼發布新一代視頻生成系統。具體突破點如下:

      視頻時長從秒級突破至20秒級

      分辨率實現高清(HD)標準

      生成內容從2D拓展至3D領域

      標志著文本-視頻生成技術進入實用化階段

      2024年成為人形機器人發展的關鍵轉折點,具有類人形態和功能仿生的機器人實現多項突破。以Figure AI為代表的創新企業推出新一代通用人形機器人Figure 02,其技術特征包括復雜任務執行、實現智能交互、支持"語音-推理-語音"閉環。

      除AutoRT系統外,DeepMind同期發布了ALOHA(高級活動自主學習系統)和DemoStart兩大創新平臺。其中ALOHA Unleashed版本在機器人精細操作領域實現了重大突破,首次實現類人級精細動作控制,并證明了大模型+模仿學習的工程可行性。

      大模型投資規模增長

      2024年AI總投資額增至2523億美元,較2023年增長25.5%。過去十年間,人工智能相關投資規模增長了近13倍。

      下圖展示了2013年至2024年全球企業人工智能投資的趨勢,涵蓋并購、少數股權、私募投資和公開募股。

      2023至2024年間,全球AI領域私募投資增長44.5%,這是自2021年以來首次實現同比增長。

      2024年生成式AI領域共吸引339億美元投資,較2023年增長18.7%,達到2022年投資規模的8.5倍以上。值得注意的是,2024年生成式AI投資占全部AI相關私募投資總額的比重已超過五分之一。

      2024年獲得融資的AI企業數量躍升至2049家,較上年增長8.4%。其中,生成式AI領域的新獲投企業數量顯著增加——全年共有214家初創企業獲得融資,較2023年的179家和2019年的31家實現大幅提升。

      2024年數據顯示,美國以1091億美元投資額高居榜首,中國(93億美元)位列第二,僅為美國投資額的8.5%,英國(45億美元)位列第三,投資規模相當于美國的4.1%。

      2024年投資最集中的三大領域分別是:

      AI基礎設施/研究/治理(373億美元)

      數據管理與處理(166億美元)

      醫療健康(110億美元)

      其中,AI基礎設施、研究和治理領域的突出表現,主要得益于OpenAI、Anthropic和xAI等專注AI應用開發的頭部企業獲得的大額投資。

      麥肯錫最新報告顯示:

      整體AI應用率從2023年的55%躍升至78%,78%受訪企業表示已在至少一個業務職能中應用AI技術。

      生成式AI應用呈現爆發式增長:2024年應用率達71%,較去年(33%)增長超一倍。該技術作為去年新增調查項目,首次納入統計范圍。

      企業應用AI已實現降本增收雙重效益,成本節約最顯著領域為:服務運營(49%受訪企業報告成效),供應鏈與庫存管理(43%),軟件工程(41%)。

      最新的微軟職場研究表明:常規辦公任務中,文檔編輯效率提升10-13%,郵件處理時間縮短11%。專業崗位提升更顯著——安全分析師任務完成速度加快23%,準確率提高7%。

      銷售團隊響應速度提升39%,同時轉化率提高25%。

      在科研領域,材料發現速率提升44.1%,專利申請數量增長39.4%,產品原型產出增加17.2%。

      這些數據印證了AI在提升工作質量和效率方面的雙重價值。

      AI For Science 依然存在極高天花板

      2024年,AI驅動的研究斬獲最高榮譽——兩項諾貝爾獎授予了人工智能領域的突破性成就。

      Google DeepMind的Demis Hassabis與John Jumper憑借AlphaFold在蛋白質折疊領域的開創性工作獲獎。最新的AlphaFold 3已突破單一蛋白質結構預測,實現了對蛋白質與關鍵生物分子(DNA、RNA、配體、抗體)相互作用的精準建模。

      John Hopfield與Geoffrey Hinton因對神經網絡的基礎性貢獻獲物理獎。

      AI 助力醫學、生物學研究。研究人員采用定向進化方法,證明大語言模型能夠生成在合成和實驗適應度景觀中均優于傳統算法的蛋白質序列。

      生成式AI模型ProGen通過設計功能性蛋白質序列,凸顯了AI輔助蛋白質工程的潛力。同樣,基于Transformer的ProtT5等模型利用深度學習直接從序列數據預測蛋白質功能與相互作用,推動了計算生物學發展。

      公共數據庫的擴展對AI在蛋白質科學中的應用至關重要,高質量的大規模數據集使AI模型能基于多樣化的生物序列進行訓練,增強預測能力。2019年至今各公共蛋白質科學數據庫的條目數量持續增長。然而,保障數據質量與避免模型偏差仍是持續挑戰。

      圖像與多模態AI也在推動科學發現。冷凍電鏡、高通量熒光顯微鏡與全玻片成像技術的進步,使科學家能高精度解析原子、亞細胞及組織層面的結構,揭示復雜生物過程的新機制。

      隨著高通量顯微鏡技術的興起,視覺-語言模型及新興的視覺-組學基礎模型成為研究熱點。顯微鏡基礎模型數量隨技術發展持續增加:2024年光學顯微鏡模型從4個翻倍至8個。

      2024年生物科學中AI驅動的蛋白質研究中,功能預測(8.4%)居首,其次是結構預測(7.6%)和蛋白質-藥物相互作用(3.0%)。

      面向生物任務的LLM智能體開發熱情提高。

      隨著AI系統在科學領域(尤其是生物學)的應用價值日益凸顯,如何設計能夠調用工具解決復雜任務的智能語言模型成為關鍵挑戰。Aviary為此提供了一個結構化框架,專門訓練語言智能體應對三大高難度科學任務:

      DNA操作(用于分子克隆)

      科研問題解答(通過檢索科學文獻)

      蛋白質穩定性工程

      在Aviary環境中,基線模型Claude 3.5 Sonnet因無法訪問外部工具而表現受限,而集成到Aviary智能體框架中的模型在幾乎所有任務中均顯著優于基線。

      該研究揭示了兩大關鍵結論:

      盡管通用LLMs在多數科學任務中表現良好,但結合領域專家知識對模型進行微調可進一步提升性能;

      加速AI驅動的科研創新不僅依賴模型規模,更需通過外部工具交互實現能力拓展——這種「智能體化AI」正成為新范式。

      對于模型所需token量,臨床LLM GatorTron(820億token)遠少于Llama 3(15萬億token),影像模型RadImageNet(1,600萬圖像等效token)僅為DALL-E(60億)的1/375。

      此外,臨床場景AI應用潛力巨大。微軟與OpenAI團隊近期測試的o1模型以96.0%的準確率創下新紀錄(較2023年提升5.8個百分點)。

      LLM臨床知識能力持續提升(尤其是配備實時推理的o1),但幻覺與多語言性能不一致問題仍存。

      在診斷推理方面,使用GPT-4輔助的醫師診斷準確率(76%)僅略高于傳統工具組(74%);但GPT-4獨立診斷準確率達92%,較無AI輔助醫師提升16個百分點(圖5.4.6)。盡管AI獨立表現優異,診斷時間未顯著縮短。后續需通過重構工作流、用戶培訓與界面設計,才能將孤立模型優勢轉化為臨床協同效能。

      在過去的五年中,對醫學人工智能倫理問題的關注逐年增加。從2020年到2024年,與倫理和醫學人工智能相關的出版物數量增加了四倍。

      公眾對 AI 時代更樂觀

      2024年,67%的受訪者表示“對AI是什么有良好理解”,66%認為“AI將在不久的將來深刻改變他們的日常生活”。

      認為AI驅動的產品和服務“利大于弊”的全球人口比例略有上升,從2022年的52%增至2024年的55%。

      關于AI產品和服務的調查中,平均而言,中國受訪者對AI的認知度、信任度和熱情最最高。80%的受訪者表示“這些產品和服務讓他們感到興奮”。相比之下,僅58%的美國受訪者認為“AI將在未來3-5年深刻改變生活”。

      過去一年中,“信任使用AI的企業會保護個人數據”的受訪者比例下降了3個百分點,“信任AI不會歧視或對任何群體產生偏見”的比例下降了2個百分點。

      不過輿論也存在顯著的地區差異。

      亞洲和拉丁美洲的受訪者更傾向于認為AI利大于弊。相比之下,歐洲和英語國家的受訪者更為懷疑。僅46%的英國受訪者和39%的美國受訪者認為AI利大于弊。

      今年的益普索調查新增了關于“AI如何影響當前工作”的問題。60%的受訪者認為“未來五年AI可能改變工作方式”,36%(超三分之一)認為“AI可能在未來五年取代現有工作”。

      Z世代(67%)和千禧一代比X世代和嬰兒潮一代(49%)更傾向于認同“AI將改變工作方式”。2023至2024年,所有世代認同這一觀點的比例均上升,增幅最大的是千禧一代和嬰兒潮一代,可能表明代際間認知趨同。

      雷峰網(公眾號:雷峰網)


      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      斯坦福 AI 指數報告發布:2024年美國 AI 私人投資約為中國的 12 倍、GPT3.5 級別模型推理成本下降 280 倍

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 欧美精品亚洲精品日韩精品| 日韩av东京社区男人的天堂| 一本一道精品欧美中文字幕| 中文区中文字幕免费看| 欧美精品网| 亚洲AV成人无码久久精品色欲| 亚洲国产精品人人做人人爱| 四虎成人精品国产永久免费| 色婷婷一区二区三区四区成人网| 久久亚洲国产最新网站| 黑人好猛厉害爽受不了好大撑| 日本丰满老熟妇乱子伦| 欧洲无码av| 精品一区二区三区三区| 天堂av亚洲一区二区| 又黄又无遮挡AAAAA毛片| xxxx丰满少妇高潮| 国产亚州精品女人久久久久久| 一本无码人妻在中文字幕免费| 乱精品一区字幕二区| 性视频一区| 人人妻人人澡人人爽久久av| 欧美性受xxxx黑人xyx性爽| 国产精品人一区二区三区| 国产精品污www在线观看| 上海旅游集散中心网上订票| 日韩,变态,另类,中文,人妻| jizzjizz视频| 国产又粗又爽视频| 热久久美女精品天天吊色| 久久99日韩国产精品久久99| 麻豆精品久久久久久久99蜜桃| 波多野结衣的av一区二区三区 | 精品国产三级A∨在线| 秘?亚洲国产精品成人网站| 亚洲成人精品| 亚洲精品一区二区三区的| 在线免费观看毛片av| 亚洲AV午夜成人无码电影| 亚洲成av人无码免费观看| 亚洲一区二区偷拍精品|