<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      芯片 正文
      發私信給劉伊倫
      發送

      0

      從Token經濟到Agent路由:英偉達用Nemotron重構企業級AI底座

      本文作者: 劉伊倫   2025-12-16 14:00
      導語:Nemotron 3 Token吞吐量提升4倍,并減少了多達60%的推理Token生成量。

      雷峰網(公眾號:雷峰網)消息,2025年12月15日,英偉達正式對外發布Nemotron 3系列開放模型及配套的數據集與工具庫,這一舉措精準切入全球企業AI轉型的核心訴求,為行業帶來了兼具透明度與高效能的代理式AI開發解決方案。

      隨著AI技術在產業場景的深度滲透,企業對AI的應用需求已從單一對話交互升級為復雜工作流自動化,協作式多智能體系統成為必然趨勢。

      然而,開發者在轉型過程中始終面臨三重核心困境:智能體間通信開銷過高、長任務推理易出現上下文漂移、推理成本居高不下,同時,模型透明度不足也讓企業和開發者難以放心將核心業務托付給AI系統。

      Nemotron 3的推出正直面這些挑戰。

      Nemotron 3模型推出Nano、Super和Ultra三種規模,突破性異構潛在混合專家(MoE)架構是核心亮點,既守住了專業化代理式AI所需的性能,又堅持開放特質,讓開發者無需在“性能強度”與“使用自由度”間做取舍,成為高效的開發底座。

      “開放創新是AI進步的基礎。通過Nemotron,我們將先進AI轉化成開放平臺,為開發者提供構建大規模代理式系統所需的透明度與效率。”英偉達創始人兼首席執行官黃仁勛表示。

      Nemotron并非孤立的模型發布,而是英偉達主權AI戰略的關鍵支撐。

      埃森哲、德勤、安永、ServiceNow、西門子、Zoom等12家企業已經成為Nemotron早期用戶,從制造業的智能產線優化,到網絡安全的威脅閉環應對,再到媒體通信的高效協作,這些行業標桿企業正將這款開放模型深度融入核心AI工作流,一場跨領域的智能升級浪潮已悄然拉開序幕。

      Token吞吐量提高4倍、減少60%推理Token生成量,Nemotron 3讓每一分算力「物超所值」

      在多智能體AI系統愈發深入產業的今天,開發者面臨很現實的問題:既要依賴專有模型的前沿推理能力支撐復雜任務,又希望借助開放模型的高效與可定制性控制成本。

      Nemotron 3的出現,正在解決這種“性能與經濟不可兼得”的困境。

      任務路由技術成為關鍵。在單一工作流中,開發者可通過智能調度,讓日常高效型任務交由Nemotron 3這樣的開放模型處理,而核心復雜的前沿推理則聯動專有模型,既保證了智能體的能力,又優化了Token經濟效益。這一模式并非理論構想,已在Perplexity的實踐中落地。

      作為AI瀏覽器領域的創新者,Perplexity正將Nemotron 3 Ultra納入其智能體路由器的核心選項。

      “Perplexity的構建理念是當精準AI融入先進工具時(例如 AI 助手),人類的好奇心將被放大。通過我們的智能體路由器,可以將工作負載定向到領先的精細調優開放模型,如Nemotron 3 Ultra,或在任務能夠從其獨特能力中受益時,利用領先的專有模型,以此確保我們的AI助手能夠以卓越的速度、效率和規模運行。”Perplexity首席執行官Aravind Srinivas表示。

      如果說大企業借助Nemotron 3實現了效率升級,那么這款開放模型對初創公司而言,更像是一把加速創新的“鑰匙”。General Catalyst和Mayfield旗下的諸多創業公司,正借助Nemotron 3搭建人機協作的AI隊友,實現工作效能的快速提高。

      這背后離不開NVIDIA全生態的支撐。

      Mayfield管理合伙人Navin Chaddha表示:“英偉達的開放模型堆棧與初創加速計劃為初創公司提供了各類模型、工具及經濟高效的基礎設施,助力其開展試驗、實現差異化發展并快速擴展規模。Nemotron 3可以讓創始人在構建代理式AI應用和AI隊友方面取得先機,并幫助他們利用英偉達龐大的用戶基礎。”

      Nemotron 3系列MoE模型包含三種規模:

      Nemotron 3 Nano:是一款具備300億參數的小型模型,每次運行最多激活30億參數,適用于針對性、高效的任務。

      Nemotron 3 Super:是一款具備約1000億參數的高精度推理模型,每個Token最多激活100億參數,適用于多智能體應用。

      Nemotron 3 Ultra:是一款具備約5000億參數的大型推理引擎,每個Token最多激活500億參數,適用于復雜的AI應用。

      Nemotron 3 Nano已正式上線,是計算成本效益極高的模型,其針對軟件調試、內容摘要、AI助手工作流及信息檢索等任務進行了優化,同時保持了較低的推理成本。并且,模型采用獨特的異構MoE架構,以實現效率與可擴展性的提升。

      這一設計使其Token吞吐量較Nemotron 2 Nano至高提升4倍,并減少了多達60%的推理Token生成量,大大降低了推理成本。同時,具備100萬Token的上下文處理能力,Nemotron 3 Nano具有更強的記憶能力,在處理長時間多步驟任務時能更精準地關聯信息。

      從Token經濟到Agent路由:英偉達用Nemotron重構企業級AI底座

      獨立AI基準測試機構Artificial Analysis評定該模型為同等規模模型中兼具極高開放性和效率及卓越精度的模型。

      在需要多智能體協作完成低延遲復雜任務的應用中,Nemotron 3 Super表現出色。Nemotron 3 Ultra則作為高級推理引擎,服務于需要深度研究和策略規劃的AI工作流。

      Nemotron 3 Super與Ultra采用基于英偉達Blackwell架構的超高效4位NVFP4訓練格式,可顯著降低顯存需求并加速訓練進程。這種效率使更大規模模型能在現有基礎設施上進行訓練,不會因更高精度格式而犧牲準確性。

      借助Nemotron 3系列模型,開發者可根據特定工作負載選擇適配的開放模型,在數十至數百個智能體間靈活擴展,同時在復雜工作流中獲得更快速、精準的長時推理能力。

      3萬億Token數據、NeMo開源工具庫發布,英偉達為開發者按下 「加速鍵」

      英偉達還發布了面向專業AI智能體開發者的訓練數據集與前沿強化學習庫集合。

      3萬億Token規模的全新Nemotron預訓練、后訓練及強化學習數據集,為開發高性能特定領域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset則提供真實場景的遙測數據,幫助團隊評估并提升復雜智能體系統的安全性。

      為加速開發進程,英偉達發布了NeMo Gym與NeMo RL開源庫,為Nemotron模型提供訓練環境及后訓練基礎,同時還推出用于驗證模型安全性和性能的NeMo Evaluator。所有工具及數據集現已上線GitHub和Hugging Face平臺。

      Nemotron 3已獲得LM Studio、llama.cpp、SGLang和vLLM支持。此外,Prime Intellect與Unsloth正將NeMo Gym 的即用型訓練環境直接集成至其工作流,使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。

      目前,Nemotron 3 Nano已上線Hugging Face平臺,并通過Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等推理服務商提供。

      Nemotron還上線了多個企業級AI與數據基礎設施平臺,包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。Nemotron 3 Nano將通過Amazon Bedrock(無服務器模式)在亞馬遜云科技 (AWS) 平臺上提供給使用公有云的客戶,并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale及Yotta。

      Nemotron 3 Nano同時以NVIDIA NIM形式提供,可以在英偉達加速基礎設施上進行安全、可擴展的部署,具有極高的隱私性與可控性。Nemotron 3 Super和Ultra預計將于 2026 年上半年推出。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 日本女V片| 亚洲综合区图片小说区| 欧美中文字幕精品人妻| 国产一区二区三区18| 国产+成人+欧美| 巨人精品福利官方导航| 精品国产av无码一道| 亚洲国产另类久久久精品网站| 中文字幕有码无码| 老司机亚洲精品影院无码| 国产中文字幕在线一区| 视频一区二区三区福利在线| 国产精品免费AⅤ片在线观看| 人妻忍着娇喘被中进中出视频| 亚洲高清毛片一区二区| 两个人的视频高清在线观看免费| 一 级做人爱全视频在线看 | 国产欧美精品午夜在线播放| 国产麻豆天美果冻无码视频| 制服丝袜人妻中出第一页| 国产免费极品av吧在线观看| 午夜无码无遮挡在线视频| 亚洲综合色丁香婷婷六月图片 | 无码人妻精品中文字幕免费东京热| 综合久久婷婷综合久久| 久久夜色国产噜噜亚洲av| 亚洲AV成人无码精在线| 精品国产性色av网站| 性欧美丰满熟妇xxxx性久久久| 方正县| av男人的天堂在线观看国产| 狠狠干影院| 国产精品毛片久久久久久久 | 好男人视频在线播放| 日韩偷拍视频一区二区三区| 无码视频一区二区三区在线观看| 成人网站免费在线观看| 国产精品成人亚洲| 国产成人精品一区二区三区| 国产免费AV片在线看| 中文字幕亚洲在线|