0
回顧過去十幾年,市場對“AI助手”的想象經歷過三次大規模的預期校準。
第一次是 Siri 誕生時,語音控制帶來了交互的新鮮感,人們以為電影里的智能管家 Jarvis 就在眼前,但隨后發現它更多時候只是一個語音鬧鐘;
第二次是 ChatGPT 橫空出世,流暢的對話與推理能力讓人覺得 AI 終于有了“腦子”,但很快市場意識到,它依然只是一個在對話框里坐而論道的智者,看不到對話框之外的世界。
2025 年初,Manus 的出現,讓 Agent 的概念有了實感。這一次的沖擊不同以往——很多人第一次看到 AI 不僅在“說”,而且在“做”。它當著你的面打開瀏覽器、編寫代碼、調試錯誤、甚至因為網頁加載太慢而主動刷新。
當 Manus 的熱度隨著被收購而逐漸平息,人們才發現,無論技術外殼如何變遷,人類對 AI助手的核心渴望從未改變:用戶不只想要一個僅僅能聽懂話的陪聊,也不只想要一個會在黑底白字界面里寫代碼的極客工具;大家想要的,一直都是一個更聰明、真正能把活兒干完的幫手。
隨著 Manus 完成它的歷史使命,Agent 的下半場大幕正在拉開。
01
Manus 完成了它的歷史使命:Agent 的啟蒙運動
作為一家公司,Manus 的最終歸宿或許存在爭議;但作為一個產品現象,Manus 已經完成了它的歷史使命——它是 Agent 時代的啟蒙者。
在 Manus 之前,Agent 更多停留在學術論文和極客的 Python 腳本里。Manus 的成功之處在于,它通過可視化的交互,第一次向普通用戶展示了 Claude 模型背后潛藏的 Agent 能力。它把“拆解任務-自主執行-環境反饋-修正路徑”這一整套復雜的黑盒邏輯,變成了一個讓用戶盯著屏幕看的直觀過程。
Manus 與 Claude 模型是典型的“互相成就”。Claude 穩定的計算機使用(Computer Use)能力、代碼能力、工具調用能力是地基,而 Manus 是那座拔地而起的樣板房。Manus 的流行,本質上是 Anthropic 技術愿景在應用層的一次成功落地。
然而,Anthropic 自家產品 Claude Code 的持續破圈,影響力逐漸從技術圈外溢,也揭示了一個道理:Agent 的天花板,依然由底層大模型決定。
當應用層的交互紅利被吃透后,競爭會回歸到模型本身。Manus 展示了“過程”,但受限于模型對虛擬環境的適配度、API 成本和推理穩定性,它依然難以成為大家日常工作的依賴。與此同時,國內外的其他基模創業公司——無論是 OpenAI 還是國內的DeepSeek、Kimi——都已將Agent作為發力方向:通過把 Agent 能力直接“內化”進模型里。
但這并不意味著第三方 Agent 創業者的末日,一個更有價值的方向已經浮出水面:基于獨有知識庫的深度Agent。當通用執行力被第一方產品“內化”成模型能力時,第三方 Agent 的核心競爭力就從“執行力”轉向了“信息不對稱”。
最典型的例子是金融研報 Agent。一個能夠調取過去二十年、數百萬份非公開獨家研報數據庫,并能根據這些高價值信息進行分析的 Agent,其價值遠超一個只能翻翻網頁的通用工具。在法律、醫療、審計等垂直領域,這種基于“孤島數據”構建的 Agent 產品,才是第三方廠商真正能守住的護城河。
現在,行業正處于一個微妙的瓶頸期:基模的 Agent 能力在飛速提升,不同的基模廠商會有各自希望重點突出的 Agent 能力側重點,但在產品形態上,大多數廠商還在摸索,試圖找到讓這些能力真正滲透進普通人日常工作流的路徑。
02
Agent 的“iPhone時刻”:從炫技到日常
所有現在的 AI 助手,終將進化為 Agent。這已是行業共識。
如果說 2025 年是 Agent 的“功能機時代”——大家還在比拼誰能多輪聯網搜索、誰調用的工具多;那么 2026 年,行業正在呼喚 Agent 的“iPhone 時刻”。這場戰爭的決勝點在于兩端:一端是模型原生 Agent 能力的硬核比拼,另一端是產品設計的范式革命。
在國內的賽場上,這種角逐尤為激烈。
最早嗅到這一氣息并拿到“入場券”的,是 Kimi。判斷一個產品是否切中剛需,有一個極具中國特色的指標——“閑魚認證”。在 Kimi 在25年6月上線“深度研究”功能,由于免費用戶能使用的次數有限,閑魚上出現了大量倒賣付費會員次數和代跑服務的現象。這種“求而不得”,驗證了用戶對于“AI 幫我做完一件事”的真實渴望。

隨后的故事不僅發生在應用層。Kimi 推出的 K2 模型,是國內較早旗幟鮮明主打 Agentic 能力的基座模型。這直接催生了 Kimi 的通用 Agent 模式。與傳統的“聊天框”不同,Kimi 的 Agent 模式更像是想要打造一個全棧能力的虛擬工作環境。通過 Agent 模式,Kimi 嘗試打破“對話”的邊界:從處理百萬行 Excel 數據到生成復雜的 PPT,它不再是“聊完即走”,而是像人類一樣,從列計劃、做調研開始,一步一步去完成一個項目。
2025 年雙 11 期間,隨著 Kimi 編程套餐的上線,他們也推出了 Kimi CLI 工具。這是一款在命令行里運行的 Agent,與 Anthropic 的 Claude Code 類似,專門服務于開發者的代碼場景,但也開始外溢到非技術人員的非編碼工作場景。
與此同時,國內戰局并未大定。DeepSeek 新模型主打的重點是 Agent 能力。智譜選擇了一條差異化的路徑,他們開源了 Phone Use 模型。這個模型更側重于通過視覺識別,像人手一樣去操作現有的手機App 界面……
03
聊天時代結束,中國的Anthropic競賽開始
ChatGPT 開啟的 Chat 時代也正在落幕。
未來的 AI 助手,衡量標準將變得非常務實:能不能幫我定位這個線上 Bug,自行搜索解決方案,寫好修復代碼,跑通測試,并把補丁推上線?能不能幫我整理完這 200 份財報并畫出圖表?能不能幫我把本周 5 場產品評審會的錄音聽完,整理出所有需求變更點,同步更新到 PRD 文檔,并自動在項目管理軟件里創建好對應的開發任務?
在這場從“聊”到“做”的轉型中,Anthropic 提供了一個參考樣本。從早期的 Claude Code 到最近剛剛上線、面向大眾協作的 Cowork,盡管 Cowork 作為一個新產品,其實際體驗和用戶口碑還有待時間驗證,但它所代表的方向是清晰的:最強大的 Agent,一定來自基模廠商。
在中國,誰能成為那個“中國的 Anthropic”?
答案不在于誰的模型跑分更高,而在于誰能最先做出第三代 AI 助手。這個助手需要滿足三個嚴苛的條件:
第一、它必須具備原生的 Agent 能力,而不是靠外部提示詞工程堆砌出來的“偽智能”;
第二、它必須能處理長時任務(Long-horizon tasks),能像人類員工一樣,為了一個目標連續工作數小時甚至數天,而不是聊幾句就“斷片”;
第三、它必須擁有閉環的數據飛輪,讓每一次任務執行的成敗,都能成為模型進化的養料。
在這個維度上,國內的模型創業者們正在加速。行業看到,DeepSeek 選擇了能把Agent推理價格持續降下去的底層方案做突破,暫時沒有在產品層發力;而 Kimi 依托自己的K2系列模型Agent 能力,在“深度研究”“PPT””數據分析“等生產力場景上有了忠實用戶群,也初步驗證了他們的會員付費能力。智譜則通過開源AutoGLM模型,想讓會操作手機的Agent給每個人日常生活帶來幫助。
對于用戶而言,誰是“中國的 Anthropic”并不重要。重要的是,當那個對話框消失,取而代之的是一個真正能獨立思考、并在后臺默默把活兒干完的幫手時,市場才算真正迎來了 Agent 的時代。
畢竟,最好的 AI,不是讓你驚嘆技術有多強,而是能讓你覺得自己有多強。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。