從ChatGPT的驚艷亮相到AI Agent的崛起,技術迭代的軌跡清晰可見——AI正從“對話”走向“行動”,從被動響應邁向主動執(zhí)行。
在這場變革中,科技巨頭們紛紛押注AI Agent,視其為下一代人工智能的核心形態(tài)。OpenAI、谷歌、微軟等海外巨頭動作頻頻,而中國的字節(jié)跳動、阿里、騰訊等大廠亦不甘示弱,憑借本土化場景加速追趕。
字節(jié)跳動旗下火山引擎總裁譚待近期在接受21世紀經(jīng)濟報道記者采訪時表示,當前產(chǎn)業(yè)正從PC互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)向AI時代演進,核心變化是技術主體從“網(wǎng)頁/APP”變?yōu)椤爸悄荏w(Agent)”,開發(fā)范式從“程序員定義規(guī)則”轉(zhuǎn)向“模型自主規(guī)劃”。
他認為,隨著模型深度思考、多模態(tài)理解及工具使用能力的提升,Agent將在客服、銷售、科研、內(nèi)部研發(fā)等場景實現(xiàn)閉環(huán)任務執(zhí)行。大模型從“效率工具”轉(zhuǎn)變?yōu)椤吧a(chǎn)力主體”,推動企業(yè)生產(chǎn)力升級。
巨頭混戰(zhàn)AI Agent
人工智能領域正在經(jīng)歷一場從“對話”到“行動”的范式轉(zhuǎn)變。
OpenAI將AI Agent定義為:以大語言模型為大腦驅(qū)動的系統(tǒng),具備自主理解、感知、規(guī)劃、記憶和使用工具的能力,能夠自動化執(zhí)行完成復雜任務的系統(tǒng)。
傳統(tǒng)的大語言模型(LLM)如ChatGPT雖然能夠生成流暢的文本,但其交互模式仍高度依賴用戶提供的清晰提示詞(prompt),本質(zhì)上是一種被動響應系統(tǒng)。
而AI Agent則代表了新一代人工智能形態(tài)。它的起源可以追溯到人工智能發(fā)展的早期階段。早期的智能系統(tǒng)主要以簡單的規(guī)則引擎和專家系統(tǒng)為主,能夠在特定領域內(nèi)解決一些預定義的問題,但缺乏自主性和適應性。隨著機器學習、深度學習等技術的不斷進步,智能體開始具備一定的學習和決策能力。
真正讓AI Agent成為全球關注焦點,是2023年以ChatGPT為代表的生成式AI的爆發(fā)之后。2024年,一系列相關技術和應用推出,OpenAI、Anthropic、微軟、谷歌等企業(yè)相繼發(fā)布Agent進展。
在火山引擎總裁譚待看來,2025年可能是“Agent應用元年”。
在譚待看來,當前AI行業(yè)有兩大趨勢值得關注:一是開發(fā)范式轉(zhuǎn)型,需更強的多模態(tài)模型、Agent平臺工具(如MCPhub、Sandbox)及Prompt調(diào)優(yōu)等技術。二是基礎設施升級。計算主體從CPU轉(zhuǎn)向GPU,數(shù)據(jù)量從TB級邁向EB級,多模態(tài)數(shù)據(jù)處理需求激增,安全領域需應對惡意AI的挑戰(zhàn)。
記者注意到,今年以來,海外科技巨頭繼續(xù)加碼AI Agent賽道。而在中國,字節(jié)跳動、阿里、騰訊、百度等大廠亦加大投入,憑借豐富的本土場景加速追趕。
今年4月,字節(jié)跳動啟動“扣子空間”產(chǎn)品內(nèi)測,5月9日正式開放測試。4月23日,納米AI上線MCP萬能工具箱,全面支持模型上下文協(xié)議(MCP)。4月25日,百度發(fā)布心響APP,這是首個移動端的通用超級智能體APP。5月22日,昆侖萬維發(fā)布天工超級智能體SkyworkSuperAgents。5月30日,阿里巴巴開源了創(chuàng)新自主搜索AI Agent——WebAgent。
當前競爭格局已現(xiàn)分野。中信建投計算機首席分析師應瑛指出,對比當前海內(nèi)外Agent布局現(xiàn)狀:北美云廠商主要關注幫助客戶高效部署模型和Agent,而B端廠商更聚焦打造Agent創(chuàng)建和管理平臺;國內(nèi)互聯(lián)網(wǎng)大廠Agent布局仍延續(xù)互聯(lián)網(wǎng)時代用戶流量邏輯,通過類“Manus”的通用Agent產(chǎn)品搶占用戶,B端企業(yè)則類似北美。
除了大廠,眾多創(chuàng)業(yè)公司也在AI Agent領域積極探索。有的創(chuàng)業(yè)公司選擇套殼工具模式,基于開源模型或大廠API開發(fā)輕量化應用,如文生圖、代碼輔助工具等。還有的企業(yè)選擇垂類深耕,避開與大廠在通用Agent領域的正面競爭。
從市場空間來看,麥肯錫報告顯示,2025年全球AIGC技術滲透率將突破40%。市場研究機構ResearchandMarket報告預計,AI智能體的市場規(guī)模將從2024年的51億美元增長到2030年的471億美元(約5年增長420億美元),2024~2030年的復合年增長率為44.8%。
字節(jié)全力打造“AI云”
在這場混戰(zhàn)中,字節(jié)跳動展現(xiàn)出獨特的“技術+場景”生態(tài)化打法。
2023年,火山引擎主要聚焦于基礎大模型的研發(fā)與優(yōu)化;2024年,開始探索多模態(tài)能力的整合與應用;而進入2025年后,其戰(zhàn)略重心已轉(zhuǎn)向AI Agent的生態(tài)構建。
其中,豆包大模型作為字節(jié)的“技術大腦”,為旗下各類產(chǎn)品提供了基礎的智能支持;而抖音、飛書等產(chǎn)品,則在短視頻創(chuàng)作、企業(yè)協(xié)作等領域,將AI技術落地為具體的用戶體驗。
隨著Agent概念的興起,字節(jié)意識到,需要一個能夠整合多種技術,為用戶提供一站式智能服務的產(chǎn)品。
2025年4月,火山引擎推出了首款面向C端的通用Agent平臺“扣子空間”。其定位是“一個通用的實習生配合各領域的專家”,旨在通過多模態(tài)交互、任務規(guī)劃和工具調(diào)用,幫助用戶完成各種復雜的任務。
從產(chǎn)品功能上看,“扣子空間”具備了典型的Agent特征。用戶可以通過自然語言輸入任務需求,扣子空間會利用豆包大模型的深度思考能力,將任務拆解為多個子步驟,并動態(tài)調(diào)用各種工具完成任務。
今年4月17日,火山引擎推出了“豆包·深度思考模型”“OSAgent解決方案”和“AI云原生推理套件”,構建了從底層模型到上層應用的完整鏈條。
6月11日,火山引擎發(fā)布豆包大模型1.6、視頻生成模型Seedance1.0pro等新模型,并升級了Agent開發(fā)平臺等AI云原生服務。
譚待表示,深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構建Agent的關鍵要素。同時,由于Agent每次執(zhí)行任務都會消耗大量tokens,模型使用成本也要降下來,才能推動Agent的規(guī)模化應用。
通過技術和商業(yè)的雙重創(chuàng)新,豆包1.6按“輸入長度”區(qū)間定價,深度思考、多模態(tài)能力與基礎語言模型統(tǒng)一價格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeekR1的三分之一。Seedance1.0pro模型每千tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為行業(yè)最低。
譚待透露,火山引擎定位“AI云”,聚焦AI原生技術,將內(nèi)部服務豆包的經(jīng)驗(如模型、計算、數(shù)據(jù)安全能力)開放給行業(yè),目前已在大模型服務市場占據(jù)領先份額,助力企業(yè)完成AI轉(zhuǎn)型。
其AI Agent商業(yè)化呈現(xiàn)明顯的“自上而下”特征。一方面,火山引擎持續(xù)攻堅頭部行業(yè),聚焦汽車、金融、消費電子等領域。另一方面,通過成本優(yōu)化和低代碼工具吸引初創(chuàng)企業(yè),普惠中小客戶。
從Force大會釋放的信號看,其AI Agent戰(zhàn)略已進入深水區(qū)。而科技巨頭們能否真正打破“AI離企業(yè)遠”的魔咒,或許取決于下一個問題:有多少客戶愿意為“生產(chǎn)級Agent”買單。