{首页主词},&

AI Agent大戰(zhàn)開啟，字節(jié)跳動欲破局

來源：21世紀經(jīng)濟報道21財經(jīng)APP作者：雷晨2025-06-13 07:49

從ChatGPT的驚艷亮相到AI Agent的崛起，技術迭代的軌跡清晰可見——AI正從“對話”走向“行動”，從被動響應邁向主動執(zhí)行。

在這場變革中，科技巨頭們紛紛押注AI Agent，視其為下一代人工智能的核心形態(tài)。OpenAI、谷歌、微軟等海外巨頭動作頻頻，而中國的字節(jié)跳動、阿里、騰訊等大廠亦不甘示弱，憑借本土化場景加速追趕。

字節(jié)跳動旗下火山引擎總裁譚待近期在接受21世紀經(jīng)濟報道記者采訪時表示，當前產(chǎn)業(yè)正從PC互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)向AI時代演進，核心變化是技術主體從“網(wǎng)頁/APP”變?yōu)椤爸悄荏w（Agent）”，開發(fā)范式從“程序員定義規(guī)則”轉(zhuǎn)向“模型自主規(guī)劃”。

他認為，隨著模型深度思考、多模態(tài)理解及工具使用能力的提升，Agent將在客服、銷售、科研、內(nèi)部研發(fā)等場景實現(xiàn)閉環(huán)任務執(zhí)行。大模型從“效率工具”轉(zhuǎn)變?yōu)椤吧a(chǎn)力主體”，推動企業(yè)生產(chǎn)力升級。

巨頭混戰(zhàn)AI Agent

人工智能領域正在經(jīng)歷一場從“對話”到“行動”的范式轉(zhuǎn)變。

OpenAI將AI Agent定義為：以大語言模型為大腦驅(qū)動的系統(tǒng)，具備自主理解、感知、規(guī)劃、記憶和使用工具的能力，能夠自動化執(zhí)行完成復雜任務的系統(tǒng)。

傳統(tǒng)的大語言模型（LLM）如ChatGPT雖然能夠生成流暢的文本，但其交互模式仍高度依賴用戶提供的清晰提示詞（prompt），本質(zhì)上是一種被動響應系統(tǒng)。

而AI Agent則代表了新一代人工智能形態(tài)。它的起源可以追溯到人工智能發(fā)展的早期階段。早期的智能系統(tǒng)主要以簡單的規(guī)則引擎和專家系統(tǒng)為主，能夠在特定領域內(nèi)解決一些預定義的問題，但缺乏自主性和適應性。隨著機器學習、深度學習等技術的不斷進步，智能體開始具備一定的學習和決策能力。

真正讓AI Agent成為全球關注焦點，是2023年以ChatGPT為代表的生成式AI的爆發(fā)之后。2024年，一系列相關技術和應用推出，OpenAI、Anthropic、微軟、谷歌等企業(yè)相繼發(fā)布Agent進展。

在火山引擎總裁譚待看來，2025年可能是“Agent應用元年”。

在譚待看來，當前AI行業(yè)有兩大趨勢值得關注：一是開發(fā)范式轉(zhuǎn)型，需更強的多模態(tài)模型、Agent平臺工具（如MCPhub、Sandbox）及Prompt調(diào)優(yōu)等技術。二是基礎設施升級。計算主體從CPU轉(zhuǎn)向GPU，數(shù)據(jù)量從TB級邁向EB級，多模態(tài)數(shù)據(jù)處理需求激增，安全領域需應對惡意AI的挑戰(zhàn)。

記者注意到，今年以來，海外科技巨頭繼續(xù)加碼AI Agent賽道。而在中國，字節(jié)跳動、阿里、騰訊、百度等大廠亦加大投入，憑借豐富的本土場景加速追趕。

今年4月，字節(jié)跳動啟動“扣子空間”產(chǎn)品內(nèi)測，5月9日正式開放測試。4月23日，納米AI上線MCP萬能工具箱，全面支持模型上下文協(xié)議（MCP）。4月25日，百度發(fā)布心響APP，這是首個移動端的通用超級智能體APP。5月22日，昆侖萬維發(fā)布天工超級智能體SkyworkSuperAgents。5月30日，阿里巴巴開源了創(chuàng)新自主搜索AI Agent——WebAgent。

當前競爭格局已現(xiàn)分野。中信建投計算機首席分析師應瑛指出，對比當前海內(nèi)外Agent布局現(xiàn)狀：北美云廠商主要關注幫助客戶高效部署模型和Agent，而B端廠商更聚焦打造Agent創(chuàng)建和管理平臺；國內(nèi)互聯(lián)網(wǎng)大廠Agent布局仍延續(xù)互聯(lián)網(wǎng)時代用戶流量邏輯，通過類“Manus”的通用Agent產(chǎn)品搶占用戶，B端企業(yè)則類似北美。

除了大廠，眾多創(chuàng)業(yè)公司也在AI Agent領域積極探索。有的創(chuàng)業(yè)公司選擇套殼工具模式，基于開源模型或大廠API開發(fā)輕量化應用，如文生圖、代碼輔助工具等。還有的企業(yè)選擇垂類深耕，避開與大廠在通用Agent領域的正面競爭。

從市場空間來看，麥肯錫報告顯示,2025年全球AIGC技術滲透率將突破40%。市場研究機構ResearchandMarket報告預計，AI智能體的市場規(guī)模將從2024年的51億美元增長到2030年的471億美元（約5年增長420億美元），2024~2030年的復合年增長率為44.8%。

字節(jié)全力打造“AI云”

在這場混戰(zhàn)中，字節(jié)跳動展現(xiàn)出獨特的“技術+場景”生態(tài)化打法。

2023年，火山引擎主要聚焦于基礎大模型的研發(fā)與優(yōu)化；2024年，開始探索多模態(tài)能力的整合與應用；而進入2025年后，其戰(zhàn)略重心已轉(zhuǎn)向AI Agent的生態(tài)構建。

其中，豆包大模型作為字節(jié)的“技術大腦”，為旗下各類產(chǎn)品提供了基礎的智能支持；而抖音、飛書等產(chǎn)品，則在短視頻創(chuàng)作、企業(yè)協(xié)作等領域，將AI技術落地為具體的用戶體驗。

隨著Agent概念的興起，字節(jié)意識到，需要一個能夠整合多種技術，為用戶提供一站式智能服務的產(chǎn)品。

2025年4月，火山引擎推出了首款面向C端的通用Agent平臺“扣子空間”。其定位是“一個通用的實習生配合各領域的專家”，旨在通過多模態(tài)交互、任務規(guī)劃和工具調(diào)用，幫助用戶完成各種復雜的任務。

從產(chǎn)品功能上看，“扣子空間”具備了典型的Agent特征。用戶可以通過自然語言輸入任務需求，扣子空間會利用豆包大模型的深度思考能力，將任務拆解為多個子步驟，并動態(tài)調(diào)用各種工具完成任務。

今年4月17日，火山引擎推出了“豆包·深度思考模型”“OSAgent解決方案”和“AI云原生推理套件”，構建了從底層模型到上層應用的完整鏈條。

6月11日，火山引擎發(fā)布豆包大模型1.6、視頻生成模型Seedance1.0pro等新模型，并升級了Agent開發(fā)平臺等AI云原生服務。

譚待表示，深度思考、多模態(tài)和工具調(diào)用等模型能力提升，是構建Agent的關鍵要素。同時，由于Agent每次執(zhí)行任務都會消耗大量tokens，模型使用成本也要降下來，才能推動Agent的規(guī)模化應用。

通過技術和商業(yè)的雙重創(chuàng)新，豆包1.6按“輸入長度”區(qū)間定價，深度思考、多模態(tài)能力與基礎語言模型統(tǒng)一價格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間，豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens，綜合成本只有豆包1.5深度思考模型或DeepSeekR1的三分之一。Seedance1.0pro模型每千tokens僅0.015元，每生成一條5秒的1080P視頻只需3.67元，為行業(yè)最低。

譚待透露，火山引擎定位“AI云”，聚焦AI原生技術，將內(nèi)部服務豆包的經(jīng)驗（如模型、計算、數(shù)據(jù)安全能力）開放給行業(yè)，目前已在大模型服務市場占據(jù)領先份額，助力企業(yè)完成AI轉(zhuǎn)型。

其AI Agent商業(yè)化呈現(xiàn)明顯的“自上而下”特征。一方面，火山引擎持續(xù)攻堅頭部行業(yè)，聚焦汽車、金融、消費電子等領域。另一方面，通過成本優(yōu)化和低代碼工具吸引初創(chuàng)企業(yè)，普惠中小客戶。

從Force大會釋放的信號看，其AI Agent戰(zhàn)略已進入深水區(qū)。而科技巨頭們能否真正打破“AI離企業(yè)遠”的魔咒，或許取決于下一個問題：有多少客戶愿意為“生產(chǎn)級Agent”買單。

責任編輯：李志強

火山引擎

AI Agent

大語言模型

聲明：證券時報力求信息真實、準確，文章提及內(nèi)容僅供參考，不構成實質(zhì)性投資建議，據(jù)此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態(tài)，洞察政策信息，把握財富機會。

網(wǎng)友評論

登錄后可以發(fā)言

發(fā)送