今年3月初,AI智能體Manus的橫空出世,使得AI智能體開始受到大量關注,但Manus僅在3個月后便迅速撤出了中國市場。在Manus撤離后的這段時間內,智譜等國內大廠迎頭趕上,各自發布了大量的智能體產品。
8月20日,智譜正式發布AutoGLM 2.0。該產品由純國產模型GLM-4.5與GLM-4.5V驅動,具備推理、代碼以及多模態處理能力,可在多種設備和場景中運行,現已面向普通用戶開放。
與常見的移動端AI助手不同,AutoGLM 2.0定位于能夠在設備上執行具體操作的智能體。
AutoGLM是智譜推出的智能體產品,支持一句話實現云端操作與自動執行。據智譜介紹,過去的AI多停留在“對話”層面,只能回答問題;一般的Agent(智能體)助手也多局限于信息查詢和總結。AutoGLM 2.0則實現一大突破,不再只是“說”,而是真正能夠“做”,AutoGLM 2.0已經成長為一名執行型助手,能夠在云端自主完成多樣化的任務。
從DEMO演示來看,在生活場景中,用戶只需一句話,就能讓AutoGLM 操作抖音、小紅書、美團、京東等40多個高頻應用,可以點外賣、訂機票、查房源、預約健康服務,例如幫用戶買“秋天的第一杯奶茶”。
在辦公場景中,AutoGLM同樣能跨應用執行全流程工作,從信息檢索到內容撰寫,再到生成1分鐘短視頻、PPT或播客,并直接完成小紅書發布。
在AutoGLM 2.0中,智譜為AI配備了專屬云手機和云電腦。Agent可以在云端自主干活、完成任務,而無需占用用戶的本地設備,期間用戶可以使用其它APP,如刷抖音、打游戲等。這意味著AutoGLM 2.0不僅能“自動駕駛手機”,還可異步“代理辦公”,讓手機真正變成具備自主執行、跨端協作能力的智能體手機。
智譜表示,本次發布的AutoGLM 2.0偏向C端應用,面向普通個人用戶,融合技術模型能力與產品形態,解決日常及工作任務,更注重用戶體驗,能突破用戶自身能力邊界,如用戶不懂的事情可通過AI完成。
值得一提的是,AutoGLM是首個純國產模型驅動的Agent,采用了其自主研發的最新模型GLM-4.5與GLM-4.5V,具備推理、代碼與多模態的能力。
據智譜AutoGLM技術負責人、算法研究員劉瀟介紹,AutoGLM 2.0采用了三大關鍵技術,一是端到端強化學習,讓模型通過最終結果反饋自主探索解決問題,而非僅模仿人類軌跡,支持動態適應應用迭代和環境變化;二是低成本高效模型,基于智譜自主研發的模型,單次任務成本約0.2美元,僅為傳統API方式的1/10—1/20,且可規模化降低;三是全端適配,支持手機、電腦、AI 眼鏡等多設備,通過云技術解決不同系統適配問題。
此前在7月28日晚間,智譜發布新一代旗艦模型GLM-4.5,這是一款專為智能體應用打造的基礎模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。
隨后在8月11日,智譜宣布推出開源視覺推理模型GLM-4.5V,總參數106B,激活參數12B,其實現了模型原生的GUI任務,也就是從看圖、看片到讀文檔、識別并操作GUI界面,都能做到從理解到執行的閉環。