萬眾期待的R2還沒來,但R1又變得更強了。
繼兩個月以前發布DeepSeek-V3-0324模型后,DeepSeek傳來最新動作——完成了R1模型的小版本試升級。升級后的模型在官方網站、APP、小程序測試(打開深度思考)就能體驗,API接口和使用方式保持不變,這意味著用戶無需切換和進行任何操作,就可以感受和體驗最新的R1模型。
與此前發布DeepSeek-V3-0324時同步披露模型細節,介紹包括推理、前端開發、中文寫作、中文搜索等幾個方面的能力優化不同,此次更新,DeepSeek官方并沒有公布版本更新的具體內容。
但這一低調的“小版本試升級”背后,可能是一次“核彈級”的能力升級。據用戶實測,更新后的R1編程能力有了明顯提升,無論是網頁生成、小游戲制作,還是復雜的繪圖板Bug修復、圖片畫廊燈箱效果,R1都展現了極強的代碼生成、理解和修正能力,甚至可以與最近發布的編程新王Claude4相媲美。
例如,有用戶使用更新后的DeepSeekR1創建一個世界時鐘面板,要求展示不同時區的當前時間并支持時區切換。更新版R1在審美和代碼完成度上較之前的版本又上了一個臺階,制作出了效果相當驚艷的世界時鐘面板。
此外,DeepSeek還出色地完成了包括制作"貪吃蛇"游戲前端頁面、生成動態的星空夜景、創建一個科技資訊網站等多項任務。此外,還有網友在著名代碼測試平臺LiveCodeBench中表示,更新后的R1帶來了遠超預期的能力提升,與OpenAI最新的o3模型高版本不相上下。
對于大模型而言,編程能力具有極為重要的價值,也是各個頂尖大模型廠商競相追逐的焦點。4月底,據外媒報道,OpenAI正在推進對AI輔助編程創業公司Windsurf的一筆30億美元收購,若收購能順利達成,將成為OpenAI迄今為止最昂貴的一次收購行動。業內人士分析,這一動作表明OpenAI旨在提升編程能力短板,從而與微軟、Anthropic等具備強大編程能力的競爭對手抗衡。
此外,近期多家廠商都推出了新版模型,重點都放在編程能力的升級上。例如,谷歌5月初正式推出Gemini2.5Pro“I/O”特別版,回應開發者社區對實際編程和界面設計效能的強烈需求,谷歌DeepMind首席執行官更是盛贊其為“我們迄今構建的最強編程模型”。Anthropic公司在5月23日推出了ClaudeOpus4和ClaudeSonnet4新一代語言模型,在結構化推理、軟件工程和自主代理行為等領域實現重大進步,更是以“自動寫代碼7小時”而刷新世界紀錄,被譽為新“編程王”。
自從在今年春節前后爆火后,DeepSeek一直保持著低調的作風,而業界則一直關注并討論DeepSeek何時將推出R2模型。4月底,有傳聞稱,其R2大模型的參數規模被曝達到驚人的1.2萬億,相比前代R1的6710億參數幾乎翻倍。此外,此前市場普遍推測R2將在5月份推出,但未獲得官方證實,截至目前R2模型亦還未有推出跡象。
有分析指出,雖然DeepSeek低調地表示這是“小版本試升級”,但其模型能力的提升,放在OpenAI、谷歌、Anthropic等大模型公司,基本都會以全新一代的整數模型來命名并進行高調發布。DeepSeekR1升級版本編程能力的提升,展現了追趕國際一線水平的強大競爭力,意味著國內開發者可以直接使用,同時能獲得更低成本、更適合中國用戶需求的服務。
校對:姚遠