{首页主词},&

谷歌重磅發布最強通用AI模型！同聲傳譯、全新AI模式搜索

來源：每日經濟新聞2025-05-21 07:32

（原標題：谷歌重磅發布最強通用AI模型！同聲傳譯、全新AI模式搜索，直接通過自然語言發問，支持長達數百字提問）

繼微軟之后，谷歌也全面擁抱人工智能（AI）智能體（Agent）。在開發者大會上，谷歌宣布要讓智能體全面進駐谷歌的主打業務搜索以及AI助手Gemini，并通過Gemini與搜索結合，推出全新的AI模式搜索。

當地時間5月20日，谷歌2025年度I/O開發者大會的主題演講展示了在AI、多模態模型、跨設備整合與開發者工具方面的最新成果。從升級后的Gemini 2.5 Pro模型到智能眼鏡的XR應用，再到AI驅動的搜索與網頁瀏覽體驗。谷歌展現的不僅是模型的性能提升，更是AI從“信息工具”進化為“通用智能體”的進步。

本次發布內容主要包括：

模型：Gemini 2.5 Pro/Flash/DeepThink；Diffusion；Imagine 4；Lyria；

應用：Gemini App、Canvas、Chrome助理、AI Mode、Agent模式；

搜索：AI Overview+Mode；支持個性化、多步推理、自動執行任務；

創作：Flow平臺、文本轉圖像、圖像轉視頻、原生音頻合成|

硬件：Android XR頭顯、智能眼鏡原型、WearOS、車載整合

谷歌最強通用AI模型Gemini 2.5 Pro

剛開場，登臺的Alphabet兼谷歌CEO皮查伊（Sundar Pichai）就強調了Gemini的重要性，稱“在谷歌，每天都是Gemini季”，并力推新模型Gemini 2.5 Pro——“迄今為止我們最強大的通用AI模型”。

皮查伊說，自上次I/O大會以來，谷歌已推出十多款模型和20項AI功能，谷歌的發布速度已經是史上最快：

“我們希望盡快將最好的模型和產品交到大家手中，因此我們的發布速度比以往任何時候都快?！?/p>

皮查伊透露，Gemini 2.5 Pro模型已在大語言模型（LLM）測評LLM Arena的所有類別排行榜上名列前茅。Gemini是熱門AI代碼編輯器Cursor上增長最快的模型。

他介紹，一年來，谷歌系統每月處理的token數量激增，從去年的9.7萬億增加到現在的480萬億，增長將近50倍。Gemini的App每月有4億多活躍用戶。

“智能體模式”將上線Chrome、搜索及Gemini App

皮查伊宣布，谷歌將在Chrome瀏覽器、搜索以及Gemini的App中推出智能體模式（Agent Mode）。

智能體可以與瀏覽器和其他軟件進行交互和操作。谷歌研究的AI智能體Mariner現在可以同時管理多達10個任務，用戶只需向其展示一次任務，它就會學習該任務，并將經驗用于未來的案例。

智能體模式的實驗版即將向Gemini App的訂閱者推出。

皮查伊現場演示Gemini App中的智能體模式，要求它幫用戶找公寓。得到指令后，Gemini搜索房產網Zillow，用電腦調整篩選條件，并使用模型上下文協議MCP預約看房。

皮查伊評價：

“這是一個新興的時代。將研究成果轉化為現實的最佳方式就是讓它真正發揮作用。”

他說，在經用戶許可的情況下，Gemini現在可以在各種App中以“私密安全”的方式使用個人信息。

在AI綜述的基礎上，谷歌在搜索引擎中正式推出由Gemini2.5模型驅動的AI模式。由于AI的特性，用戶可以向搜索引擎提出更復雜、更難的問題。谷歌表示，現在用戶從搜索引擎中得到的不只是信息，而是智慧。

圖片來源：視頻截圖

未來谷歌還將AI模式與用戶郵箱等個人信息打通，提供個性化的建議。與此同時，同類AI工具中常見的“深度研究”功能也將集成在這個模式中。

同時通過將先進多模態模型和實時對話等功能結合，谷歌也將在今年夏天推出實時影像搜索功能。用戶可以開著攝像頭向AI實時提問。

圖片來源：視頻截圖

谷歌搜索添加AI模式標簽頁支持長達數百字提問

皮查伊稱AI概覽（AI Overviews）是谷歌最成功的產品之一，每月有15億用戶在搜索中使用AI概覽，它推動某些類型的查詢增長了10%。這意味著，谷歌提供生成式AI服務的用戶規模超過其他公司。

Gemini模型將與谷歌搜索集合。它將通過AI模式（AI Mode）增強智能，成為一種強大的新型AI搜索功能，可幫助解答問題。它是搜索中的新標簽頁，也將包含在AI概覽中。

作為全新的搜索功能，AI模式讓用戶可以提出更長、更復雜的查詢。它支持長達數百字的提問、自動分解查詢意圖、并生成結構化答案。該模式當地時間5月20日就上線，作為搜索的新標簽頁形勢，向所有美國的用戶推出。

新版本中，用戶可以：

直接通過自然語言發問，系統會提供摘要式、結構化回答。

與搜索結果進行多輪對話，進一步深入了解相關內容。

獲取圖文并茂的“智能回答卡片”，例如自動整理出旅游行程、購物建議、編程指南等。

皮查伊稱：“我們正在重新定義搜索的未來。不是找到鏈接，而是直接給出答案?！?/p>

谷歌搜索負責人Liz Reid介紹，AI模式會得到名為Deep Research的模型加持，谷歌稱之為“深度搜索”（DeepSearch）。該模型將通過邏輯搜索結果和高度相關的內容，更好地整理研究主題。

“就像你身邊有一位博學助理。”它還會結合地圖、評論、視頻等生成圖表和推薦內容。

Reid說，AI模式將擁有谷歌所有最優秀的AI特性和功能?！半S著時間的推移，我們將逐步將AI模式的許多尖端特性和功能融入核心搜索體驗?！彼€說，AI模式現在就將支持AI概覽。

谷歌光束、同聲傳譯功能

谷歌光束（Google Beam）：極具未來主義的視頻會議設備，從不同角度捕捉用戶影像，使用AI技術將這些視頻流合并，并在3D光場顯示器上呈現用戶的3D形象，幀率最高可達每秒60幀。首批“谷歌光束”設備將于今年晚些時候通過合作伙伴惠普推出，具體定價尚不清楚。

圖片來源：視頻截圖

同聲傳譯：在谷歌會議軟件Google Meet中，用戶可以使用不同語言進行實時對話，同時保留原聲的音色、語調和情感表達。目前已經向訂閱用戶開放英語和西班牙語之間的實時翻譯，未來幾周將陸續增加意大利語、德語和葡萄牙語等更多語言。

圖片來源：視頻截圖

此外，AI模式下也將提供購物決策的全流程支持——從“買什么”到“去哪里買”一步到位。谷歌也在實驗室中推出虛擬試穿衣服工具，用戶可以上傳一張自己的照片，直觀感受購物車里的衣服“穿在”自己身上的樣子。

AI視頻生成制作工具Flow

這款工具旨在簡化AI生成視頻的創作流程。Flow與Veo 3視頻生成模型，針對Veo 2模型的更多控制功能，以及圖像生成模型Imagen 4一同亮相。

通過Flow，用戶可以通過文字或圖片素材生成8秒的AI視頻片段，隨后使用Flow的場景構建工具將多個片段拼接成完整視頻。

與此同時， Veo 3模型不僅生成質量更高、理解提示詞更準確，還能同步生成視頻和音頻，包括不同角色的對話。此外，Veo 2將增加相機控制和對象移除等工具，Imagen 4在生成圖片時也能準確生成真實文本，而不是一堆亂碼。

推出的安卓XR平臺針對一系列AI眼鏡設備

谷歌工程主管Shahram Izadi介紹稱，除了手機外，未來幾個月里谷歌將會把Gemini AI功能拓展至智能手表、汽車控制臺、電視上，以及你的眼鏡上。

Izadi介紹稱，谷歌推出的安卓XR平臺針對一系列AI眼鏡設備，意味著每個人可能會購買不止一副AI眼鏡。例如看電影或者工作時，你需要更具沉浸感的頭戴式設備；而出行購物時，你會需要輕便的眼鏡提供實時信息。

圖片來源：視頻截圖

安卓XR是谷歌與三星、高通一起開發的平臺，自從去年公布項目后，現在已經有數百家軟件開發商為這個平臺提供適配。三星的Project Moohan是第一款安卓XR設備，并將在今年晚些時候開放購買。

谷歌也宣布，與中國AR品牌Xreal達成戰略合作，以Project Aura的名義推出第二款安卓XR設備，也是首款搭載安卓XR平臺的AR眼鏡。

責任編輯：李志強

微軟

通用智能體

Gemini

聲明：證券時報力求信息真實、準確，文章提及內容僅供參考，不構成實質性投資建議，據此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態，洞察政策信息，把握財富機會。

網友評論

登錄后可以發言

發送

網友評論僅供其表達個人看法，并不表明證券時報立場

暫無評論

為你推薦

688648股價創新高，大股東公布減持計劃！AI芯片新突破，機構盯上這些股

數據寶莫聽 2025-05-21 19:34
金飾價格再漲回1000元/克！“年輕人涌入黃金批發市場”

證券時報吳家明 2025-05-21 20:46
上海洗霸擬投入2500萬元收購多項新能源電池專利

證券時報網黃翔 2025-05-21 20:33
小米3nm自研芯片成色幾何？

證券時報網阮潤生 2025-05-21 19:59
600610，“天地板”！002040、002735，“地天板”！

證券時報吳永芳 2025-05-21 19:13
看好港股和A股！摩根大通：中國進行了最深刻、廣泛的一輪政策調整

券商中國許盈 2025-05-21 19:58

時報熱榜

換一換

熱點視頻

換一換