谷歌重磅發布最強通用AI模型!同聲傳譯、全新AI模式搜索
來源:每日經濟新聞2025-05-21 07:32
(原標題:谷歌重磅發布最強通用AI模型!同聲傳譯、全新AI模式搜索,直接通過自然語言發問,支持長達數百字提問)

繼微軟之后,谷歌也全面擁抱人工智能(AI)智能體(Agent)。在開發者大會上,谷歌宣布要讓智能體全面進駐谷歌的主打業務搜索以及AI助手Gemini,并通過Gemini與搜索結合,推出全新的AI模式搜索。

當地時間5月20日,谷歌2025年度I/O開發者大會的主題演講展示了在AI、多模態模型、跨設備整合與開發者工具方面的最新成果。從升級后的Gemini 2.5 Pro模型到智能眼鏡的XR應用,再到AI驅動的搜索與網頁瀏覽體驗。谷歌展現的不僅是模型的性能提升,更是AI從“信息工具”進化為“通用智能體”的進步。

本次發布內容主要包括:

模型:Gemini 2.5 Pro/Flash/DeepThink;Diffusion;Imagine 4;Lyria;

應用:Gemini App、Canvas、Chrome助理、AI Mode、Agent模式;

搜索:AI Overview+Mode;支持個性化、多步推理、自動執行任務;

創作:Flow平臺、文本轉圖像、圖像轉視頻、原生音頻合成|

硬件:Android XR頭顯、智能眼鏡原型、WearOS、車載整合

谷歌最強通用AI模型Gemini 2.5 Pro

剛開場,登臺的Alphabet兼谷歌CEO皮查伊(Sundar Pichai)就強調了Gemini的重要性,稱“在谷歌,每天都是Gemini季”,并力推新模型Gemini 2.5 Pro——“迄今為止我們最強大的通用AI模型”。

皮查伊說,自上次I/O大會以來,谷歌已推出十多款模型和20項AI功能,谷歌的發布速度已經是史上最快:

“我們希望盡快將最好的模型和產品交到大家手中,因此我們的發布速度比以往任何時候都快?!?/p>

皮查伊透露,Gemini 2.5 Pro模型已在大語言模型(LLM)測評LLM Arena的所有類別排行榜上名列前茅。Gemini是熱門AI代碼編輯器Cursor上增長最快的模型。

他介紹,一年來,谷歌系統每月處理的token數量激增,從去年的9.7萬億增加到現在的480萬億,增長將近50倍。Gemini的App每月有4億多活躍用戶。

“智能體模式”將上線Chrome、搜索及Gemini App

皮查伊宣布,谷歌將在Chrome瀏覽器、搜索以及Gemini的App中推出智能體模式(Agent Mode)。

智能體可以與瀏覽器和其他軟件進行交互和操作。谷歌研究的AI智能體Mariner現在可以同時管理多達10個任務,用戶只需向其展示一次任務,它就會學習該任務,并將經驗用于未來的案例。

智能體模式的實驗版即將向Gemini App的訂閱者推出。

皮查伊現場演示Gemini App中的智能體模式,要求它幫用戶找公寓。得到指令后,Gemini搜索房產網Zillow,用電腦調整篩選條件,并使用模型上下文協議MCP預約看房。

皮查伊評價:

“這是一個新興的時代。將研究成果轉化為現實的最佳方式就是讓它真正發揮作用。”

他說,在經用戶許可的情況下,Gemini現在可以在各種App中以“私密安全”的方式使用個人信息。

在AI綜述的基礎上,谷歌在搜索引擎中正式推出由Gemini2.5模型驅動的AI模式。由于AI的特性,用戶可以向搜索引擎提出更復雜、更難的問題。谷歌表示,現在用戶從搜索引擎中得到的不只是信息,而是智慧。

圖片來源:視頻截圖

未來谷歌還將AI模式與用戶郵箱等個人信息打通,提供個性化的建議。與此同時,同類AI工具中常見的“深度研究”功能也將集成在這個模式中。

同時通過將先進多模態模型和實時對話等功能結合,谷歌也將在今年夏天推出實時影像搜索功能。用戶可以開著攝像頭向AI實時提問。

圖片來源:視頻截圖

谷歌搜索添加AI模式標簽頁支持長達數百字提問

皮查伊稱AI概覽(AI Overviews)是谷歌最成功的產品之一,每月有15億用戶在搜索中使用AI概覽,它推動某些類型的查詢增長了10%。這意味著,谷歌提供生成式AI服務的用戶規模超過其他公司。

Gemini模型將與谷歌搜索集合。它將通過AI模式(AI Mode)增強智能,成為一種強大的新型AI搜索功能,可幫助解答問題。它是搜索中的新標簽頁,也將包含在AI概覽中。

作為全新的搜索功能,AI模式讓用戶可以提出更長、更復雜的查詢。它支持長達數百字的提問、自動分解查詢意圖、并生成結構化答案。該模式當地時間5月20日就上線,作為搜索的新標簽頁形勢,向所有美國的用戶推出。

新版本中,用戶可以:

直接通過自然語言發問,系統會提供摘要式、結構化回答。

與搜索結果進行多輪對話,進一步深入了解相關內容。

獲取圖文并茂的“智能回答卡片”,例如自動整理出旅游行程、購物建議、編程指南等。

皮查伊稱:“我們正在重新定義搜索的未來。不是找到鏈接,而是直接給出答案?!?/p>

谷歌搜索負責人Liz Reid介紹,AI模式會得到名為Deep Research的模型加持,谷歌稱之為“深度搜索”(DeepSearch)。該模型將通過邏輯搜索結果和高度相關的內容,更好地整理研究主題。

“就像你身邊有一位博學助理。”它還會結合地圖、評論、視頻等生成圖表和推薦內容。

Reid說,AI模式將擁有谷歌所有最優秀的AI特性和功能?!半S著時間的推移,我們將逐步將AI模式的許多尖端特性和功能融入核心搜索體驗?!彼€說,AI模式現在就將支持AI概覽。

谷歌光束、同聲傳譯功能

谷歌光束(Google Beam):極具未來主義的視頻會議設備,從不同角度捕捉用戶影像,使用AI技術將這些視頻流合并,并在3D光場顯示器上呈現用戶的3D形象,幀率最高可達每秒60幀。首批“谷歌光束”設備將于今年晚些時候通過合作伙伴惠普推出,具體定價尚不清楚。

圖片來源:視頻截圖

同聲傳譯:在谷歌會議軟件Google Meet中,用戶可以使用不同語言進行實時對話,同時保留原聲的音色、語調和情感表達。目前已經向訂閱用戶開放英語和西班牙語之間的實時翻譯,未來幾周將陸續增加意大利語、德語和葡萄牙語等更多語言。

圖片來源:視頻截圖

此外,AI模式下也將提供購物決策的全流程支持——從“買什么”到“去哪里買”一步到位。谷歌也在實驗室中推出虛擬試穿衣服工具,用戶可以上傳一張自己的照片,直觀感受購物車里的衣服“穿在”自己身上的樣子。

AI視頻生成制作工具Flow

這款工具旨在簡化AI生成視頻的創作流程。Flow與Veo 3視頻生成模型,針對Veo 2模型的更多控制功能,以及圖像生成模型Imagen 4一同亮相。

通過Flow,用戶可以通過文字或圖片素材生成8秒的AI視頻片段,隨后使用Flow的場景構建工具將多個片段拼接成完整視頻。

與此同時, Veo 3模型不僅生成質量更高、理解提示詞更準確,還能同步生成視頻和音頻,包括不同角色的對話。此外,Veo 2將增加相機控制和對象移除等工具,Imagen 4在生成圖片時也能準確生成真實文本,而不是一堆亂碼。

推出的安卓XR平臺針對一系列AI眼鏡設備

谷歌工程主管Shahram Izadi介紹稱,除了手機外,未來幾個月里谷歌將會把Gemini AI功能拓展至智能手表、汽車控制臺、電視上,以及你的眼鏡上。

Izadi介紹稱,谷歌推出的安卓XR平臺針對一系列AI眼鏡設備,意味著每個人可能會購買不止一副AI眼鏡。例如看電影或者工作時,你需要更具沉浸感的頭戴式設備;而出行購物時,你會需要輕便的眼鏡提供實時信息。

圖片來源:視頻截圖

安卓XR是谷歌與三星、高通一起開發的平臺,自從去年公布項目后,現在已經有數百家軟件開發商為這個平臺提供適配。三星的Project Moohan是第一款安卓XR設備,并將在今年晚些時候開放購買。

谷歌也宣布,與中國AR品牌Xreal達成戰略合作,以Project Aura的名義推出第二款安卓XR設備,也是首款搭載安卓XR平臺的AR眼鏡。

責任編輯: 李志強
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    激情五月中文不卡,欧美无砖专区一中文字,久久亚洲精品影院,免费99精品国产自在现线观看
    中文手机字幕大香视频蕉 | 新婚少妇真紧视频 | 一本综合五月花在线视频 | 日韩精品一区二区在线 | 在线人成亚洲视频免费观看 | 在线一区二区三区免费视频 |