Google DeepMind 發表全新的機器人基礎模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。這款模型在視覺與空間推理方面達到當前最佳水準(SOTA),並已透過 Gemini API 開放使用。Google AI 開發者關係負責人 Logan Kilpatrick 在社群媒體上公布了這項消息。(來源)
什麼是 Embodied Reasoning?
Embodied Reasoning 是指 AI 模型理解並推理物理世界的能力。與傳統的語言模型不同,具身推理模型需要處理三維空間中的物體位置、形狀、材質與物理互動關係。Gemini Robotics ER 1.6 專門針對這類任務進行優化,使機器人能夠更準確地理解周圍環境並做出適當的動作決策。
核心能力
Gemini Robotics ER 1.6 的主要優勢集中在兩個面向:
能力 說明 視覺推理 能夠從影像與影片中辨識物體、理解場景結構,並據此進行決策 空間推理 理解三維空間中物體的相對位置、距離與方向,支援複雜的操作規劃
這兩項能力的結合讓機器人能夠處理更複雜的現實世界任務。例如,在倉儲環境中,機器人需要同時辨識不同形狀的物品,並計算最佳的抓取角度與放置位置 — 這正是 Gemini Robotics ER 1.6 所擅長的場景。
透過 Gemini API 使用
與過去許多僅停留在論文階段的機器人模型不同,Gemini Robotics ER 1.6 已經透過 Gemini API 提供存取。這意味著開發者與硬體廠商可以直接將這款模型整合到自己的機器人系統中,無需從零開始訓練模型。
API 的開放也降低了機器人 AI 的開發門檻。過去,開發一套具備視覺與空間推理能力的機器人系統需要大量的資料收集與模型訓練工作。現在,開發者可以專注在硬體設計與應用場景的開發上,將底層的推理能力交給 Gemini Robotics ER 1.6 處理。
Google 的機器人 AI 布局
Gemini Robotics ER 1.6 是 Google DeepMind 在機器人領域的最新成果。從早期的 RT-2 到現在的 Gemini Robotics 系列,Google 持續將大型語言模型的能力延伸到物理世界的互動中。ER 1.6 版本在前代基礎上進一步提升了推理精度,特別是在需要精細操作的場景中表現更為出色。
隨著機器人產業進入新一輪成長期,具備強大視覺與空間推理能力的基礎模型將成為關鍵基礎設施。想了解更多 Gemini 生態系的發展,可以參考 Gemini 完整指南。
這篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 機器人模型,擅長視覺與空間推理 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Google 加碼 400 億美元投資 Anthropic:先付 100 億、再依業績釋放 300 億,配 5GW TPU 算力
Alphabet 對 Anthropic 加碼至 400 億美元,分兩階段:首筆 100 億美元現金注入、估值 3,800 億美元;剩餘 300 億美元於業績達標後分階段釋放。Google Cloud 五年內提供 5 GW TPU 計算資源;同期 Amazon 也宣布最高 250 億美元投資,顯示 Anthropic 的算力與資本支援同步增強。
鏈新聞abmedia22分鐘前
SpaceX、OpenAI 與 Anthropic 的 IPO 可能吸引超過 $240 0 億美元,並或將影響加密市場流動性
Gate News 消息,4 月 25 日——根據市場報導,SpaceX 預計在 6 月上市,融資目標將超過沙烏地阿美創下的 $29 0 億美元 IPO 之紀錄;同時 OpenAI 與 Anthropic 計畫在 2026 年下半年掛牌。外界預計這三家公司將
GateNews1小時前
DeepSeek-V4 預覽版發布:1M 上下文視窗,華為 DCS AI 解決方案提供全面支援
Gate News 訊息,4 月 25 日 — DeepSeek-V4 預覽版本已正式發布並開源,包含擴展的 100 萬 tokens 上下文視窗,並引入帶壓縮演算法的 KV Cache sliding window,以降低 Attention 的計算複雜度並緩解記憶體頻寬壓力。新模型顯著提升了代理能力,並在長序列推理與複雜任務處理方面展現出更高的效率與穩定性,儘管也帶來新的基礎設施挑戰。
GateNews2小時前
當微軟、亞馬遜收緊供應後 GPU 供應短缺回歸;AI 新創面臨 32% 價格調漲與年底排隊
Gate News 訊息,4 月 25 日 — 隨著微軟與亞馬遜等主要雲端服務供應商將運算產能集中用於內部團隊與像 OpenAI、Anthropic 這樣的重大客戶,GPU 供應短缺再次浮現;這使較小型的 AI 新創面臨價格上漲、等待時間延長,以及更嚴格的合約條款,然而
GateNews3小時前
Nvidia 在 Blackwell 基礎設施上於整個員工隊伍部署 OpenAI Codex AI 代理
Gate News 訊息,4 月 25 日——根據 CEO Jensen Huang 與 OpenAI CEO Sam Altman 的內部通訊,Nvidia 已在成功試點後,將由 GPT-5.5 驅動的 OpenAI Codex(AI 代理)推送到其整個員工隊伍,試點規模約為 10,000 名員工。
Codex 旨在協助
GateNews4小時前
美國國務院警告 DeepSeek AI 模型蒸餾
根據路透社報導,美國國務院於4月24日向全球的外交與領事機構發布一份電報,警告外國政府有關中國透過蒸餾(distillation)複製美國AI系統的努力。該電報
Crypto Frontier4小時前