Google DeepMind 推出 Gemini Robotics-ER 1.6,提升空間推理能力

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Google DeepMind 已推出 Gemini Robotics-ER 1.6,這是一款具有增強空間推理和多角度理解能力的新模型。此次更新提升了點選準確性、任務檢測能力,並能讀取工業儀器。開發者可透過 Gemini API 和 Google AI Studio 存取該模型。此 AI + 加密貨幣新聞更新重點介紹了 AI 在機器人與自動化領域的最新整合進展。

Odaily 星球日報訊 谷歌 DeepMind 發布 Gemini Robotics-ER 1.6,定位為機器人的高層推理模型,相比前代 ER 1.5 和 Gemini 3.0 Flash 在空間推理和多視角理解上有顯著提升。模型已通過 Gemini API 和 Google AI Studio 向開發者開放,核心升級包括三項能力:

1. 指向(pointing)精度提升:可用於精確物體檢測、計數、空間關係推理(如 "指出所有能放進藍色杯子的物體")和運動軌跡規劃,並能正確拒絕指向畫面中不存在的物體

2. 多視角成功檢測:機器人現在能綜合多個攝像頭畫面判斷任務是否完成,即使在遮擋或動態環境下也能保持準確

3. 新增儀表讀取能力:可解讀圓形壓力錶、垂直液位指示器和數位顯示屏等多種工業儀表,透過 agentic vision(視覺推理 + 代碼執行)實現逐步推理,先放大細節區域,再透過指向和代碼計算比例與間隔,最後結合世界知識得出讀數

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露