Odaily Planet Daily News: Ipinakilala ng Google DeepMind ang Gemini Robotics-ER 1.6, na isang high-level reasoning model para sa mga robot, na may malaking pagpapabuti sa spatial reasoning at multi-view understanding kumpara sa nakaraang bersyon na ER 1.5 at Gemini 3.0 Flash. Ang model ay naging available sa mga developer sa pamamagitan ng Gemini API at Google AI Studio, kasama ang mga pangunahing pagpapabuti:
1. Pagpapabuti ng pagkakatumpak ng pagtuturo: Maaaring gamitin para sa tumpak na pagdetekta, pagbilang, pag-iisip ng espasyal na ugnayan (tulad ng "tukuyin ang lahat ng bagay na maaaring ilagay sa berdeng baso") at pagplano ng trahektorya ng galaw, at makakatanggap nang tama ng pagtuturo sa mga bagay na hindi umiiral sa larawan
2. Maraming pananaw para sa matagumpay na pagdetekta: Ang robot ay kaya ng mag-isip mula sa maraming camera feed upang matukoy kung natapos na ang gawain, at nananatiling akurat kahit sa mga nakakapagkakita o dinamikong kalagayan
3. Dagdag na kakayahan sa pagbasa ng mga instrumento: Makakabasa ng iba’t ibang uri ng industriyal na instrumento tulad ng circular pressure gauge, vertical level indicator, at digital display, gamit ang agentic vision (visual reasoning + code execution) para sa step-by-step reasoning: una ay i-zoom ang mga detalyeng rehiyon, pagkatapos ay gamitin ang point at code para kalkulahin ang ratio at spacing, at huli ay i-combine ang world knowledge upang makakuha ng basa
