ওডেইলি প্ল্যানেট ডেইলি সংবাদ: গুগল ডিপমাইন্ড জেমিনি রোবোটিক্স-ইআর ১.৬ প্রকাশ করেছে, যা রোবোটের হাই-লেভেল রিজনিং মডেল হিসেবে চিহ্নিত, যা আগের ইআর ১.৫ এবং জেমিনি ৩.০ ফ্ল্যাশের তুলনায় স্থানিক যুক্তি এবং মাল্টি-ভিউ বোঝার ক্ষেত্রে উল্লেখযোগ্যভাবে উন্নত। মডেলটি এখন জেমিনি API এবং গুগল এআই স্টুডিওর মাধ্যমে ডেভেলপারদের জন্য উন্মুক্ত, মূল আপগ্রেডগুলির মধ্যে রয়েছে তিনটি ক্ষমতা:
1. পয়েন্টিং সঠিকতা উন্নত: পরিষ্কার বস্তু শনাক্তকরণ, গণনা, স্থানিক সম্পর্ক যুক্তি (যেমন "সমস্ত নীল কাপে রাখা যায় এমন বস্তুগুলি ইঙ্গিত করুন") এবং গতিপথ পরিকল্পনার জন্য ব্যবহার করা যেতে পারে, এবং চিত্রে উপস্থিত না থাকা বস্তুগুলির ইঙ্গিত সঠিকভাবে অস্বীকার করতে পারে
2. একাধিক দৃষ্টিকোণে সফল শনাক্তকরণ: রোবট এখন একাধিক ক্যামেরার দৃশ্য একত্রিত করে চেক করে যে কাজটি সম্পন্ন হয়েছে কিনা, যদিও বাধা বা গতিশীল পরিবেশেও এটি সঠিক থাকে।
৩. ড্যাশবোর্ড পাঠ্য ক্ষমতা যোগ করা হয়েছে: বৃত্তাকার চাপ মিটার, উল্লম্ব তরল স্তর ইন্ডিকেটর এবং ডিজিটাল ডিসপ্লের মতো বিভিন্ন শিল্প মিটার বুঝতে পারে, agentic vision (দৃশ্য যুক্তি + কোড বাস্তবায়ন) ব্যবহার করে ধাপে ধাপে যুক্তি প্রয়োগ করে, প্রথমে বিস্তারিত অঞ্চলকে বড় করে, তারপর ইঙ্গিত এবং কোডের মাধ্যমে অনুপাত এবং ব্যবধান গণনা করে, শেষে বিশ্বজনীন জ্ঞানের সাহায্যে পাঠ নির্ণয় করে
