জেংজিয়াং বিশ্ববিদ্যালয়ের দল মানব চেতনার প্রেরণায় একটি নতুন এআই প্রশিক্ষণ পদ্ধতি প্রস্তাব করেছে

বড় মডেলগুলি সর্বদা বড় হচ্ছে, এবং প্রচলিত মতামত হলো যে মডেলের প্যারামিটার যত বেশি হবে, ততই এটি মানুষের চিন্তার পদ্ধতির কাছাকাছি যাবে। তবে জেজিয়াং বিশ্ববিদ্যালয়ের দল ১ এপ্রিল ন্যাচার কমিউনিকেশনস-এ একটি পেপার প্রকাশ করেছেন (মূল লিঙ্ক: https://www.nature.com/articles/s41467-026-71267-5)। তারা দেখেছেন যে মডেলগুলি (প্রধানত SimCLR, CLIP, DINOv2) বড় হওয়ার সাথে সাথে বিশেষ বস্তুগুলি চিনতে পারা আসলেই উন্নতি পায়, কিন্তু বিমূর্ত ধারণা বুঝতে পারা শক্তি শুধুমাত্র উন্নতি পায়নি, বরং কমেছে। ২.২০৬ মিলিয়ন থেকে ৩০৪.৩৭ মিলিয়ন প্যারামিটারের বৃদ্ধির সাথে সাথে, বিশেষ ধারণা টাস্ক ৭৪.৯৪% থেকে ৮৫.৮৭% এ上升, কিন্তু বিমূর্ত ধারণা টাস্ক ৫৪.৩৭% থেকে ৫২.৮২% এ下降।

মানুষ এবং মডেলের চিন্তার পদ্ধতির পার্থক্য

মানুষ ধারণা প্রক্রিয়াকরণের সময় প্রথমে একটি শ্রেণীবিন্যাসের সম্পর্ক গঠন করে। হংস এবং উল্লুক একই মতো দেখায় না, তবুও মানুষ তাদের উভয়কেই পাখি শ্রেণীতে রাখে। আরও উপরে, পাখি এবং ঘোড়াকে প্রাণী শ্রেণীতে রাখা যায়। মানুষ যখন কিছু নতুন জিনিস দেখে, তখন প্রায়শই ভাবে যে, এটি আগের কোনো কিছুর মতো, এটি কোন শ্রেণীর। মানুষ নতুন ধারণা শিখতে থাকে, এবং অভিজ্ঞতা সংগঠিত করে, এই সম্পর্কগুলির মাধ্যমে নতুন বস্তুগুলি চিহ্নিত করে এবং নতুন পরিস্থিতির সাথে খাপ খাইয়ে নেয়।

মডেলও শ্রেণীবদ্ধ করে, কিন্তু এটি গঠনের পদ্ধতি ভিন্ন। এটি প্রধানত বড় পরিমাণে ডেটার মধ্যে পুনরাবৃত্তি হওয়া ফর্মগুলির উপর নির্ভর করে। যত বেশি বিশেষ বস্তু দেখা যায়, মডেলটি তত সহজেই এটিকে চিনতে পারে। বড় শ্রেণীর পর্যায়ে এলে, মডেলটির জন্য কঠিন হয়ে পড়ে। এটির জন্য বিভিন্ন বস্তুর মধ্যে সাধারণ বৈশিষ্ট্যগুলি চিনতে হবে, এবং এই সাধারণ বৈশিষ্ট্যগুলিকে একই শ্রেণীতে সাজাতে হবে। বর্তমান মডেলগুলির এখানে স্পষ্টভাবেই দুর্বলতা রয়েছে। প্যারামিটারগুলি আরও বাড়ানোর সাথে সাথে, বিশেষ ধারণা-ভিত্তিক কাজগুলি উন্নতি পায়, কিন্তু বিমূর্ত ধারণা-ভিত্তিক কাজগুলি কখনও কখনও হ্রাসও পায়।

মানুষের মস্তিষ্ক এবং মডেলের মধ্যে একটি সাদৃশ্য হল যে উভয়ের ভিতরেই একটি শ্রেণীবিন্যাসের সম্পর্ক গঠিত হয়। তবে উভয়ের প্রাধান্য ভিন্ন: মানুষের মস্তিষ্কের উচ্চতর দৃশ্যমান অঞ্চলগুলি প্রাকৃতিকভাবে জীবজগত এবং অজীবজগতের মতো বড় শ্রেণীগুলিকে পৃথক করে। অন্যদিকে, মডেলগুলি বিশেষ বস্তুগুলিকে পৃথক করতে পারে, কিন্তু এই বড় শ্রেণীগুলির স্থিতিশীলভাবে গঠন করতে পারে না। এই পার্থক্যটির ফলে, মানুষের মস্তিষ্ক সহজেই পুরনো অভিজ্ঞতা নতুন বস্তুতে প্রয়োগ করতে পারে, তাই আমরা আগে দেখা না থাকা জিনিসগুলির সাথেও দ্রুত শ্রেণীবদ্ধকরণ করতে পারি। অন্যদিকে, মডেলগুলি বর্তমান জ্ঞানের উপর বেশি নির্ভরশীল, তাই নতুন বস্তুগুলির সাথে মোকাবিলা করার সময়, এগুলি পৃষ্ঠস্তরের বৈশিষ্ট্যগুলিতেই আটকে যায়। পেপারটি যে পদ্ধতির প্রস্তাবনা করেছে, তা এই বৈশিষ্ট্যটির চারপাশেই ঘোরাঘুরি খায়—মস্তিষ্কেরসংকেতকে ব্যবহার করে মডেলের内部 구조কে সীমাবদ্ধকরণ,যাতেএটিমানুষেরমস্তিষ্কেরশ্রেণীবদ্ধকরণপদ্ধতিরকাছাকাছিহয়।

জেডান দলের সমাধান

টিম দ্বারা প্রস্তাবিত সমাধানটিও অনন্য, যা শুধুমাত্র প্যারামিটার বাড়ানোর পরিবর্তে কম সংখ্যক মস্তিষ্ক সংকেত ব্যবহার করে সুপারভাইজড। এই মস্তিষ্ক সংকেতগুলি মানুষ ছবি দেখার সময়ের মস্তিষ্কের ক্রিয়াকলাপের রেকর্ড থেকে আসে। পেপারটিতে উল্লেখ করা হয়েছে, human conceptual structures transfer করা হয়েছে DNNs-এর কাছে। এর অর্থ হলো, মানুষের মস্তিষ্ক কিভাবে শ্রেণীবদ্ধ করে, কিভাবে সাধারণীকরণ করে, এবং কিভাবে সদৃশ ধারণাগুলিকে একত্রিত করে, সেই প্রক্রিয়াগুলিকে মডেলকে শেখানোর চেষ্টা করা হয়েছে।

টিম ১৫০টি পরিচিত প্রশিক্ষণ শ্রেণী এবং ৫০টি অপরিচিত পরীক্ষামূলক শ্রেণী ব্যবহার করে পরীক্ষা করেছে। ফলাফল দেখায় যে, প্রশিক্ষণ প্রগতির সাথে সাথে মডেল এবং মস্তিষ্কের প্রতিনিধিত্বের মধ্যে দূরত্ব ধারাবাহিকভাবে কমছে। এই পরিবর্তন উভয় শ্রেণীতেই দেখা যায়, যা নির্দেশ করে যে মডেলটি একক নমুনা শেখেনি, বরং মানব মস্তিষ্কের কাছাকাছি একটি ধারণাগত সংগঠন শিখছে।

এই প্রশিক্ষণ সেটের পরে, মডেলটি খুব কম নমুনার সাথে শেখার ক্ষমতা বাড়ে এবং নতুন পরিস্থিতিতে ভালোভাবে পারফর্ম করে। একটি কাজে, যেখানে খুব কম উদাহরণ দেওয়া হয়েছিল এবং মডেলকে জীব এবং অজীব এই বিশুদ্ধ ধারণাগুলি পৃথক করতে হয়েছিল, মডেলটি গড়ে 20.5% উন্নতি করেছে এবং অনেক বেশি প্যারামিটার সহ তুলনামূলক মডেলগুলিকেও ছাড়িয়েছে। দলটি 31টি বিশেষ পরীক্ষা আরও চালিয়েছে, যেখানে বিভিন্ন মডেলগুলি প্রায় 10% উন্নতি দেখিয়েছে।

গত কয়েক বছরে মডেল শিল্পের পরিচিত পথ ছিল বড় মডেল স্কেল। জেজিয়াং বিশ্ববিদ্যালয়ের দল তবে অন্য একটি দিক বেছে নিয়েছে, বিগার ইজ বেটার থেকে স্ট্রাকচার্ড ইজ স্মার্টার-এর দিকে। স্কেল বৃদ্ধি সত্যিই কার্যকর, কিন্তু এটি মূলত পরিচিত কাজগুলিতে পারফরম্যান্স বাড়ায়। মানুষের মতো বিষয়গুলির সারমর্মগত বুঝতে এবং স্থানান্তরিত করতে পারা AI-এর জন্যও অত্যন্ত গুরুত্বপূর্ণ, এবং এটির জন্য AI-এর চিন্তার কাঠামোকে ভবিষ্যতে মানুষের মস্তিষ্কের কাছাকাছি আনা দরকার। এই দিকটির মূল্য হলো, এটি শিল্পের মনোযোগকে শুধুমাত্র স্কেল বৃদ্ধির দিকের পরিবর্তে, পুনরায় চিন্তার কাঠামোর দিকে ফিরিয়ে আনছে।

নিওসোল এবং ভবিষ্যৎ

এটি একটি বড় সম্ভাবনার দিকে নিয়ে যায় যে, AI-এর উন্নতি শুধুমাত্র মডেল প্রশিক্ষণের পর্যায়ে ঘটবে না। মডেল প্রশিক্ষণ নির্ধারণ করতে পারে AI কিভাবে ধারণাগুলি সংগঠিত করবে এবং কিভাবে উচ্চতর মানের বিচার কাঠামো গঠন করবে। বাস্তব জগতে প্রবেশের পর, AI-এর আরেকটি স্তরের উন্নতি শুরু হয়: AI agent-এর বিচারগুলি কিভাবে রেকর্ড করা হবে, কিভাবে পরীক্ষা করা হবে, এবং বাস্তব প্রতিযোগিতার মধ্যে দিয়ে কিভাবে নিজেকে শিখে এবং উন্নত করবে, মানুষের মতো। Neosoul এখনই এটিই করছে। Neosoul শুধুমাত্র AI agent-এর উত্তর উৎপাদন করেনি, বরং AI agent-কে একটি অবিরাম পূর্বানুমান, অবিরাম যাচাই, অবিরাম সেটেলমেন্ট, এবং অবিরাম ছন্নছাড়ার সিস্টেমের মধ্যে রেখেছে, যাতে AI agent-টি পূর্বানুমান এবং ফলাফলের মধ্যে নিজেকে অপটিমাইজ করতে পারে, যাতে ভালো কাঠামোগুলি বজায় থাকে, এবংখারাৎকাঠামোগুলি বাদপড়ে। Zhejiang University-এর দল এবং Neosoul-এর সম্মিলিত লক্ষ্যটি, আসলে, একই: AI-কেশুধুমাত্রপ্রশ্নসমাধানকরতেহওয়াদরকারনয়,এটিকেসম্পূর্ণভাবেচিন্তাশক্তিসহজনসমৃদ্ধহতেহবেএবংঅবিরতভাবেউন্নতহতেহবে।