এটি একটি সমস্যা যার সাথে যে কেউ কোড ডিবাগ করেছেন তিনি সহজেই সম্পর্কিত হতে পারেন: আপনি কিছু চেষ্টা করেন, এটি ব্যর্থ হয়, আপনি আবার চেষ্টা করেন, এটি ভিন্নভাবে ব্যর্থ হয়, এবং সাততম চেষ্টায় আপনি ভুলে যান আপনি আগে কী বাদ দিয়েছেন। এখন কল্পনা করুন যে এই চক্রটি একটি AI এজেন্টের ভিতরে চলছে, কিন্তু ভুলে যাওয়ার পরিবর্তে, এজেন্টটি পূর্ববর্তী প্রতিটি চেষ্টার হাজার হাজার টোকেনের বিস্তারিত এক্সিকিউশন লগের মধ্যে ডুবছে।
মেটা গবেষকদের কাছে একটি আশ্চর্যজনকভাবে সুন্দর সমাধান খুঁজে পাওয়া গেছে। কোডিং এজেন্টগুলিকে তাদের পূর্ণ কাঁচা ইতিহাস প্রদানের পরিবর্তে, তারা প্রমাণ করেছেন যে অতীতের চেষ্টাগুলির সংক্ষিপ্ত, সংগঠিত সারসংক্ষেপগুলি ভবিষ্যতের চেষ্টাগুলিকে অনেক বেশি কার্যকরভাবে পথনির্দেশ করতে পারে।
কম হলো বরং বেশি
মূল প্রতিফলনটি প্রায় বিপরীত, যে যুগে “বেশি ডেটা” সাধারণত ডিফল্ট উত্তর। একটি কোডিং এজেন্ট কী চেষ্টা করেছিল এবং কেন এটি ব্যর্থ হয়েছিল তার দুটি লাইনের সংক্ষিপ্ত সারসংক্ষেপ, পরবর্তী পদক্ষেপ নির্দেশ করার ক্ষেত্রে হাজার হাজার টোকেনের কাঁচা বাস্তবায়ন লগের চেয়ে ভালো ফলাফল দিতে পারে।
এই কার্যপ্রণালী দুটি দিকে কাজ করে। প্রথমত, এটি প্রসঙ্গের শব্দ কমিয়ে দেয়, যা সংকেত-প্রদূষণ অনুপাতের ক্ষতির AI-এর সমতুল্য। যখন এজেন্টের প্রসঙ্গ উইন্ডোটি দীর্ঘ, পুনরাবৃত্তিমূলক লগ ডেটা দিয়ে ভরে যায়, তখন উপযোগী তথ্যটি গোপন হয়ে যায়। সারাংশকরণের মাধ্যমে সংকুচিতকরণ শব্দকে সরিয়ে ফেলে এবং বাস্তবিকভাবে গুরুত্বপূর্ণ বিষয়গুলি বজায় রাখে।
দ্বিতীয়ত, এবং হয়তো আরও গুরুত্বপূর্ণভাবে, এটি ব্যর্থতার পুনরাবৃত্তি রোধ করে। কী ভুল হয়েছিল তার পরিষ্কার রেকর্ড ছাড়া, এজেন্টরা একই ভুলগুলি বারবার করে। একটি সংগঠিত সারসংক্ষেপ হলো “আবার এটি করবেন না”-এর একটি চেকলিস্ট, যা পুনরাবৃত্তিমূলক সমস্যা সমাধানের জন্য অত্যন্ত মূল্যবান হয়ে ওঠে।
এই পদ্ধতিটি গবেষকদের এজেন্ট উন্নতি সম্পর্কে চিন্তা করার দিকে একটি দার্শনিক পরিবর্তন নিয়ে আসে। পুনরায় চেষ্টার সংখ্যা বাড়ানো বা সমস্যার জন্য আরও বেশি কম্পিউট শক্তি ব্যয় করার পরিবর্তে, ফোকাস মেমোরি সংকুচন এবং অভিজ্ঞতা পুনর্ব্যবহারের দিকে সরে যায়।
মেটার ব্যাপক এজেন্ট গবেষণায় এটি কোথায় জায়গা পায়
এই কাজটি একটি শূন্যস্থানে বিদ্যমান নয়। এটি মেটা-এর নিজেকে উন্নত করতে পারে এমন এজেন্ট সিস্টেমে তাদের চলমান প্রচেষ্টার অংশ, যা ২০২৬ সালের শুরুতে হাইপারএজেন্টস এবং মেটা-হারনেসের মতো ফ্রেমওয়ার্ক তৈরি করেছে।
পূর্বের এই কাঠামোগুলি স্বয়ংক্রিয় এআই সিস্টেমের জন্য ভিত্তি তৈরি করেছিল যেগুলি সময়ের সাথে সাথে নিজেদের কার্যক্রমের যুক্তি উন্নত করতে পারে। তাদের যে চ্যালেঞ্জের সম্মুখীন হত, তা ছিল সামজ্ঞানিক বোঝা, বিশেষ করে, অভিজ্ঞতা সঞ্চয়ের সাথে সাথে এজেন্টগুলিকে তাদের নিজস্ব ঐতিহাসিক ডেটা দ্বারা অতিপ্রবাহিত হতে থাকা থেকে কীভাবে বাঁচানো যায়।
সারাংশ পদ্ধতিটি সরাসরি সেই বন্ধনীকে সমাধান করে। এজেন্ট এখনও অভিজ্ঞতা সঞ্চয় করে, কিন্তু এখন এটি সেই অভিজ্ঞতাকে কিছু সংক্ষিপ্ত এবং কার্যকরী রূপে প্রক্রিয়া করে, তারপর ভবিষ্যতের সিদ্ধান্ত গ্রহণের জন্য এটি ফিরিয়ে দেয়।
এটি বিনিয়োগকারীদের এবং এআই পরিস্থিতির জন্য কী অর্থ বহন করে
এখন, বেশিরভাগ কোডিং এজেন্ট কোম্পানি তাদের পণ্যগুলি স্কেল আপ করে উন্নত করে। বেশি কম্পিউট, বেশি পুনরায় চেষ্টা, দীর্ঘতর কনটেক্সট উইন্ডো। এগুলি সবই টাকা খরচ করে। যদি মেটার পদ্ধতি ব্যাপক অ্যাপ্লিকেশনে সফল হয়, তাহলে এটি এমন একটি পথ নির্দেশ করে যা রৈখিকভাবে বাড়তে থাকা খরচের প্রয়োজনীয়তা ছাড়াই ভালো পারফরম্যান্সের দিকে নিয়ে যায়।
যেমন সবসময় গবেষণা পত্রের ক্ষেত্রে, ঝুঁকি হলো নিয়ন্ত্রিত ফলাফলগুলি সবসময় উৎপাদন পরিবেশে প্রয়োগ করা যায় না। কোডিং বেঞ্চমার্কগুলি বাস্তব বিশ্বের সফটওয়্যার ইঞ্জিনিয়ারিংয়ের চেয়ে বেশি পরিষ্কার, এবং সেই দুই লাইনের সারাংশগুলির গুণগত মান অত্যন্ত গুরুত্বপূর্ণ। একটি খারাপ সারাংশ কোনো সারাংশই না থাকার চেয়েও খারাপ হতে পারে, যা সহায়ক সংকেতের পরিবর্তে ভুলবিভ্রান্তিকর সংকেত প্রবর্তন করে।
