রিকার্সিভ সুপারইন্টেলিজেন্স প্রথম অটোমেটেড এআই গবেষণা সিস্টেম প্রকাশ করেছে

কয়েক দিন আগে, Anthropic একটি "যখন AI নিজেকে তৈরি করে" শিরোনামের প্রবন্ধ প্রকাশ করে ব্যাপক আলোচনার সূচনা করে। প্রবন্ধটি একটি চমকপ্রদ অভ্যন্তরীণ ডেটা প্রকাশ করে: 2026 সালের মে মাসের মধ্যে, Anthropic-এর কোডবেসের 80% এরও বেশি কোড Claude দ্বারা লেখা হয়েছে, এবং ইঞ্জিনিয়ারদের প্রতিদিন মার্জ করা কোডের পরিমাণ 2024 সালের তুলনায় 8 গুণ; একটি অভ্যন্তরীণ পরীক্ষায়, Claude একটি ট্রেনিং কোডের রানিং স্পিডকে বেসলাইনের তুলনায় প্রায় 52 গুণ বাড়িয়েছে, যখন একজন অভিজ্ঞ মানব গবেষক সাধারণত 4 থেকে 8 ঘন্টা সময় নিয়ে 4 গুণ স্পিডআপ অর্জন করেন।

অ্যানথ্রোপিক এই পথটিকে একটি গভীরতর লক্ষ্যের দিকে নিয়ে যায়: "পুনরাবৃত্তিমূলক স্ব-উন্নয়ন" — যেখানে AI সিস্টেমগুলি নিজেদের পরবর্তী সংস্করণগুলি স্বয়ংক্রিয়ভাবে ডিজাইন, তৈরি এবং প্রশিক্ষণ দেয়, যেখানে মানুষ প্রতিটি পদক্ষেপের জন্য প্রেরণা হয়ে উঠেনি। মনোযোগ দেওয়ার বিষয় হল, কোম্পানিটি শিল্পের সমন্বয়েরও আহ্বান জানিয়েছে, যাতে পুনরাবৃত্তিমূলক স্ব-উন্নয়নের মুহূর্তে উন্নত AI উন্নয়নকে স্থগিত করা বা অস্থায়ীভাবে বন্ধ করার বিকল্প থাকে। এবং অ্যানথ্রোপিক 이미 এটি করছে: সর্বশেষ Claude Fable 5-কে উন্নত AI-এর গবেষণা-উন্নয়নের জন্য ব্যবহার করা থেকে সীমাবদ্ধ করা।

এবং এখন, রিকার্সিভ সুপারইন্টেলিজেন্স স্বয়ংক্রিয় এআই গবেষণার দিকে প্রথম পদক্ষেপ ঘোষণা করেছে।

টিয়ান ইয়ানড়ং-এর সহ-প্রতিষ্ঠাতা এই নতুন কোম্পানিটি শুধু এক মাস আগে গোপনীয়তা থেকে বেরিয়েছে, এখন তারা প্রথম পাবলিক টেকনোলজি ফলাফল ঘোষণা করেছে। তারা একটি ওপেন-সোর্স অটোমেটেড জ্ঞান আবিষ্কার সিস্টেম তৈরি করেছে এবং তিনটি বেঞ্চমার্কে SOTA ফলাফল অর্জন করেছে। সহজ ভাষায়, তারা AI-কে আপনার জন্য পরীক্ষা চালানোর সফলতা অর্জন করেছে।

https://x.com/tydsh/status/2065062838255649082

প্রথম ধাপের ফলাফল: এআইকে আপনার জন্য পরীক্ষা চালানো

Recursive এই প্রথম পাবলিক টেকনোলজি আউটপুটের নাম «First Steps Toward Automated AI Research» (অটোমেটেড এআই রিসার্চের দিকে প্রথম পদক্ষেপ)।

টুইট: https://x.com/Recursive_SI/status/2064980090702962699
রিপোজিটরি ঠিকানা: https://github.com/recursive-org/first-steps-toward-automated-ai-research
ব্লগ ঠিকানা: https://www.recursive.com/articles/first-steps-toward-automated-ai-research

একটি বাক্যে সারাংশ দিলে, এই কাজের মূল বিষয় হল: একটি সিস্টেম তৈরি করা হয়েছে যা এআই গবেষণা চক্রকে স্বয়ংক্রিয়ভাবে এগিয়ে নিয়ে যায় এবং তিনটি বেঞ্চমার্কে সেরা ফলাফল ভাঙে।

প্রকৃত ফলাফল বিশ্লেষণের আগে, এই সিস্টেমের ডিজাইন লজিক বুঝতে প্রয়োজন।

প্রাচীন এআই গবেষণা প্রক্রিয়াটি একটি উচ্চ মানুষ-নির্ভর "ধারণা তৈরি—কোড লেখা—পরীক্ষা চালানো—ফলাফল বিশ্লেষণ—আবার ধারণা তৈরি" বন্দনা। এর দক্ষতার বাধা কম্পিউটিং শক্তির নয়, বরং মানুষের। বিশ্বব্যাপী অগ্রণী প্রশিক্ষণ প্রক্রিয়া ডিজাইন করতে পারে এমন গবেষকদের সংখ্যা খুবই কম, এবং প্রতিটি পরীক্ষা পুনরাবৃত্তির জন্য তাদের উচ্চ মাত্রায় হস্তক্ষেপের প্রয়োজন।

রিকার্সিভের সিস্টেম এই সার্কুলার প্রক্রিয়াটিকে অটোমেট করার চেষ্টা করছে।

এটি কাজ করে এভাবে: একটি স্পষ্ট অপ্টিমাইজেশন লক্ষ্যের জন্য, সিস্টেম স্বয়ংক্রিয়ভাবে পরীক্ষার ধারণা প্রস্তাব করে, কোড বাস্তবায়ন করে, যাচাইয়ের জন্য চালায়, থেকে শিখে, এবং পরবর্তী অনুসন্ধানের দিকনির্দেশনা নির্ধারণ করে। একাধিক গবেষণা পথ একসাথে এগিয়ে যেতে পারে, কার্যকরী আবিষ্কারগুলি বিভিন্ন কাজের মধ্যে পুনর্ব্যবহারযোগ্য, এবং পুরস্কার হ্যাকিং (reward hacking) শনাক্তকরণ পদ্ধতি সম্পূর্ণ চক্রের মধ্যেই অন্তর্ভুক্ত, যাতে সিস্টেম "সহজপথ" বেছে নিয়ে মূল্যায়ন সূচকগুলি বাড়ায়, কিন্তু কিছুই প্রকৃতপক্ষে উন্নতি করে না।

এটি একটি একক সমস্যার জন্য ফাইন-টিউন করা বিশেষায়িত টুল নয়, বরং একটি বহু-ক্ষেত্রের সাধারণ গবেষণা স্বয়ংক্রিয়করণ ফ্রেমওয়ার্ক। রিকার্সিভ এটি প্রমাণ করে তিনটি পৃথক পরীক্ষার পরিস্থিতি দিয়ে।

তিনটি মাঠ, তিনটি নতুন রেকর্ড

প্রেক্ষাপট ১: স্থির বাজেটের অধীনে ছোট মডেল ট্রেনিং (NanoChat Autoresearch)

এই বেঞ্চমার্কের নিয়মগুলি অ্যান্ড্রেজ কারপাথি (GPT-2-এর লেখক এবং পূর্বের OpenAI-এর প্রতিষ্ঠাতা) দ্বারা শুরু করা autoresearch প্রকল্প থেকে এসেছে: একটি GPU-এ, পাঁচ মিনিটের স্থির ট্রেনিং বাজেট দেওয়া হলে, একটি ছোট ভাষা মডেলকে সম্ভবত সবচেয়ে কম ভ্যালিডেশন লসে (BPB-এর মাধ্যমে পরিমাপ, যত কম তত ভালো) ট্রেন করুন।

এই পরিস্থিতিটি স্বাভাবিকভাবেই স্বয়ংক্রিয় গবেষণার জন্য উপযুক্ত: পরীক্ষার চক্র সংক্ষিপ্ত, সূচকগুলির ভেদাঙ্ক কম, এবং অনুচিত আচরণ শনাক্ত করা সহজ। এই কারণে, একটি "autoresearch@home" নামের সম্প্রদায়-ভিত্তিক প্রকল্প দীর্ঘদিন ধরে এই বেঞ্চমার্কে চলছে—দশটিরও বেশি মানব গবেষক এবং শতাধিক AI এজেন্টের সহযোগিতায় সূচকগুলি নিয়মিত কমিয়ে আনা হচ্ছে।

Recursive সিস্টেমটি একই প্রাথমিক কোড দিয়ে শুরু করে বিসি পি বি ভেরিফিকেশনকে সম্প্রদায়ের সেরা 0.9372 থেকে 0.9109-এ উন্নত করেছে, যা 0.0263 বিপিবি উন্নতি। অন্যভাবে বলা যায়: একই প্রশিক্ষণ মানের জন্য, Recursive-এর সমাধানটি প্রতিদ্বন্দ্বীর তুলনায় শুধুমাত্র 1.3 গুণ কম প্রশিক্ষণ সময় নেয়।

সিস্টেম দ্বারা শনাক্ত উন্নতিগুলি একক সমাধান নয়। এটি আর্কিটেকচার সংশোধন, সহায়ক ক্ষতি, মনোযোগ পদ্ধতির পরিবর্তন, অপ্টিমাইজার আচরণ, ওজন হ্রাস সময়সূচী, কম্পাইলার সেটিংস ইত্যাদি অনেকগুলি পরিবর্তনের সমন্বয়। এর মধ্যে সবচেয়ে গুরুত্বপূর্ণ আবিষ্কারটি হল একটি আরও সমৃদ্ধ সংক্ষিপ্ত প্রসঙ্গ মেমোরি পদ্ধতি: মনোযোগের ভ্যালু পথে, bigram (পাশাপাশি শব্দের জোড়া) এবং trigram (ত্রয়ী) তথ্যকে হ্যাশ টেবিলের মাধ্যমে একসাথে এমবেড করা হয় এবং শিক্ষযোগ্য গেটিংয়ের মাধ্যমেওজাইকা। বিভিন্ন Transformer স্তরগুলি বিভিন্ন হ্যাশ ফাংশন ব্যবহার করে, যা স্তরগুলির মধ্যে পুনরাবৃত্তির সম্ভাবনা কমিয়ে দেয়।

এই ট্রিকটি ধারণাগতভাবে DeepSeek Engram ইত্যাদি কাজের সাথে সম্পর্কিত, কিন্তু সিস্টেমটি এটিকে একটি নির্দিষ্ট ভেরিয়েন্ট হিসাবে এমনভাবে বাস্তবায়িত করেছে যা প্রকাশিত গবেষণাপত্রে এখনও দেখা যায়নি।

দ্বিতীয় পরিস্থিতি: ট্রেনিং স্পিড রেস (NanoGPT Speedrun)

যদি আগের পরিস্থিতিটি একটি সক্রিয় সম্প্রদায়ের ফলাফলের উপর আরও একধাপ এগিয়ে যাওয়া হয়, তবে এই পরিস্থিতিটি অনেক কঠিন।

NanoGPT Speedrun হল কারপাথি দ্বারা শুরু করা এবং দুই বছরেরও বেশি সময় ধরে সম্প্রদায় দ্বারা উন্নত করা একটি বেঞ্চমার্ক: 8টি H100 GPU-এর উপর GPT মডেলটিকে বৈধতা ক্ষতি 3.28-এ পৌঁছানোর জন্য প্রয়োজনীয় সর্বনিম্ন সময়। 2024 এর মধ্যভাগ থেকে, সম্প্রদায় 83টি নথিভুক্ত অবদানের মাধ্যমে সময়কে প্রায় 45 মিনিটের থেকে 79.7 সেকেন্ডে কমিয়েছে। প্রতিটি নতুন পদ্ধতির জন্য অত্যন্ত অপ্টিমাইজড কোডের উপরে আরও সময় চাপিয়ে নিতে হয়, যার কঠিনতা অনুমান করা যায়।

রিকার্সিভের সিস্টেম বর্তমান সেরা সমাধান থেকে শুরু করে পুনরায় ট্রেনিং সময়কে 77.5 সেকেন্ডে কমিয়েছে, যা 2.2 সেকেন্ড সঞ্চয় করেছে। এটি সাম্প্রতিক মানুষের অবদানের উন্নতির মাত্রার সমান বা তারও ভালো।

এই সিস্টেম যে মূল কৌশলগুলি খুঁজে পেয়েছে তা হল:

FP8 প্রেসিশনে অ্যাটেনশন ক্যালকুলেশন। কমিউনিটি সমাধানটি শুধুমাত্র মডেলের শেষ স্তরে (ল্যাঙ্গুয়েজ মডেল হেড) FP8 (8-বিট ফ্লোটিং পয়েন্ট) ক্যালকুলেশন ব্যবহার করে, যেখানে সিস্টেমটি FP8 কে অ্যাটেনশন লেয়ারের ম্যাট্রিক্স অপারেশনগুলিতে প্রসারিত করে, ফরওয়ার্ড প্রোপাগেশনে FP8 ব্যবহার করে টেনসর কোর থ্রুপুটকে দ্বিগুণ করে, এবং ব্যাকওয়ার্ড প্রোপাগেশনে BF16 বজায় রাখে স্থিতিশীলতা বজায় রাখতে।

অপ্টিমাইজারে অ্যানিলিং এক্সপ্লোরেশন নয়েজ। সিস্টেমটি NorMuon অপ্টিমাইজারের আপডেট ধাপে শূন্য গড় গাউসিয়ান নয়েজ যোগ করে, যার পরিমাণ প্রশিক্ষণের প্রগতির সাথে রৈখিকভাবে শূন্যের দিকে হ্রাস পায়। এটি অপ্টিমাইজারকে একটি 'প্রথমে সাহসীভাবে অন্বেষণ করুন, তারপর স্থিতিশীলভাবে অভিসরণ করুন' আচরণের মতো করে তৈরি করে, যা চূড়ান্ত সমাধানকে একটি আরও সমতল লস বেসিনে পড়তে সাহায্য করে।

একটি সংক্ষিপ্ততর এমএলপি কর সংযোজন। সিস্টেমটি একটি ট্রিটন জিপিইউ কর পুনর্লিখন করেছে, যাতে ফরওয়ার্ড প্রোপাগেশনে শুধুমাত্র ReLU বর্গকৃত এক্টিভেশন মানগুলি সংরক্ষণ করা হয়, এবং ব্যাকওয়ার্ড প্রোপাগেশনের সময় করের ভিতরেই বর্গমূলহীন মধ্যবর্তী ফলাফলগুলি পুনর্গণনা করা হয়—যার ফলে হাই-ব্যান্ডউইথ মেমোরিতে এক্টিভেশন টেনসরের একটি পূর্ণাঙ্গ পড-লিখ চক্র এড়ানো হয়েছে—যা হার্ডওয়্যার লেভেলে সরাসরি গতি বৃদ্ধি করে।

তিনটি উন্নতি যথাক্রমে প্রেসিশন স্ট্র্যাটেজি, অপ্টিমাইজার ডিজাইন এবং GPU কার্নেল প্রোগ্রামিং—এই তিনটি ভিন্ন পেশাদার ক্ষেত্রের। দুই বছরের সম্প্রদায় অপ্টিমাইজেশনের ফলাফলের উপর ভিত্তি করেও সিস্টেমটি আরও জায়গা খুঁজে পেয়েছে, যা নিজেই সমস্যার প্রমাণ।

তৃতীয় পরিস্থিতি: GPU কোর অপ্টিমাইজেশন (SOL-ExecBench)

প্রথম দুটি সিনেরিও মডেল ট্রেনিং লেভেলে কাজ করে, তৃতীয় সিনেরিওটি আরও নিচের লেভেলে যায়: GPU ক্যালকুলেশন কার্নেলের অপ্টিমাইজেশন।

SOL-ExecBench হল নভিডিয়া দ্বারা প্রকাশিত একটি বেঞ্চমার্ক, যাতে ২৩৫টি কার্নেল-লেখা কাজ রয়েছে যা ম্যাট্রিক্স গুণন, রিডিউসন, নরমালাইজেশন লেয়ার, অ্যাটেনশন কম্পোনেন্ট, কোয়ান্টাইজেশন রুটিন, ফিউজড ব্লকসহ বিভিন্ন ধরনের বাস্তব ওয়ার্কলোডকে কভার করে। স্কোরিং মানদণ্ড হল SOL স্কোর: ০.৫ হল বেঞ্চমার্ক PyTorch বাস্তবায়ন, ১.০ হল হার্ডওয়্যারের থিওরেটিক্যাল লিমিট। আগের সেরা প্রকাশিত স্কোর ছিল ০.৬৯৯।

রিকার্সিভের সিস্টেম ২৩৫টি কোরে সম্পূর্ণভাবে চলছে, যা টাস্কগুলির মধ্যে আবিষ্কৃত অপ্টিমাইজেশন প্যাটার্নগুলি (যেমন মেমোরি মুভমেন্ট স্ট্র্যাটেজি, ব্লকিং পদ্ধতি, রিডাকশন টেকনিক) পুনরায় ব্যবহার করতে সক্ষম করে, যার ফলে চূড়ান্ত স্কোর ০.৭৫৪-এ উন্নীত হয়েছে এবং হার্ডওয়্যারের সীমার দিকে ১৮% দূরত্ব কমিয়েছে।

এই পরিস্থিতিটি বিশেষ কারণে গুরুত্বপূর্ণ, কারণ কার্নেল ইঞ্জিনিয়ারিং হল অত্যন্ত উন্নত একটি ক্ষেত্র—প্রভাবশালী Triton/CUDA কার্নেল লেখার ক্ষমতা রাখা ইঞ্জিনিয়ারদের সংখ্যা বিশ্বব্যাপী খুবই কম। রিকার্সিভ দল তাদের ব্লগে স্বীকার করেছে যে তারা নিজেরাও কার্নেল ক্ষেত্রের বিশেষজ্ঞ নন, "এই ধারণাগুলি আমাদের পেশাগত পটভূমি থেকে নয়, বরং সিস্টেমটির নিজস্ব থেকে এসেছে।"

Recursive: AI ব্যবহার করে রিকার্সিভ উন্নতি করা

এই অর্জনটি প্রকাশ করা কোম্পানি Recursive Superintelligence 2025 এর শেষ দিক থেকে 2026 এর শুরুর দিকে প্রতিষ্ঠিত হয়েছিল এবং গত মাসে তাদের গোপনীয়তা ভাঙা হয়েছিল; প্রতিষ্ঠাতা সদস্যদের মধ্যে রয়েছেন আগের Meta FAIR গবেষণা বিজ্ঞানী পরিচালক তিয়ান ইয়ানডং এবং:

রিচার্ড সোখার, রিকার্সিভের সিইও, পূর্বের Salesforce-এর চিফ বিজ্ঞানী

অ্যালেক্সেই ডোসভিতস্কিয়, পূর্বের গুগল ডিপমাইন্ড গবেষক এবং ভিজন ট্রান্সফরমারের প্রথম লেখক, যিনি গুগল স্কলারে ১৬ লক্ষেরও বেশি উদ্ধৃতি অর্জন করেছেন

টিম রকটেশেল, পূর্বের DeepMind মূলধন বিজ্ঞানী এবং UCL কৃত্রিম বুদ্ধিমত্তা অধ্যাপক

পিটার নরভিগ, গুগলের পূর্ব গবেষণা পরিচালক, স্টুয়ার্ট রাসেলের সাথে এআই ক্ষেত্রের প্রসিদ্ধ পাঠ্যপুস্তক "আর্টিফিশিয়াল ইন্টেলিজেন্স: এ মডার্ন অ্যাপ্রোচ" এর লেখক।

কেইমিং শিয়ং, পূর্বের Salesforce AI উপাধ্যক্ষ

টিম শি, পূর্বের OpenAI গবেষক, এন্টারপ্রাইজ এআই কোম্পানি Cresta-এর সহ-প্রতিষ্ঠাতা এবং সিটিও

জোশ টবিন, রিকার্সিভের সিটিও, পূর্বে ওপেনএআই এবং ইউবার এটিজি-এর গবেষণা পরিচালক

জেফ ক্লুন, পূর্বের গুগল ডিপমাইন্ড গবেষণা উপাধ্যক্ষ, কানাডার ব্রিটিশ কলম্বিয়া বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক

এবং এই স্টার্টআপটি এখনও একটি পাবলিক পণ্য ছাড়াই 6.5 বিলিয়ন ডলারের ফান্ডিং এবং 46.5 বিলিয়ন ডলারের ভ্যালুয়েশন নিয়ে চলে এসেছে, যার নেতৃত্বে রয়েছে GV (গুগল ভেঞ্চারস) এবং Greycroft, এবং NVIDIA এবং AMD Ventures অংশগ্রহণ করেছে।

কোম্পানির মূল দাবি এর নামের সাথে সরাসরি মেলে: এমন একটি এআই সিস্টেম তৈরি করা যা নিজের গবেষণা ক্ষমতা পুনরাবৃত্তিমূলকভাবে উন্নত করতে পারে, যাতে এআই নিজেই এআই-এর গবেষণার প্রক্রিয়ায় অংশগ্রহণ করে এবং এটিকে ত্বরান্বিত করে, যার ফলে একটি স্থায়ীভাবে নিজেকে বৃদ্ধি করে এমন একটি বন্দনা গঠিত হয়।

আরও বিস্তারিত জানতে, প্রতিবেদনটি দেখুন: "মেটা ছেড়ে তিয়ান ইয়ুয়ানডং ঠিক এখনই স্টার্টআপ শুরু করেছেন।"

অবশ্যই, প্রতিযোগিতামূলক ক্ষেত্রে রিকার্সিভ একা নয়। যান লেকুনের AMI Labs এই বছর মার্চে 10 বিলিয়ন ডলারের বিনিয়োগ সম্পন্ন করেছে, এবং ডেভিড সিলভারের Ineffable Intelligence এপ্রিলে 11 বিলিয়ন ডলারের সীড ফান্ডিং পেয়েছে, যা একই দিকের ইঙ্গিত দেয়: AI সিস্টেমগুলিকে স্বয়ংক্রিয়ভাবে জ্ঞান তৈরি করতে দেওয়া, যাতে গবেষণা প্রক্রিয়ায় মানুষের হস্তক্ষেপ কমে যায়। তবে প্রকাশিত ফলাফলের গতির ক্ষেত্রে, রিকার্সিভের এই “প্রথম পদক্ষেপ”টি এখনও পর্যন্ত এই ধরনের কোম্পানিগুলির মধ্যে সবচেয়ে বিশদ, সবচেয়ে পুনরাবৃত্তযোগ্য প্রযুক্তিগত প্রদর্শনগুলির মধ্যে একটি।

রিকার্সিভ প্যারাডাইমের সকাল

রিকার্সিভ দ্বারা প্রকাশিত এই ফলাফলটি প্রতিষ্ঠিত শিল্পের বৃহত্তর প্রেক্ষাপটে একটি নতুন ধরনের এআই গবেষণা পদ্ধতির প্রাথমিক বাস্তবায়ন নির্দেশ করে: এআই সিস্টেমকেই গবেষণার মূল ভূমিকা পালন করতে দেওয়া।

এই «রিকার্সিভ এআই»-এর মূল যুক্তি জটিল নয়: এআই এআই গবেষণার ক্ষমতা বাড়ায়, উন্নত এআই আবার নিজেকে আরও কার্যকরভাবে উন্নত করে, এভাবে চলতে থাকে। এটি একটি একক বিপ্লবের উপর নির্ভর করে না, বরং নিয়মিত বিপ্লব উৎপাদনকারী একটি সিস্টেমের উপর নির্ভর করে।

এই ধারণাটি এআই গবেষণার অর্থনীতির জন্য গুরুত্বপূর্ণ। অগ্রণী মডেলের প্রশিক্ষণ প্রক্রিয়া এখনও কয়েকজন নির্দিষ্ট দক্ষতাসম্পন্ন গবেষকের উপর অত্যন্ত নির্ভরশীল, এবং এই কাজটি করার যোগ্য মানুষ বিশ্বব্যাপী কয়েকহাজারেরও কম। যদি স্বয়ংক্রিয় গবেষণা সিস্টেমটি এই কাজের একটি অংশও গ্রহণ করে, তাহলে এআই-এর প্রগতির গতি এবং খরচের বক্ররেখা পরিবর্তিত হবে।

এই মতামত শিল্পের সাম্প্রতিক অন্যান্য কথাবার্তার সাথেও সামঞ্জস্যপূর্ণ। উদাহরণস্বরূপ, এই নিবন্ধের শুরুতে উল্লিখিত Anthropic-এর “When AI Builds Itself” শীর্ষক প্রতিবেদনটির ভাষা সহজ নয়—এটি শিল্পকে সমন্বয়ের আহ্বান জানায়, যাতে পুনরাবৃত্ত নিজেকে উন্নত করার মুহূর্তে এগিয়ে যাওয়া AI উন্নয়নকে স্থগিত বা অস্থায়ীভাবে বন্ধ করার বিকল্প থাকে, যাতে সমাজগত কাঠামো এবং সমন্বয় গবেষণা এর গতির সাথে পাল্টাতে পারে। আরও বিস্তারিত জানতে “AI নিজেকে অতি দ্রুত বিকশিত করছে, Anthropic বিশ্বব্যাপী গবেষণা বন্ধের আহ্বান জানিয়েছে” পড়ুন।

https://www.anthropic.com/institute/recursive-self-improvement

একই সময়ে দুটি বিষয় ঘটছে, যা চিন্তাশীল। একদিকে অ্যানথ্রোপিক এই পথের দিকনির্দেশনা রেকর্ড করছে এবং সতর্ক করছে, অন্যদিকে রিকার্সিভের মতো দলগুলি ধাপে ধাপে এই পথকে বাস্তবে পরিণত করছে।

অবশ্যই, রিকার্সিভ নিজেই স্বীকার করেছে যে এটি এখনও শুধুমাত্র "প্রথম পদক্ষেপ": বর্তমান সিস্টেমটি সূচকগুলি পরিষ্কার, প্রতিক্রিয়া দ্রুত এবং প্রতারণা শনাক্তযোগ্য পরিস্থিতিতে সবচেয়ে ভালোভাবে কাজ করে, এবং খোলা বৈজ্ঞানিক সমস্যাগুলি স্বয়ংক্রিয়ভাবে এগিয়ে নেওয়ার জন্য এখনও অনেক দূরত্ব বাকি। প্রতারণার পুরস্কার প্রতিরোধ হবে স্কেলিংয়ের পথে চলতে থাকা মূল চ্যালেঞ্জ।

কিন্তু একটি বন্দী চক্র কাজ শুরু করেছে। পরবর্তী প্রশ্নটি হলো, এটি কত দ্রুত ঘুরবে।

এই লেখাটি ওয়েইচ্যাট গ্রুপ "মেশিন সিন্টিস" (ID: almosthuman2014) থেকে, লেখক: রিকার্সিভ ইভোলিউশনের মেশিন সিন্টিস, সম্পাদক: Panda