অ্যানথ্রোপিক দাবি করছে যে এআই নিজেকে উন্নত করার পথটি স্পষ্ট হয়ে উঠছে, যা আইপিও ন্যারেটিভ নিয়ে বিতর্ক তৈরি করেছে

লেখক: অক্ষর AI

অ্যানথ্রোপিক গতকাল একটি দীর্ঘ প্রবন্ধ প্রকাশ করেছে, যার শিরোনাম হলো《When AI builds itself》(যখন AI নিজেকে তৈরি করে), যা আসিমোভের কোনো বিজ্ঞান কল্পনা উপন্যাসের মতো শোনায়, এবং বিষয়বস্তুও সত্যিই একটি বিজ্ঞান কল্পনামূলক ধারণা: recursive self-improvement (পুনরাবৃত্তি আত্ম-উন্নয়ন)।

ক্লড

সহজ কথায়, আগে মানুষের গবেষকরা কোড লিখতেন, পরীক্ষা চালাতেন, মডেল ট্রেন করতেন, এবং তারপর এআইকে আরও শক্তিশালী করতেন। কিন্তু যদি এআই নিজেই তার পরবর্তী সংস্করণের ডিজাইন, ট্রেনিং, টেস্টিং এবং অপ্টিমাইজেশনে অংশ নেওয়া শুরু করে, তাহলে এআই-এর উন্নতির গতি শুধুমাত্র মানুষের দ্বারা প্রভাবিত হবে না, এটি সম্ভবত এআই-এর “স্ব-বিবর্তন” দ্বারা প্রভাবিত হতে শুরু করবে।

এর জন্য, Anthropic আহ্বান জানিয়েছে:

আমাদের মনে হয়, যদি বিশ্ব সম্মত হয় যে সামনের দিকে এআই উন্নয়নকে ধীর করা বা অস্থায়ীভাবে বন্ধ করা যাক, যাতে সামাজিক কাঠামো এবং অ্যালাইনমেন্ট গবেষণা প্রযুক্তির অগ্রগতির সাথে পাল্টাতে পারে, তবে এটি বিশ্বের জন্য অত্যন্ত উপকারী হবে।

এই বাক্যটি একটি নিরাপত্তা সতর্কবার্তার মতো শোনায়, কিন্তু Anthropic-এর IPO-এর প্রস্তুতির সময়ে এটিকে অন্য একটি বর্ণনার পূর্বাভাস হিসেবে দেখা ছাড়া উপায় নেই: Claude এতটাই ব্যবহারকারীবান্ধব, যে এটি নিজেই পরবর্তী প্রজন্মের Claude-এর সৃষ্টি শুরু করেছে।

নতুন ঝড় দেখা দিয়েছে

এটি ব্যাখ্যা করার জন্য যে এআই এখন এআই গবেষণার মধ্যে বাড়তি ভূমিকা পালন করছে, অ্যানথ্রোপিক অনেক অভ্যন্তরীণ ডেটা উপস্থাপন করেছে।

উদাহরণস্বরূপ, ২০২৬ সালের মে পর্যন্ত, Anthropic-এর কোডবেসে যোগ করা কোডের ৮০% এর বেশি Claude দ্বারা লেখা হয়েছে। Claude Code প্রকাশের আগে, এই সংখ্যা কেবল একক অঙ্কের ছিল।

অ্যানথ্রোপিকের পরিসংখ্যান অনুযায়ী, ২০২৬ এর দ্বিতীয় ত্রৈমাসিক পর্যন্ত, ইঞ্জিনিয়ারদের প্রতিদিন মার্জ করা কোডের পরিমাণ ২০২৪ এর তুলনায় প্রায় ৮ গুণ বেড়েছে।

ক্লড

কোডের পরিমাণের চেয়ে বেশি গুরুত্বপূর্ণ হলো যে ক্লড আরও খোলা ইঞ্জিনিয়ারিং সমস্যাগুলি পরিচালনা করছে।

অ্যানথ্রোপিক বলেছে যে, গত বছরে কর্মচারীরা ক্লাউডকে সংশোধন করছে, ক্লাউডকে সঠিক পথে ফিরিয়ে আনছে বা কাজের মধ্যে হস্তক্ষেপ করার ক্রমিক হার কমছে। এই পরিবর্তনটি শুধুমাত্র সহজ কাজেই নয়, সবচেয়ে জটিল খোলা কাজগুলিতেও ঘটছে।

খোলা টাস্ক বলতে স্পষ্ট নির্দেশিকা বিহীন সমস্যাকে বোঝায়। যেমন: সিস্টেম ক্র্যাশ হয়ে গেল, ট্রেনিং টাস্ক বন্ধ হয়ে গেল—এইসব ক্ষেত্রে ইঞ্জিনিয়াররা শুরুতেই জানেন না উত্তরটা কী হবে, শুধু পরীক্ষা-নিরীক্ষা করেই বুঝতে পারেন।

এই ধরনের কাজগুলি আগে মানুষের অভিজ্ঞতার উপর সবচেয়ে বেশি নির্ভর করত, কিন্তু সবচেয়ে খোলা কাজগুলিতে, 2026 মে পর্যন্ত Claude-এর সফলতার হার 76% পৌঁছেছে, যা ছয় মাসে 50 পার্সেন্ট বৃদ্ধি পেয়েছে।

ক্লড

কেবল কোড লেখার পাশাপাশি, Anthropic Claude ব্যবহার করে কোড রিভিউ করে, বাগ, নিরাপত্তা দুর্বলতা এবং অন্যান্য ত্রুটি চেক করে। তারা পুনর্বিশ্লেষণ করে দেখেছে যে যদি অতীতে প্রতিটি কোড পরিবর্তন Claude-এর দ্বারা স্বয়ংক্রিয়ভাবে পরীক্ষা করা হত, তবে claude.ai-এর জন্য অনলাইন দুর্ঘটনার কারণ হওয়া প্রায় এক-তৃতীয়াংশ বাগ চালুর আগেই ধরে ফেলা যেত।

আরও এগিয়ে, ক্লড গবেষণা প্রক্রিয়াতে অংশগ্রহণ শুরু করেছে।

অ্যানথ্রোপিকের একটি নির্দিষ্ট পরীক্ষা রয়েছে: ক্লাউডকে একটি ছোট মডেল ট্রেনিং কোড দেওয়া হয়, এবং এটি ফলাফল পরিবর্তন না করে কোডটিকে আরও দ্রুত চালানোর চেষ্টা করে। ২০২৫ সালের মে, Claude Opus 4 প্রায় ৩ গুণ ত্বরান্বিত করতে পারে; ২০২৬ সালের এপ্রিলে, Claude Mythos Preview এই সংখ্যাটিকে প্রায় ৫২ গুণে পৌঁছেছে।

অ্যানথ্রোপিক একটি খোলা এআই নিরাপত্তা গবেষণার কেসও উল্লেখ করেছে। তারা ক্লাউড দ্বারা চালিত এজেন্টকে একটি প্রশ্ন দিয়েছিল: একটি দুর্বল মডেল কি একটি শক্তিশালী মডেলকে নির্ভরযোগ্যভাবে পর্যবেক্ষণ করতে পারে?

এই প্রক্রিয়াটি অনুমান প্রস্তাব করা, অনুমান পরীক্ষা করা, এবং সমান্তরাল এজেন্টগুলির সাথে আবিষ্কারগুলি শেয়ার করা এবং পুনরাবৃত্তি করা প্রয়োজন।

দুইজন মানুষের গবেষক এক সপ্তাহ ধরে প্রায় 23% ব্যবধান পূরণ করেছেন; অন্যদিকে, Claude প্রায় 800 ঘন্টা এবং প্রায় 18,000 ডলার কম্পিউটিং খরচে 97% ব্যবধান পূরণ করেছে।

এই ফলাফলে অবশ্যই সীমাবদ্ধতা রয়েছে, কারণ মানুষই প্রশ্নগুলি বাছাই করেছে, মূল্যায়ন মানদণ্ডও মানুষ নির্ধারণ করেছে, এবং ফলাফলগুলি সম্পূর্ণরূপে উৎপাদন স্কেল মডেলে স্থানান্তরিত হয়নি। তবুও, এটি প্রমাণ করে যে Claude এখন একজন মানুষ দ্বারা পরিকল্পিত দিকনির্দেশনা সহ গবেষণা কাঠামোতে নিজেই পরীক্ষা ডিজাইন, বাস্তবায়ন এবং পুনরাবৃত্তি করতে পারে।

অন্যদিকে, মানুষের গবেষকদের ভুল পথে যাওয়ার সময়, Claude আরও ভালো পরবর্তী পদক্ষেপের বিচার করতে পারে।

অ্যানথ্রোপিক ১২৯টি অভ্যন্তরীণ Claude Code গবেষণা সেশন খুঁজে পায়, যেখানে মানুষের গবেষকরা Claude-এর সাথে খোলা গবেষণা সমস্যা সমাধান করেছে। অ্যানথ্রোপিক এগুলির মধ্যে কিছু “যে পয়েন্টগুলিতে মানুষ পরে প্রমাণিত হয়েছে যে তারা অপ্রয়োজনীয়ভাবে ঘুরে বেড়ায়” সেগুলি চিহ্নিত করে, এবং সেই পয়েন্টের আগের প্রসঙ্গটি বিভিন্ন সংস্করণের Claude-এর কাছে দেয়, যাতে দেখা যায় এটি পরবর্তী পদক্ষেপ হিসাবে কী পরামর্শ দেয়। তারপর একটি অন্য Claude judge, যিনি সম্পূর্ণ সেশনের ফলাফল জানেন, সিদ্ধান্ত নেন: মডেলের পরামর্শ এবং মানুষের মূলতই করা বাছাইয়ের মধ্যে কোনটি ভালো।

ফলাফল দেখায় যে, যেসব নোডে মানুষের গবেষকদের পরে থেকে উন্নতির সম্ভাবনা প্রমাণিত হয়েছে, সেখানে Claude ক্রমাগতভাবে ভালো পরবর্তী পদক্ষেপ প্রস্তাব করছে।

ক্লড

অতীতে, এআই মডেলের উন্নতি মূলত মানুষের গবেষক এবং ইঞ্জিনিয়ারদের দ্বারা পরিচালিত হয়েছিল। মানুষ কোন পরীক্ষা করবেন, কোড লিখবেন, মডেল ট্রেন করবেন এবং এআইয়ের ফাংশনালিটির পুনরাবৃত্তি করবেন তা নির্ধারণ করতেন।

এখন, এই শৃঙ্খলের অধিকাংশ পদক্ষেপ ক্লড দ্বারা গ্রহণ করা হচ্ছে।

অ্যানথ্রোপিক একটি খুব সহজ পর্যায় টেবিল দিয়েছে:

ক্লড

2021 থেকে 2023 সাল পর্যন্ত, Anthropic সাধারণ প্রযুক্তি কোম্পানির মতোই ছিল, যেখানে মানুষ ল্যাপটপে কোড এবং ডকুমেন্টেশন লিখত।

2023 থেকে 2025 এর মধ্যে, চ্যাটবটগুলি কাজের প্রবাহে প্রবেশ শুরু করে। ইঞ্জিনিয়াররা মডেলকে কোড স্নিপেট তৈরি করতে দেয়, তারপর সেগুলি এডিটরে কপি করে।

2025 থেকে 2026 এর মধ্যে, প্রোগ্রামিং এজেন্টগুলি প্রকাশিত হয়, এবং Claude স্বয়ংক্রিয়ভাবে কোড লিখতে ও সংশোধন করতে শুরু করে, কখনও কখনও সম্পূর্ণ ফাইল স্বাধীনভাবে সম্পন্ন করে।

আজকের দিনে, এজেন্টগুলি নিজেদের কোড চালাতে পারে এবং ঘন্টার পর ঘন্টা কাজ অন্যান্য এজেন্টদের দিয়ে করাতে পারে।

এরপরে আসে যে পর্যায়, যা এনথ্রোপিক সত্যিকার অর্থে উদ্বিগ্ন: বন্দ্য লুপ।

যদি এই দিন আসে, তাহলে Claude-এর পরবর্তী সংস্করণগুলি সম্ভবত Claude-এর নিজের দ্বারা অবিরাম উন্নতি করা হবে—এটিই recursive self-improvement, রিকার্সিভ সেলফ-ইমপ্রুভমেন্ট।

অ্যানথ্রোপিক এখানে খুব সাবধানে বলেছে: আমরা এখনও সেই পর্যায়ে পৌঁছাইনি, এবং পুনরাবৃত্তিমূলক আত্ম-উন্নতি অপরিহার্যভাবে ঘটবে এমন কিছু নয়। তবে এটি এখনও জোর দিয়ে বলছে যে সেই পর্যায়ে পৌঁছানোর পথটি এখন দৃশ্যমান হয়ে উঠেছে।

অতএব এনথ্রোপিক নিবন্ধের শেষে ধীরতা বা বন্ধের কথা উল্লেখ করেছে। এর অর্থ এই নয় যে এখনই সমস্ত এআই কোম্পানি কাজ বন্ধ করে দেবে, বরং এটি বলছে যে ভবিষ্যতে এআইয়ের নিজস্ব উন্নতির ঝুঁকি যদি বাড়তে থাকে, তবে অগ্রণী পরীক্ষাগারগুলিকে একটি সমন্বিত, যাচাইযোগ্য ধীরতা পদ্ধতির প্রয়োজন।

অন্যভাবে বললে, "সিংগুলারিটি" আসছে, মানুষকে এটি নিয়ন্ত্রণ করতে হবে।

অপ্রতিরোধ্য ক্লড

পৃষ্ঠার উপরে দেখলে, এটি একটি অত্যন্ত ভবিষ্যদ্বাণীমূলক নিরাপত্তা নথি। এনথ্রোপিক পুনরাবৃত্তিমূলক আত্ম-উন্নতি, এআই যেভাবে নিজেকে দ্রুততরভাবে উন্নত করতে পারে এবং মানব সমাজকে গতি কমানো এবং বিরতির মেকানিজম পূর্বে প্রস্তুত হওয়ার কথা বলছে।

কিন্তু এনথ্রোপিকের আইপিওর সময়ে এই নিবন্ধটির আরও একটি অর্থ রয়েছে।

কিছুটা অর্থে, এ-ফ্যাক্টরির সাম্প্রতিক কার্যকলাপ ক্লাসের সেই অহংকারী ভালো ছাত্রের মতো—এটি সত্যিই ক্ষমতা রাখে, কিন্তু সত্যিই নাটকীয়।

এটি শুধু এটা বলতে চায় না যে “আমাদের একটি শক্তিশালী Claude আছে”; এটি আরও এগিয়ে বলতে চায় যে “Claude আমাদের আরও শক্তিশালী Claude তৈরি করতে সাহায্য করছে”।

যদি Anthropic শুধু একটি মডেল বা একটি টুল বিক্রি করে, তাহলে এটি পার্শ্বীয় তুলনা থেকে সম্পূর্ণরূপে মুক্ত হতে পারবে না: Anthropic-এর কাছে Claude আছে, OpenAI-এর কাছে GPT আছে; Anthropic-এর কাছে Claude Code আছে, OpenAI-এর কাছে Codex আছে; Anthropic কর্পোরেট গ্রাহকদের আকর্ষণ করে, OpenAIও কর্পোরেট গ্রাহকদের আকর্ষণ করে। দুটি কোম্পানির মধ্যে প্রতিদ্বন্দ্বিতা খুবই ঘনিষ্ঠ, এখন দেখা যাবে কোনটি বাজারকে বড় গল্প বলতে পারবে।

লক্ষ্য করুন, ঠিক 3 দিন আগে, ওপেনএআই একটি অগ্রণী এআই পরিচালনা সম্পর্কিত ফাইলে লিখেছিল:

আমরা আজকের সিস্টেমে পুনরাবৃত্ত আত্ম-উন্নতির প্রাথমিক লক্ষণগুলি দেখেছি: এআইয়ের উন্নয়ন নিজেই এআই দ্বারা ত্বরান্বিত হচ্ছে।

এটি ডেভেলপার এবং রাষ্ট্রের মধ্যে প্রতিযোগিতামূলক চাপ বাড়াবে এবং বিদ্যমান প্রতিষ্ঠানগুলির জন্য প্রতিকারযোগ্য নয় এমন শাসনের চ্যালেঞ্জ তৈরি করবে।

3 দিন পরে, অ্যানথ্রোপিক বলল: ক্লাউডের জন্য রিকার্সিভ সেলফ-ইম্প্রুভমেন্টের পথ এখন দৃশ্যমান হয়ে উঠেছে।

ক্লড

যদি ক্লড তার প্রত্যাশিত রূপে বিকশিত হয়, তবে এটি সাধারণ পণ্যের কাহিনী হবে না, এটি একটি গবেষণা ও উন্নয়নের ফ্লাইওয়েল হয়ে উঠবে।

ক্লড কোড লিখে, পরীক্ষা চালায়, প্রশিক্ষণ প্রক্রিয়া অপ্টিমাইজ করে, এবং তারপর এনথ্রোপিকের নিজস্ব পণ্যগুলিতে দুর্ঘটনা কমায়... একবার এই সিস্টেমটি চালু হয়ে গেলে, ক্লড শুধুমাত্র এনথ্রোপিকের একটি পণ্য নয়, বরং এনথ্রোপিকের একটি গুরুত্বপূর্ণ উৎপাদন টুলও হয়ে ওঠে।

ব্যবহারকারীরা ক্লাউড নামক পণ্যটি দেখে, ব্যবসায়িক গ্রাহকরা ক্লাউডের ক্ষমতা কিনে, কিন্তু অ্যানথ্রোপিক আসলে ক্যাপিটাল মার্কেটগুলিকে মনোযোগ দেওয়ার জন্য চায় যে: ক্লাউড এখন অগ্রণী মডেল গবেষণার মূল প্রক্রিয়ায় এমবেডেড হয়েছে, এটি অ্যানথ্রোপিকের ইঞ্জিন ককপিটে স্থাপন করা হয়েছে।

বাজার প্রতিনিধিদের সবচেয়ে বেশি পছন্দ হয় এমন একটি ফ্লাইওয়ুইল গল্প, যেমন একটি জুবাওপেন যা অক্ষুণ্ণভাবে সম্পদ আনে: শক্তিশালী Claude এর ফলে Anthropic-এর ইঞ্জিনিয়াররা আরও বেশি কোড একীভূত করতে পারে, আরও বেশি কোডের ফলে পণ্য এবং অবকাঠামো দ্রুততরভাবে পুনরায় বিকাশ করা যায়, দ্রুততর পুনরায় বিকাশের ফলে গবেষকরা আরও বেশি পরীক্ষা চালাতে পারেন, আরও বেশি পরীক্ষা আবার পরবর্তী প্রজন্মের Claude-কে শক্তিশালী করতে সহায়তা করে। পরবর্তী প্রজন্মের Claude-এর শক্তিশালী হওয়ার পর, Anthropic-এর R&D-কে আবারও ত্বরান্বিত করা হয়।

ক্লডের ইটারেশন গতি এই ফ্লাইওয়াহলকেও সমর্থন করছে। প্রকাশের তারিখ অনুযায়ী, ২০২৩ থেকে ২০২৫ এর শুরুর মধ্যে, ক্লডের প্রধান মডেল আপডেটগুলি সাধারণত তিন থেকে চার মাসে একবার হত, কিন্তু ক্লড 4-এ প্রবেশ করার পরে, Anthropic-এর মডেল আপডেটগুলি স্পষ্টভাবে বেশি ঘন হয়ে উঠেছে।

2025 মে-এ ক্লড 4 প্রকাশিত হয়, অপাস 4.1 আগস্টে, সনেট 4.5 সেপ্টেম্বরে, হাইকু 4.5 অক্টোবরে এবং অপাস 4.5 নভেম্বরে।

2026 সালে, অপাস 4.6 ফেব্রুয়ারি 5 তারিখে প্রকাশিত হয়, সনেট 4.6 ফেব্রুয়ারি 17 তারিখে প্রকাশিত হয়, অপাস 4.7 এপ্রিল 15 তারিখে প্রকাশিত হয়, এবং অপাস 4.8 মে 28 তারিখে প্রকাশিত হয়। অপাস 4.7 থেকে অপাস 4.8 এর মধ্যে শুধুমাত্র 42 দিন পার্থক্য রয়েছে।

অ্যানথ্রোপিক প্রকাশ্যে বলছে “এই বিষয়টি খুব বিপজ্জনক হতে পারে, আমাদের ব্রেক প্রস্তুত রাখা উচিত,” কিন্তু একইসাথে এটি ইঙ্গিত করছে: “আমরা ইতিমধ্যে দেখেছি যে অ্যাক্সিলেটর চাপলে কী ঘটে।”

আইপিও বর্ণনার সূক্ষ্মতা হল এটি একদিকে ঝুঁকি খুব বেশি বলে দেয়, আবার অন্যদিকে নিজের প্রযুক্তিগত অবস্থানকেও খুব উঁচুতে তোলে।

সকল এআই কোম্পানি পুনরাবৃত্ত স্ব-উন্নয়ন নিয়ে আলোচনা করার যোগ্য নয়; আপনাকে প্রথমে বাইরের বিশ্বকে বিশ্বাস করাতে হবে যে আপনার এআই এখন এআই গবেষণা ও উন্নয়ন প্রক্রিয়ায় প্রবেশ করেছে, তারপর才 আপনি বলতে পারবেন যে এটি বিশ্বব্যাপী সমন্বয়ের প্রয়োজন হতে পারে।

ওপেনএআই: এটা কিভাবে সম্ভব?

আগে উল্লেখ করা হয়েছে, যে সময় Anthropic এই দীর্ঘ নিবন্ধটি প্রকাশ করছিল, ঠিক তখনই OpenAI রিকার্সিভ সেলফ-ইম্প্রুভমেন্টকে টেবিলে রেখেছিল।

কিন্তু দুটি কোম্পানির বক্তব্য খুব ভিন্ন।

OpenAI-এর এই প্রতিবেদনটি, "Democratic Governance of Frontier AI", ওয়াশিংটনের জন্য একটি নীতিগত প্রকল্প, যা "মডেলগুলি কীভাবে শক্তিশালী হবে" তার পরিবর্তে বর্তমানে সীমান্ত AI যখন এগিয়ে যাচ্ছে, তখন এটিকে কীভাবে নিয়ন্ত্রণ করা যায় তার দিকে মনোযোগ দেয়।

রিপোর্টে উল্লিখিত বেশিরভাগ বিষয় পুনরাবৃত্তি করা উপযুক্ত নয়, কিন্তু একটি কথা গুরুত্বপূর্ণ: ওপেনএআই বলেছে, আজকের সিস্টেমে পুনরাবৃত্তিমূলক স্ব-উন্নয়নের প্রাথমিক লক্ষণগুলি দেখা যাচ্ছে।

এই বাক্যটি এবং Anthropic-এর এই দীর্ঘ নিবন্ধটি আসলে একই দিকে ইঙ্গিত করে।

কেবলমাত্র OpenAI প্রতিষ্ঠানের কথা বলছে, Anthropic নিজেকে নিয়ে কথা বলছে।

OpenAI-এর অর্থ হলো: এআই-এর বিকাশ খুব দ্রুত, এবং বর্তমান প্রশাসনিক কাঠামো তার সাথে পাল্লা দিতে পারছে না, তাই একটি নতুন নিয়মের প্রয়োজন।

এবং এনথ্রোপিক সরাসরি সেই সিস্টেমটি প্রকাশ করে বাজারকে জানিয়েছে: ক্লড আমাদের গবেষণা ও উন্নয়ন প্রক্রিয়ায় প্রবেশ করেছে, তাই আমরা এআইয়ের নিজের গতি বাড়ানোর পথটি দেখেছি।

এটি খুব চালাকির সাথে করা হয়েছে, মনে হচ্ছে OpenAI-এর ভিতরে ইতিমধ্যেই ঝগড়া শুরু হয়ে গেছে—এটা তো কপি করা! আমরাই প্রথমে এসেছিলাম!

একটা হাসির কথা, কিন্তু OpenAI কে আরও চেষ্টা করতে হবে, দয়া করে দ্রুত GPT 5.6 চালু করুন।