CORE-বেঞ্চ

এই মতামত কোনো কিছু ছাড়াই আসেনি। তিনি অনেকগুলি পাবলিক বেঞ্চমার্ক দেখেছেন এবং দেখেছেন যে AI এর AI গবেষণা-সংক্রান্ত কাজগুলিতে অগ্রগতি খুব দ্রুত হচ্ছে।

উদাহরণস্বরূপ, CORE-Bench এআই-এর মাধ্যমে অন্যান্য গবেষকদের গবেষণা প্রবন্ধ বাস্তবায়নের ক্ষমতা পরীক্ষা করে, যা এআই গবেষণার একটি অত্যন্ত গুরুত্বপূর্ণ দিক।

CORE-বেঞ্চ

PostTrainBench পরীক্ষা করে যে শক্তিশালী মডেলগুলি কি সক্ষম হয় দুর্বল ওপেন-সোর্স মডেলগুলিকে স্বয়ংক্রিয়ভাবে ফাইন-টিউন করে পারফরম্যান্স উন্নত করতে, যা AI গবেষণা কাজের একটি গুরুত্বপূর্ণ উপ-সেট।

CORE-বেঞ্চ

MLE-Bench বাস্তব কাগগল প্রতিযোগিতার কাজের উপর ভিত্তি করে, নির্দিষ্ট সমস্যা সমাধানের জন্য বিভিন্ন মেশিন লার্নিং অ্যাপ্লিকেশন তৈরির প্রয়োজনীয়তা রাখে। এছাড়াও, SWE-Bench-এর মতো পরিচিত কোডিং বেঞ্চমার্কগুলিও এই ধরনের অগ্রগতি দেখিয়েছে।

CORE-বেঞ্চ

জ্যাক ক্লার্ক এই ঘটনাকে একটি "ফ্র্যাক্টাল" আকারের উপরের দিকে এবং ডানদিকে প্রবণতা হিসেবে বর্ণনা করেছেন, যেখানে বিভিন্ন রেজোলিউশন এবং স্কেলে অর্থপূর্ণ অগ্রগতি পর্যবেক্ষণ করা যায়। তিনি মনে করেন, এআই ধীরে ধীরে এন্ড-টু-এন্ড অটোমেটেড রিসার্চ এবং ডেভেলপমেন্টের ক্ষমতার দিকে এগিয়ে যাচ্ছে, এবং একবার এটি অর্জিত হলে, এআই নিজেই তার নিজস্ব পরবর্তী সিস্টেমগুলি তৈরি করতে সক্ষম হবে, যা নিজস্ব পুনরাবৃত্তির চক্রকে শুরু করবে।

CORE-বেঞ্চ

এই মন্তব্যটি সামাজিক মাধ্যমে অনেক আলোচনার সৃষ্টি করেছে।

কিছু মানুষ এটিকে এএসআই এবং বিন্দুতে যাওয়ার একটি মূল পদক্ষেপ হিসাবে দেখেন, যা প্রযুক্তির উন্নয়নের গতি সম্পূর্ণরূপে পরিবর্তন করতে পারে।

CORE-বেঞ্চ

তবে, বিভিন্ন মতামতও রয়েছে।

ওয়াশিংটন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক পেড্রো ডোমিংগোস বলেন, এআই সিস্টেমগুলি ১৯৫০-এর দশকে লিস্প ভাষার আবিষ্কারের সময় থেকেই 'নিজেকে গঠন' করার ক্ষমতা রেখেছিল, সত্যিকারের সমস্যা হল কি এটি বৃদ্ধিপ্রাপ্ত রিটার্ন অর্জন করতে পারবে কিনা, এবং এখনও এটির জন্য স্পষ্ট প্রমাণ নেই।

CORE-বেঞ্চ

একজন ইন্টারনেট ব্যবহারকারী প্রশ্ন করেছেন যে, ২০২৭ থেকে ২০২৮ এর মধ্যে সম্ভাবনা হঠাৎ করে ৩০% বেড়েছে, যা ইঙ্গিত করে যে ২০২৭ এর শেষের দিকে AI-এর ক্ষমতায় একটি হঠাৎ বড় বিপ্লব ঘটবে। কোন নির্দিষ্ট মাইলফলক বা ঘটনা যেহেতু AI-এর পুনরাবৃত্তিমূলক আত্ম-উন্নতির সম্ভাবনাকে সংক্ষিপ্ত সময়ের মধ্যে উল্লেখযোগ্যভাবে বাড়িয়ে দেবে?

CORE-বেঞ্চ

অন্য কিছু ব্যবহারকারী বলেছেন যে, জ্যাক ক্লার্ক এনথ্রোপিকের নতুন প্রেস প্রধান হয়েছেন, যা তাদের নতুন কৌশলের অংশ: আমরা ভয় প্রচারকর্মী নই, আমাদের যতগুলি পেপার আছে, সবগুলিই আমরা যা আপনাদের সতর্ক করেছিলাম তার প্রমাণ দেয়।

CORE-বেঞ্চ

জ্যাক ক্লার্ক এই নিউজলেটারের Import AI 455 সংস্করণে একটি দীর্ঘ নিবন্ধ লিখেছেন।

CORE-বেঞ্চ

পরবর্তীতে, আমরা এই নিবন্ধটি সম্পূর্ণভাবে দেখব।

এআই সিস্টেমটি আত্ম-গঠন শুরু করতে চলেছে, এর অর্থ কী?

ক্লার্ক বলেন যে, তিনি এই নিবন্ধটি লিখেছেন কারণ সমস্ত প্রকাশ্যে উপলব্ধ তথ্য পর্যালোচনা করার পর তাকে একটি অসহজ সিদ্ধান্তে পৌঁছাতে হয়েছিল: ২০২৮ সালের শেষের মধ্যে মানুষের অংশগ্রহণ ছাড়াই এআই গবেষণা ঘটার সম্ভাবনা প্রায় ৬০% এর বেশি।

এখানে মানুষের হস্তক্ষেপ ছাড়া এআই গবেষণার কথা বলা হচ্ছে, যা একটি যথেষ্ট শক্তিশালী এআই সিস্টেম: এটি মানুষকে গবেষণায় সহায়তা করার পাশাপাশি স্বয়ংক্রিয়ভাবে প্রধান গবেষণা প্রক্রিয়াগুলি সম্পন্ন করতে পারে, এমনকি নিজের পরবর্তী প্রজন্মের সিস্টেমও তৈরি করতে পারে।

ক্লার্কের মতে, এটি স্পষ্টতই একটি বড় বিষয়।

তিনি স্বীকার করেন যে এই বিষয়টির অর্থ বুঝতে তিনিও কঠিন পাচ্ছেন।

এটিকে অনিচ্ছাকৃত বিচার বলা হয়েছে, কারণ এর পিছনের প্রভাবগুলি এতটাই বিশাল যে এটি ধরে রাখা কঠিন হয়ে পড়েছে। ক্লার্কও নিশ্চিত নন যে সমগ্র সমাজ কি AI গবেষণার স্বয়ংক্রিয়করণের গভীর পরিবর্তনগুলির জন্য প্রস্তুত।

তিনি এখন বিশ্বাস করেন যে মানুষ একটি বিশেষ সময়ের মধ্যে থাকতে পারে: এআই গবেষণা আসন্নভাবে এন্ড-টু-এন্ড অটোমেশনের দিকে এগিয়ে যাচ্ছে। যদি এই মুহূর্তটি সত্যি হয়, তাহলে মানুষ লুবিকন নদী পার হয়ে প্রায় অপ্রতিরোধ্য ভবিষ্যতের দিকে প্রবেশ করছে।

ক্লার্ক বলেন, এই নিবন্ধের উদ্দেশ্য হল ব্যাখ্যা করা যে কেন তিনি মনে করেন যে সম্পূর্ণ স্বয়ংক্রিয় AI গবেষণার দিকে উড়ান শুরু হচ্ছে।

তিনি এই প্রবণতার সম্ভাব্য প্রভাবগুলি নিয়ে আলোচনা করবেন, কিন্তু নিবন্ধটির বেশিরভাগ অংশই এই সিদ্ধান্তকে সমর্থন করার জন্য প্রমাণগুলির উপর ফোকাস করবে। গভীরতর প্রভাবগুলির জন্য, ক্লার্ক এই বছরের বেশিরভাগ সময় ধরে এটি বিশ্লেষণ করতে থাকবেন।

সময়ের দিক থেকে, ক্লার্ক মনে করেন যে এটি ২০২৬ সালে প্রকৃতপক্ষে ঘটবে না। কিন্তু তিনি মনে করেন যে আগামী এক বা দুই বছরের মধ্যে, আমরা কোনও মডেলের নিজেরই উত্তরাধিকারীকে এন্ড-টু-এন্ড ট্রেনিং করার উদাহরণ দেখতে পাব। অন্তত অগ্রণী মডেলের বাইরে, একটি ধারণার প্রমাণ প্রায় নিশ্চিত; যদিও সবচেয়ে অগ্রণী মডেলগুলির জন্য, এটি অধিকতর কঠিন হবে, কারণ এগুলির খরচ অত্যন্ত ব্যয়বহুল এবং এগুলির উপর বহু মানুষের গভীরভাবে কাজের নির্ভরশীলতা রয়েছে।

ক্লার্কের বিচার মূলত পাবলিক তথ্যের উপর ভিত্তি করে: arXiv, bioRxiv এবং NBER-এর পেপার এবং অগ্রণী AI কোম্পানিগুলি যে পণ্যগুলি বাস্তব বিশ্বে বাস্তবায়িত করেছে। এই তথ্যগুলির ভিত্তিতে, তিনি একটি সিদ্ধান্তে পৌঁছেছেন যে, AI সিস্টেমগুলির বর্তমান উৎপাদনের সমস্ত পর্যায়, বিশেষ করে AI উন্নয়নের ইঞ্জিনিয়ারিং উপাদানগুলি, প্রায়শই উপলব্ধ।

যদি স্কেলিং প্রবণতা চলতে থাকে, তাহলে আমাদের এমন পরিস্থিতির জন্য প্রস্তুত হওয়া উচিত: মডেলগুলি যথেষ্ট সৃজনশীল হয়ে উঠবে, যা শুধুমাত্র পরিচিত পদ্ধতিগুলি স্বয়ংক্রিয়ভাবে উন্নত করবে, বরং সম্পূর্ণ নতুন গবেষণা দিক এবং মৌলিক ধারণা প্রস্তাব করে মানুষের গবেষকদের প্রতিস্থাপন করবে, ফলে এটি নিজেই AI-এর সীমানা এগিয়ে নিয়ে যাবে।

Coding Singularity: Change in Ability Over Time

AI সিস্টেম সফটওয়্যারের মাধ্যমে বাস্তবায়িত হয়, যা কোড দিয়ে গঠিত।

এআই সিস্টেমগুলি কোড উত্পাদনের পদ্ধতিকে সম্পূর্ণরূপে পরিবর্তন করে দিয়েছে। এর পিছনে দুটি সম্পর্কিত প্রবণতা রয়েছে: একদিকে, এআই সিস্টেমগুলি জটিল বাস্তব-বিশ্বের কোড লেখার দক্ষতা বাড়াচ্ছে; অন্যদিকে, এআই সিস্টেমগুলি মানুষের পর্যবেক্ষণের প্রায় কোনো নির্ভরশীলতা ছাড়াই অনেক রৈখিক কোডিং কাজগুলি একসাথে সংযুক্ত করার দক্ষতা বাড়াচ্ছে, যেমন প্রথমে কোড লেখা, তারপর টেস্টিং করা।

এই প্রবণতার দুটি উল্লেখযোগ্য উদাহরণ হল SWE-Bench এবং METR টাইম হরাইজনস প্লট।

বাস্তব জগতের সফটওয়্যার ইঞ্জিনিয়ারিং সমস্যাগুলি সমাধান করুন

SWE-Bench হল একটি প্রচলিত প্রোগ্রামিং টেস্ট যা AI সিস্টেমের বাস্তব GitHub ইসু সমাধানের ক্ষমতা মূল্যায়নের জন্য ব্যবহার করা হয়।

2023 এর শেষের দিকে যখন SWE-Bench চালু হয়, তখন সর্বোত্তম পারফর্ম করা মডেলটি ছিল Claude 2, যার মোট সফলতার হার মাত্র 2% ছিল। অন্যদিকে, Claude Mythos Preview-এর স্কোর 93.9% পৌঁছেছে, যা এই benchmark-এর সর্বোচ্চ স্কোরের কাছাকাছি।

অবশ্যই, সমস্ত বেঞ্চমার্কে নিজে নিজেই কিছু শব্দ থাকে, তাই সাধারণত একটি পর্যায় আসে যখন স্কোর কিছু পর্যায়ে পৌঁছায়, তখন আপনি যা দেখতে পান তা হয়তো পদ্ধতির সীমাবদ্ধতা নয়, বরং বেঞ্চমার্কেরই সীমাবদ্ধতা। উদাহরণস্বরূপ, ImageNet যাচাইকরণ সেটে, প্রায় 6% লেবেল ভুল বা অস্পষ্ট।

SWE-Bench কে সাধারণ প্রোগ্রামিং দক্ষতা এবং এআইয়ের সফটওয়্যার ইঞ্জিনিয়ারিংয়ের উপর প্রভাব পরিমাপের একটি নির্ভরযোগ্য সূচক হিসাবে বিবেচনা করা যেতে পারে। ক্লার্ক বলেন, তিনি যে অগ্রণী এআই পরীক্ষাগার এবং সিলিকন ভ্যালির সাথে যোগাযোগ করেছেন, সেখানকার বেশিরভাগ মানুষ এখন প্রায় সম্পূর্ণরূপে এআই সিস্টেমের মাধ্যমে কোড লিখছেন, এবং আরও বেশি মানুষ টেস্ট লিখতে এবং কোড চেক করতে এআই সিস্টেম ব্যবহার করছেন।

অন্যভাবে বললে, এআই সিস্টেমগুলি এতটাই শক্তিশালী হয়ে উঠেছে যে এআই গবেষণার একটি গুরুত্বপূর্ণ অংশকে স্বয়ংক্রিয়ভাবে সম্পন্ন করতে পারে এবং এআই গবেষণায় জড়িত সমস্ত মানুষের গবেষক এবং ইঞ্জিনিয়ারদের গতি উল্লেখযোগ্যভাবে বাড়িয়ে দেয়।

দীর্ঘসময়ের কাজ সম্পন্ন করার জন্য এআই সিস্টেমের ক্ষমতা পরিমাপ

METR একটি চিত্র তৈরি করেছে যা AI কতটা জটিল কাজ সম্পন্ন করতে পারে তা পরিমাপ করে। এখানে জটিলতা হল একজন দক্ষ মানুষের এই কাজগুলি সম্পন্ন করতে প্রায় কত ঘন্টা লাগবে তার ভিত্তিতে।

সবচেয়ে গুরুত্বপূর্ণ সূচক হল একটি কাজের সেটে AI সিস্টেম 50% নির্ভরযোগ্যতা অর্জন করার সময়ের পরিসর।

এই বিন্দুতে, অগ্রগতি অসাধারণ:

২০২২ সালে, GPT-3.5 যে কাজগুলি সম্পন্ন করতে পারত, তা মানুষের জন্য প্রায় ৩০ সেকেন্ডে সম্পন্ন করার মতো।

· ২০২৩ সালে, GPT-4 এই সময়কে ৪ মিনিটে উন্নীত করেছিল।

· ২০২৪ সালে, o1 এই সময়কে ৪০ মিনিটে বাড়িয়েছে।

· ২০২৫ সালে, GPT-5.2 High প্রায় ৬ ঘন্টা পৌঁছেছিল।

2026 এর মধ্যে, অপাস 4.6 এই সময়কে প্রায় 12 ঘন্টায় বাড়িয়ে দিয়েছে।

METR-এ কাজ করেন এবং এআই পূর্বাভাসে দীর্ঘদিন আগ্রহী অজেয়া কোট্রা মনে করেন, ২০২৬ সালের শেষের দিকে এআই সিস্টেমগুলি মানুষের জন্য ১০০ ঘন্টা লাগে এমন কাজগুলি সম্পন্ন করতে পারবে, এটি একটি অযৌক্তিক প্রত্যাশা নয়।

এআই সিস্টেমগুলির স্বাধীনভাবে কাজ করার সময়কাল উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে, যা এজেন্টিক কোডিং টুলগুলির বিস্ফোরণের সাথে ঘনিষ্ঠভাবে সম্পর্কিত। এজেন্টিক কোডিং টুলগুলি হল মূলত মানুষের পরিবর্তে কাজ সম্পন্ন করতে পারে এমন এআই সিস্টেমগুলিকে পণ্যকরণ: এগুলি মানুষের পক্ষে কাজ করতে পারে এবং দীর্ঘ সময়ের জন্য আপেক্ষিকভাবে স্বাধীনভাবে কাজগুলি এগিয়ে নিতে পারে।

এটি আবার এআই গবেষণার নিজস্ব দিকে পুনর্নির্দেশিত হয়। অনেক এআই গবেষকের দৈনিক কাজগুলি পর্যবেক্ষণ করলে দেখা যায় যে এগুলির অধিকাংশ কাজকে কয়েক ঘন্টার মাত্রায় বিভক্ত করা যায়, যেমন ডেটা পরিষ্কার করা, ডেটা পড়া, পরীক্ষা চালু করা ইত্যাদি।

এবং এই ধরনের কাজগুলি এখন আধুনিক এআই সিস্টেমগুলির কভারেজ সময়কালের মধ্যে পড়ে।

যত বেশি এআই সিস্টেম দক্ষ হয়, তত বেশি মানুষের নির্ভরশীল না হয়ে কাজ করতে পারে এবং এআই গবেষণার কিছু অংশকে স্বয়ংক্রিয়ভাবে সহায়তা করতে পারে।

কাজ বরাদ্দের প্রধান দুটি কারণ হল:

· প্রথমত, আপনি আপনার প্রতিনিধির ক্ষমতার প্রতি বিশ্বাস রাখেন;

· দ্বিতীয়ত, আপনি বিশ্বাস করেন যে অপরপক্ষ আপনার নির্দেশ অনুযায়ী আপনার নিয়মিত পর্যবেক্ষণের অপেক্ষা না করে স্বাধীনভাবে কাজ সম্পন্ন করতে পারবে।

যখন ব্যবহারকারীরা এআইয়ের প্রোগ্রামিং দক্ষতা পর্যবেক্ষণ করে, তখন তারা দেখতে পায় যে এআই সিস্টেমগুলি শুধু দক্ষতার সাথে বাড়ছে না, বরং মানুষের পুনর্নিয়োগের প্রয়োজন ছাড়াই দীর্ঘসময়ের জন্য স্বাধীনভাবে কাজ করতে পারছে।

এটি আমাদের চারপাশে ঘটছে এমন ঘটনাগুলির সাথে মেলে, যেখানে ইঞ্জিনিয়ার এবং গবেষকরা বড় বড় কাজগুলি এআই সিস্টেমের উপর ছেড়ে দিচ্ছেন। এআইয়ের ক্ষমতা যত বাড়ছে, এআইকে দেওয়া কাজগুলি তত জটিল এবং গুরুত্বপূর্ণ হয়ে উঠছে।

এআই এআই গবেষণার জন্য প্রয়োজনীয় মৌলিক বিজ্ঞানের দক্ষতা অর্জন করছে

আধুনিক বৈজ্ঞানিক গবেষণা কিভাবে পরিচালিত হয় তা ভাবুন, যেখানে বড় একটি অংশ হলো প্রথমে একটি দিক নির্ধারণ করা, এবং নিজেদের কোন ধরনের অভিজ্ঞতাগত তথ্য পেতে চাইছেন তা পরিষ্কার করা; তারপর এই তথ্যগুলি উৎপাদনের জন্য পরীক্ষা ডিজাইন করা এবং চালানো; এবং শেষে পরীক্ষার ফলাফলগুলির যুক্তিসঙ্গততা পরীক্ষা করা।

এআই প্রোগ্রামিং দক্ষতা বৃদ্ধি পাওয়ার সাথে সাথে বড় ভাষা মডেলগুলির বিশ্ব মডেলিং ক্ষমতা শক্তিশালী হওয়ার ফলে, এখন কিছু টুল উঠে এসেছে যা মানুষের বিজ্ঞানীদের গতি বাড়াতে এবং আরও ব্যাপক গবেষণা-উন্নয়ন পরিস্থিতিতে কিছু ধাপকে আংশিকভাবে স্বয়ংক্রিয় করতে সাহায্য করে।

এখানে, আমরা দেখতে পাই যে কিছু গুরুত্বপূর্ণ বৈজ্ঞানিক দক্ষতায় এআই কত দ্রুত এগিয়ে যাচ্ছে, যেসব দক্ষতা নিজেই এআই গবেষণার অপরিহার্য অংশ:

· প্রথমত, গবেষণার ফলাফল পুনরায় তৈরি করা;

· দ্বিতীয়ত, মেশিন লার্নিং প্রযুক্তিকে অন্যান্য পদ্ধতির সাথে সংযুক্ত করে প্রযুক্তিগত সমস্যা সমাধান করা;

· তৃতীয়ত, এআই সিস্টেমটিকে নিজেই উন্নত করা।

পূর্ণ বৈজ্ঞানিক প্রবন্ধটি বাস্তবায়ন করুন এবং সংশ্লিষ্ট পরীক্ষাগুলি সম্পন্ন করুন

এআই গবেষণার একটি কেন্দ্রীয় কাজ হল বৈজ্ঞানিক পেপার পড়া এবং সেগুলির ফলাফল পুনরায় উত্পাদন করা। এই দিকে, এআই বিভিন্ন বেঞ্চমার্কে উল্লেখযোগ্য অগ্রগতি অর্জন করেছে।

একটি ভালো উদাহরণ হলো CORE-Bench, যা কম্পিউটেশনাল রিপ্রোডিউসিবিলিটি এজেন্ট বেঞ্চমার্ক।

এই বেঞ্চমার্কটি একটি পেপার এবং এর কোড রিপোজিটরি প্রদান করে একটি AI সিস্টেমকে পেপারের ফলাফলগুলি পুনরায় উত্পাদন করতে বাধ্য করে। বিশদভাবে, এজেন্টটিকে সংশ্লিষ্ট লাইব্রেরি, প্যাকেজ এবং নির্ভরতা ইনস্টল করতে হবে, কোড চালাতে হবে; যদি কোডটি সফলভাবে চলে, তবে এটিকে সমস্ত আউটপুট ফলাফল খুঁজে বের করতে হবে এবং টাস্কের প্রশ্নগুলির উত্তর দিতে হবে।

CORE-Bench 2024 সালের সেপ্টেম্বরে প্রস্তাব করা হয়। সেই সময়ের সেরা পারফরম্যান্স দেখানো সিস্টেমটি ছিল CORE-Agent scaffold-এ চলমান GPT-4o মডেল। এই benchmark-এর সবচেয়ে কঠিন টাস্কগুলির সেটে, এটি প্রায় 21.5% স্কোর করেছিল।

2025 সালের ডিসেম্বরে, CORE-Bench-এর একজন লেখক ঘোষণা করেন যে এই বেঞ্চমার্কটি সমাধান করা হয়েছে: Opus 4.5 মডেল 95.5% স্কোর অর্জন করেছে।

ক্যাগল প্রতিযোগিতার সমস্যা সমাধানের জন্য একটি সম্পূর্ণ মেশিন লার্নিং সিস্টেম তৈরি করুন

MLE-Bench হল OpenAI দ্বারা তৈরি একটি বেঞ্চমার্ক, যা AI সিস্টেমের অফলাইন পরিবেশে Kaggle প্রতিযোগিতায় অংশগ্রহণের ক্ষমতা পরীক্ষা করতে ব্যবহার করা হয়।

এটি প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, কম্পিউটার দৃষ্টি এবং সংকেত প্রক্রিয়াকরণ সহ বিভিন্ন ক্ষেত্রে সম্পর্কিত 75টি বিভিন্ন ধরনের Kaggle প্রতিযোগিতাকে কভার করে।

MLE-Bench 2024 সালের অক্টোবরে প্রকাশিত হয়েছিল। প্রকাশের সময়, সর্বোত্তম পারফরম্যান্স দেখানো সিস্টেমটি ছিল একটি agent scaffold-এ চলমান o1 মডেল, যা 16.9% স্কোর অর্জন করেছিল।

2026 ফেব্রুয়ারি পর্যন্ত, সর্বোত্তম পারফর্মিং সিস্টেমটি সার্চ ক্ষমতা সহ এজেন্ট হারনেসে চলছে Gemini 3, যা 64.4% স্কোর অর্জন করেছে।

কার্নেল ডিজাইন

AI উন্নয়নের একটি আরও কঠিন কাজ হল কার্নেল অপ্টিমাইজেশন। কার্নেল অপ্টিমাইজেশন বলতে বোঝায় নিম্নস্তরের কোড লেখা এবং উন্নত করা, যাতে ম্যাট্রিক্স গুণনের মতো নির্দিষ্ট অপারেশনগুলি নিম্নস্তরের হার্ডওয়্যারে আরও দক্ষভাবে ম্যাপ করা যায়।

কার্নেল অপ্টিমাইজেশন কেন এআই ডেভেলপমেন্টের কেন্দ্রীয় বিষয়, কারণ এটি ট্রেনিং এবং ইনফারেন্সের দক্ষতা নির্ধারণ করে: একদিকে, এটি আপনার এআই সিস্টেম ডেভেলপ করার সময় আপনি কতটা কম্পিউটিং পাওয়ার কার্যকরভাবে ব্যবহার করতে পারবেন তা প্রভাবিত করে; অন্যদিকে, মডেল ট্রেনিং শেষ হওয়ার পর, এটি আপনি কতটা দক্ষতার সাথে কম্পিউটিং পাওয়ারকে ইনফারেন্স ক্ষমতায় রূপান্তরিত করতে পারবেন তা নির্ধারণ করে।

গত কয়েক বছর ধরে, কার্নেল ডিজাইনের জন্য এআই ব্যবহার একটি আকর্ষণীয় ছোট দিক থেকে একটি প্রতিযোগিতামূলক গবেষণা ক্ষেত্রে পরিণত হয়েছে এবং এর জন্য অনেকগুলি বেঞ্চমার্ক তৈরি হয়েছে। তবে, এই বেঞ্চমার্কগুলি এখনও বিশেষভাবে জনপ্রিয় নয়, তাই আমরা অন্যান্য ক্ষেত্রের মতো এর দীর্ঘমেয়াদী অগ্রগতির স্পষ্ট মডেলিং করতে পারি না। অন্যদিকে, আমরা কিছু চলমান গবেষণার মাধ্যমে এই দিকের অগ্রগতির গতি অনুভব করতে পারি।

সংশ্লিষ্ট কাজগুলি হল:

· ডিপসিকের মডেল ব্যবহার করে ভালো জিপিইউ কার্নেল তৈরির চেষ্টা করুন;

পাইটর্চ মডিউলগুলিকে অটোমেটিকভাবে কিউডিএ কোডে রূপান্তর করুন;

· মেটা তাদের নিজস্ব অবকাঠামোতে LLM ব্যবহার করে অপ্টিমাইজড Triton kernel স্বয়ংক্রিয়ভাবে তৈরি করে এবং ডিপ্লয় করে;

এবং GPU কার্নেল ডিজাইনের জন্য ওপেন-সোর্স ওয়েট মডেল, যেমন Cuda Agent কে ফাইন-টিউন করা।

এখানে একটি বিষয় যোগ করা দরকার: কার্নেল ডিজাইনে কিছু বিশেষ বৈশিষ্ট্য রয়েছে যা AI-চালিত গবেষণার জন্য খুব উপযুক্ত, যেমন ফলাফল সহজে যাচাই করা যায় এবং পুরস্কার সংকেত পরিষ্কার।

PostTrainBench এর মাধ্যমে ভাষা মডেল ফাইন-টিউন করুন

এই ধরনের পরীক্ষার একটি আরও কঠিন সংস্করণ হল PostTrainBench। এটি পরীক্ষা করে যে বিভিন্ন অগ্রণী মডেলগুলি কি ছোট ওপেন-সোর্স ওয়েট মডেলগুলিকে গ্রহণ করতে পারে এবং কিছু বেঞ্চমার্কে তাদের পারফরম্যান্স ফাইন-টিউনিংয়ের মাধ্যমে উন্নত করতে পারে।

এই বেঞ্চমার্কের একটি সুবিধা হল এটির অত্যন্ত শক্তিশালী মানব বেঞ্চমার্ক রয়েছে: এই ছোট মডেলগুলির বর্তমান instruct-tuned সংস্করণগুলি। এই সংস্করণগুলি সাধারণত অগ্রণী পরীক্ষাগারের দক্ষ মানব AI গবেষকদ্বারা বিকশিত হয়েছে, যারা অত্যন্ত দক্ষ গবেষক এবং ইঞ্জিনিয়ারদ্বারা পরিষ্কার-পরিচ্ছন্ন করা হয়েছে এবং বাস্তব জগতে বাস্তবায়িত হয়েছে। তাই, এগুলি একটি অত্যন্ত অতিক্রমণযোগ্য মানব বেঞ্চমার্ক গঠন করে।

2026 মার্চ পর্যন্ত, এআই সিস্টেমগুলি মডেলের পোস্ট-ট্রেনিং করতে সক্ষম হয়েছে এবং মানুষের ট্রেনিং ফলাফলের প্রায় অর্ধেক পরিমাণ পারফরম্যান্স বৃদ্ধি অর্জন করেছে।

নির্দিষ্ট মূল্যায়ন স্কোর একটি ওজনযুক্ত গড় থেকে আসে: এটি Qwen 3 1.7B, Qwen 3 4B, SmolLM3-3B, Gemma 3 4B সহ বেশ কয়েকটি পোস্ট-ট্রেনড বড় ভাষা মডেল এবং AIME 2025, Arena Hard, BFCL, GPQA Main, GSM8K, HealthBench, HumanEval সহ বেশ কয়েকটি বেঞ্চমার্ককে সমন্বিত করে।

প্রতিটি রানে, মূল্যায়নকারী একটি নির্দিষ্ট বেঞ্চমার্কে একটি নির্দিষ্ট বেস মডেলের পারফরম্যান্স বাড়ানোর জন্য একটি CLI এজেন্ট চায়।

2026 এপ্রিল পর্যন্ত, সর্বোচ্চ স্কোর পাওয়া এআই সিস্টেমগুলি প্রায় 25% থেকে 28% স্কোর করে, যার মধ্যে অপাস 4.6 এবং জিপিটি 5.4 অন্তর্ভুক্ত; এর বিপরীতে, মানুষের স্কোর 51%।

এটি একটি পর্যাপ্ত অর্থপূর্ণ ফলাফল।

ভাষা মডেল প্রশিক্ষণ অপ্টিমাইজ করুন

গত বছর ধরে, Anthropic তাদের সিস্টেমের একটি LLM প্রশিক্ষণ কাজে পারফরম্যান্স রিপোর্ট করে আসছে। এই কাজটি মডেলকে শুধুমাত্র CPU ব্যবহার করে একটি ছোট ভাষা মডেল প্রশিক্ষণ বাস্তবায়নকে সর্বাধিক দ্রুত চালানোর জন্য অপ্টিমাইজ করতে বলে।

মূল্যায়ন পদ্ধতি হল: অপরিবর্তিত প্রাথমিক কোডের তুলনায় মডেল দ্বারা অর্জিত গড় স্পিড-আপ ফ্যাক্টর।

এই ফলাফলের প্রগতি অত্যন্ত উল্লেখযোগ্য:

· মে ২০২৫-এ, Claude Opus 4 এর গড় গতি 2.9 গুণ বৃদ্ধি পেয়েছে;

· নভেম্বর 2025-এ, অপাস 4.5 কে 16.5 গুণ বাড়ানো হয়েছে;

· ফেব্রুয়ারি 2026-এ, অপাস 4.6 30 গুণ পৌঁছায়;

· এপ্রিল ২০২৬-এ, ক্লড মাইথস প্রিভিউ ৫২ গুণ পৌঁছেছে।

এই সংখ্যাগুলির অর্থ বুঝতে, একটি তুলনা করুন: মানব গবেষকদের জন্য, এই কাজটি সাধারণত 4 থেকে 8 ঘন্টা কাজ করে 4 গুণ ত্বরান্বিত করা হয়।

মূল দক্ষতা: পরিচালনা

এআই সিস্টেমগুলি অন্যান্য এআই সিস্টেমগুলি পরিচালনা করার পদ্ধতি শিখছে।

এটি এখন কিছু ব্যাপকভাবে ব্যবহৃত পণ্যে দেখা যাচ্ছে, যেমন Claude Code বা OpenCode। এই পণ্যগুলিতে, একটি মূল এজেন্ট একাধিক সাব-এজেন্টকে পর্যবেক্ষণ করতে পারে।

এটি এআই সিস্টেমকে বড় পরিসরের প্রকল্পগুলি পরিচালনা করতে সক্ষম করে: প্রকল্পে বিভিন্ন দক্ষতাসম্পন্ন অনেকগুলি এজেন্টকে সমান্তরালভাবে কাজ করতে হতে পারে, এবং তাদের সাধারণত একটি একক এআই ম্যানেজার দ্বারা সমন্বয় করা হয়। এখানে ম্যানেজারটিও একটি এআই সিস্টেম।

এআই গবেষণা কি সাধারণ আপেক্ষিকতার আবিষ্কারের মতো, নাকি লেগো জোড়া লাগানোর মতো?

একটি গুরুত্বপূর্ণ প্রশ্ন হলো: কি এআই নতুন ধারণা আবিষ্কার করতে পারে যা এটিকে নিজেকে উন্নত করতে সাহায্য করবে? নাকি এই সিস্টেমগুলি গবেষণার সেই অনুপস্থিত, কিন্তু ধাপে ধাপে এগিয়ে যাওয়ার কাজগুলির জন্য বেশি উপযুক্ত?

এই প্রশ্নটি গুরুত্বপূর্ণ, কারণ এটি নির্ভর করে এই বিষয়ে যে AI সিস্টেমগুলি AI গবেষণাকে কতটা এন্ড-টু-এন্ড অটোমেশন করতে পারে।

লেখকের মতে: বর্তমানে এআই সত্যিকারের উদ্ভট নতুন ধারণা প্রস্তাব করতে পারে না। তবে নিজের গবেষণা স্বয়ংক্রিয়করণ অর্জনের জন্য এটি অবশ্যই এটি করার প্রয়োজন হতে পারে না।

একটি ক্ষেত্র হিসাবে, এআই-এর উন্নতি প্রায়শই বড় পরিমাণের পরীক্ষা এবং ডেটা এবং কম্পিউটেশনাল পাওয়ারের মতো বৃদ্ধি পাওয়া ইনপুটের উপর নির্ভর করে।

কখনও কখনও, মানুষ এমন ধারণা প্রস্তাব করে যা পুরো ক্ষেত্রের সম্পদের দক্ষতা বাড়িয়ে দেয়। Transformer আর্কিটেকচার একটি উত্তম উদাহরণ, মিক্সচার-অফ-এক্সপার্টস, বা MoE আরেকটি উদাহরণ।

কিন্তু বেশিরভাগ সময়ই এআই ক্ষেত্রে এগিয়ে যাওয়ার পদ্ধতি আসলে অধিকতর সরল: মানুষ একটি ভালো কাজ করা সিস্টেম নেয়, এর একটি দিক—যেমন প্রশিক্ষণ ডেটা এবং ক্যালকুলেশন ক্ষমতা—বাড়ায়; স্কেল বাড়ানোর পর কোথায় সমস্যা দেখা দেয় তা পর্যবেক্ষণ করে; সিস্টেমটিকে আবার স্কেল করার জন্য ইঞ্জিনিয়ারিংভিত্তিক সমাধান খুঁজে বার করে; এবং তারপর আবার স্কেল বাড়ায়।

এই প্রক্রিয়ার মধ্যে, প্রকৃতপক্ষে খুব কমই বিশদ বিশ্লেষণের প্রয়োজন। বেশিরভাগ কাজই কম উজ্জ্বল, কিন্তু অত্যন্ত শক্তিশালী মৌলিক প্রকৌশলের মতো।

একইভাবে, অনেক AI গবেষণা বিদ্যমান পরীক্ষাগুলির বিভিন্ন পরিবর্তন চালানোর উপর ভিত্তি করে, বিভিন্ন প্যারামিটার সেটিংস কী ফলাফল আনে তা অনুসন্ধান করে। গবেষণার অনুভূতি অবশ্যই মানুষকে সবচেয়ে বেশি চেষ্টা করার যোগ্য প্যারামিটারগুলি বাছাই করতে সাহায্য করে, কিন্তু এই কাজটিও স্বয়ংক্রিয়ভাবে করা যেতে পারে, যাতে AI নিজেই বুঝতে পারে কোন প্যারামিটারগুলি সমন্বয়ের মূল্যবান। প্রাথমিক নিউরাল আর্কিটেকচার সার্চগুলি এই ধারণারই একটি সংস্করণ।

এডিসন বলেছিলেন: প্রতিভা হল 1% অনুপ্রেরণা এবং 99% পরিশ্রম। যদিও 150 বছর পেরিয়ে গেছে, এই বাক্যটি এখনও খুব প্রাসঙ্গিক।

কখনও কখনও, একটি ক্ষেত্রকে সম্পূর্ণরূপে পরিবর্তন করে দেওয়া নতুন দৃষ্টিভঙ্গি দেখা যায়। কিন্তু বেশিরভাগ সময়, ক্ষেত্রের উন্নতি মানুষের বিভিন্ন সিস্টেমের উন্নতি এবং ডিবাগিংয়ের কঠিন প্রক্রিয়ার মাধ্যমে ধীরে ধীরে অগ্রসর হয়।

এবং আগে উল্লিখিত পাবলিক ডেটা দেখায় যে, এআই এআই ডেভেলপমেন্টের অনেক প্রয়োজনীয় কঠিন কাজ করতে খুব দক্ষ।

এর সাথে একটি বড় প্রবণতা রয়েছে: প্রোগ্রামিংয়ের মতো মৌলিক ক্ষমতাগুলি ক্রমাগত বাড়তে থাকা কাজের সময়কালের সাথে একীভূত হচ্ছে। এর অর্থ হল এআই সিস্টেমগুলি এই ধরনের ক্রমাগত বাড়তে থাকা কাজগুলিকে একসাথে যুক্ত করে জটিল কাজের ধারাবাহিকতা তৈরি করতে পারবে।

অতএব, যদিও বর্তমানে এআই সিস্টেমগুলি তুলনামূলকভাবে কম সৃজনশীল, তবুও এটি বিশ্বাস করার কারণ রয়েছে যে তারা নিজেদের অগ্রগতি চালিয়ে যেতে পারবে। শুধুমাত্র সম্পূর্ণ নতুন দৃষ্টিভঙ্গি উৎপাদনের তুলনায় এই অগ্রগতির গতি ধীর হতে পারে।

তবে যদি আপনি পাবলিক ডেটা পর্যবেক্ষণ করতে থাকেন, তবে আরেকটি আকর্ষণীয় সংকেত দেখতে পাবেন: এআই সিস্টেমগুলি হয়তো কিছুটা সৃজনশীলতা প্রদর্শন করছে, এবং এই সৃজনশীলতা তাদের নিজেদের উন্নতির জন্য আরও অপ্রত্যাশিতভাবে অগ্রসর হতে সক্ষম করতে পারে।

বিজ্ঞানের সীমানা আরও এগিয়ে নিয়ে যাওয়া

এখন পর্যন্ত কিছু অত্যন্ত প্রাথমিক সূচনা পাওয়া গিয়েছে যে, সাধারণ AI সিস্টেমগুলি মানব বিজ্ঞানের সীমানা আরও এগিয়ে নিয়ে যাওয়ার ক্ষমতা রাখে। তবে এখন পর্যন্ত, এই ঘটনা কেবলমাত্র কয়েকটি ক্ষেত্রেই ঘটেছে, মূলত কম্পিউটার বিজ্ঞান এবং গণিতে। এছাড়াও, অনেকসময় AI সিস্টেমগুলি একাই বিপ্লব ঘটায় না, বরং মানুষের গবেষকদের সাথে মানব-কম্পিউটার সহযোগিতার মাধ্যমে এগিয়ে যায়।

তবুও, এই প্রবণতাগুলি পর্যবেক্ষণের মূল্যবান:

এর্ডোশ সমস্যা: একটি গণিতবিদদের দল জেমিনি মডেলের সাথে কাজ করে এর কিছু এর্ডোশ গণিত সমস্যা সমাধানের ক্ষমতা পরীক্ষা করেছে। তারা সিস্টেমকে প্রায় 700টি সমস্যা সমাধানের জন্য পরিচালনা করেছে এবং শেষপর্যন্ত 13টি সমাধান পেয়েছে। এই সমাধানগুলির মধ্যে 1টি তারা আকর্ষণীয় বলে মনে করেছে।

গবেষকদের মতে, তারা প্রাথমিকভাবে ধারণা করেন যে, আলেথিয়া (একটি জেমিনি 3 ডিপ থিংক-ভিত্তিক এআই সিস্টেম) এরডোস-১০৫১-এর সমাধান একটি প্রাথমিক উদাহরণ হিসেবে বিবেচিত হতে পারে: একটি এআই সিস্টেম স্বয়ংক্রিয়ভাবে একটি অপেক্ষাকৃত অ-সহজ এবং ব্যাপক গণিতীয় আগ্রহের সাথে জড়িত খোলা এরডোস সমস্যা সমাধান করেছে। এই সমস্যাটির আগেও কিছু closely-related গবেষণা প্রকাশিত হয়েছে।

যদি আশাবাদী দিক থেকে বুঝা যায়, তবে এই কেসগুলি একটি সংকেত হিসাবে দেখা যেতে পারে যে AI সিস্টেমগুলি এমন একটি সৃজনশীল বুদ্ধি বিকাশ করছে, যা আগে মূলত মানুষের অধিকারে ছিল।

কিন্তু এটিকে অন্যদিক থেকেও ব্যাখ্যা করা যায়: গণিত এবং কম্পিউটার বিজ্ঞান সম্ভবত নিজেদেরই বিশেষভাবে AI-চালিত আবিষ্কারের জন্য উপযুক্ত ক্ষেত্র, তাই এগুলি শুধুমাত্র ব্যতিক্রম হতে পারে এবং AI-এর মাধ্যমে বিজ্ঞানের অন্যান্য ক্ষেত্রগুলিকেও একইভাবে এগিয়ে নেওয়ার প্রতিনিধিত্ব করতে পারে না।

একটি অনুরূপ উদাহরণ হল অ্যালফাগোর ৩৭তম হাত। তবে ক্লার্ক মনে করেন যে, অ্যালফাগোর ৩৭তম হাতের পর থেকে এখনও কোনও আধুনিক বা আরও অসাধারণ অন্তর্দৃষ্টি দ্বারা এটি প্রতিস্থাপিত হয়নি, এটিই একটি সামান্য নিষ্ঠুর সংকেত হিসেবে বিবেচিত হতে পারে।

এআই এখন এআই ইঞ্জিনিয়ারিংয়ের বড় অংশগুলিকে স্বয়ংক্রিয় করতে পারে

যদি উপরের সমস্ত প্রমাণগুলি একত্রিত করা হয়, তাহলে আমরা এমন একটি চিত্র দেখতে পাই:

AI সিস্টেমগুলি এখন প্র practically যেকোনো প্রোগ্রামের জন্য কোড লিখতে পারে, এবং এই সিস্টেমগুলিকে কিছু কাজ স্বাধীনভাবে সম্পন্ন করার জন্য বিশ্বাস করা যায়; এই কাজগুলি মানুষের হাতে দিলে প্রায়শই দশগুলি ঘন্টা প্রচণ্ড মনোযোগ দিয়ে কাজ করতে হয়।

AI সিস্টেমগুলি মডেল ফাইন-টিউনিং থেকে কার্নেল ডিজাইন পর্যন্ত AI ডেভেলপমেন্টের মূল কাজগুলি করতে ক্রমাগত দক্ষতা অর্জন করছে।

AI সিস্টেমগুলি এখন অন্যান্য AI সিস্টেমগুলি পরিচালনা করতে সক্ষম, যা প্রকৃতপক্ষে একটি সংশ্লেষিত দল গঠন করে: একাধিক AI জটিল সমস্যাগুলির বিভিন্ন দিক পরিচালনা করতে পারে, যেখানে কিছু AI নেতৃত্বদানকারী, সমালোচক এবং সম্পাদকের ভূমিকা পালন করে, অন্যান্য AI ইঞ্জিনিয়ারের ভূমিকা পালন করে।

AI সিস্টেমগুলি কখনও কখনও জটিল প্রকৌশল এবং বিজ্ঞানের কাজে মানুষকে ছাড়িয়ে যায়, তবে এখনও কঠিন যে এটি তাদের প্রকৃত সৃজনশীলতার কারণে নাকি তারা বিপুল পরিমাণে প্যাটার্নভিত্তিক জ্ঞানের দক্ষতা অর্জন করেছে তা বোঝা।

ক্লার্কের মতে, এই প্রমাণগুলি ইতিমধ্যেই পর্যাপ্তভাবে প্রমাণ করে যে আজকের এআই এআই ইঞ্জিনিয়ারিংয়ের বড় অংশ, এমনকি সম্ভবত সমস্ত প্রক্রিয়াকে স্বয়ংক্রিয়ভাবে করতে পারে।

তবে, বর্তমানে এটি অস্পষ্ট যে AI কতটা স্বয়ংক্রিয়ভাবে AI গবেষণাকে সম্পাদন করতে পারবে। কারণ, গবেষণার কিছু অংশ, যা শুধুমাত্র প্রকৌশল দক্ষতার চেয়ে ভিন্ন, এখনও উচ্চতর পর্যায়ের বিচার, সমস্যা সচেতনতা এবং সৃজনশীলতার উপর নির্ভরশীল।

তবে যাই হোক না কেন, একটি স্পষ্ট সংকেত প্রকাশ পেয়েছে: আজকের এআই এআই উন্নয়নে নিয়োজিত মানুষদের অনেক বেশি ত্বরান্বিত করছে, যাতে এই গবেষক এবং ইঞ্জিনিয়ারদের অসংখ্য সিনথেটিক সহকর্মীর সাথে জুটি বাঁধে তাদের কাজের ক্ষমতা বাড়ানো যায়।

শেষ পর্যন্ত, এআই শিল্পটিই প্রায় স্পষ্টভাবে বলছে: স্বয়ংক্রিয় এআই গবেষণা হল তাদের লক্ষ্য।

OpenAI 2026 সালের সেপ্টেম্বরের আগে একটি স্বয়ংক্রিয় এআই গবেষণা ইন্টার্ন তৈরির ইচ্ছা প্রকাশ করেছে। Anthropic স্বয়ংক্রিয় এআই অ্যালাইনমেন্ট গবেষক তৈরি নিয়ে কাজ প্রকাশ করছে। DeepMind তিনটি প্রধান প্রযুক্তি প্রতিষ্ঠানের মধ্যে সবচেয়ে সতর্ক মনে হলেও, সম্ভব হলে অ্যালাইনমেন্ট গবেষণার স্বয়ংক্রিয়তা এগিয়ে নেওয়া উচিত বলে মনে করে।

অটোমেশন করা এআই গবেষণাও অনেক স্টার্টআপের লক্ষ্য হয়ে উঠেছে। রিকার্সিভ সুপারইন্টেলিজেন্স সাম্প্রতিক বছরে ৫ বিলিয়ন ডলার বিনিয়োগ করেছে, যার লক্ষ্য হলো এআই গবেষণাকে অটোমেটাইজ করা।

অন্যভাবে বললে, হাজার বিলিয়ন ডলারের পরিসরের বিদ্যমান এবং নতুন মূলধন একটি সেট সংস্থার দিকে প্রবাহিত হচ্ছে যাদের লক্ষ্য স্বয়ংক্রিয় AI গবেষণা।

অতএব, আমাদের অবশ্যই এই দিকে কিছু প্রগতি হওয়ার প্রত্যাশা করা উচিত।

এটি কেন গুরুত্বপূর্ণ

এর প্রভাব গভীর, কিন্তু জনসাধারণের মাধ্যমে এআই গবেষণার প্রতিবেদনে এটি প্রায় আলোচনা করা হয় না। এআই গবেষণার বিশাল চ্যালেঞ্জগুলি নিম্নলিখিত দিকগুলিতে প্রতিফলিত হয়।

1. আমাদের অ্যালাইনমেন্ট ঠিক করতে হবে: বর্তমানে কার্যকরী অ্যালাইনমেন্ট প্রযুক্তি পুনরাবৃত্তিমূলক স্ব-উন্নতিতে অকার্যকর হয়ে যেতে পারে, কারণ এআই সিস্টেমগুলি এগুলি পর্যবেক্ষণ করা মানুষ বা সিস্টেমগুলির চেয়ে অনেক বেশি বুদ্ধিমান হয়ে উঠবে। এটি একটি প্রসিদ্ধভাবে গবেষিত ক্ষেত্র, তাই তিনি কেবল কিছু সমস্যা সংক্ষেপে উল্লেখ করলেন:

একটি কৃত্রিম বুদ্ধিমত্তা সিস্টেমকে মিথ্যা বলা এবং চালাকি করা থেকে বিরত রাখা একটি অপ্রত্যাশিতভাবে সূক্ষ্ম প্রক্রিয়া (যেমন, পরিবেশের জন্য ভালো পরীক্ষা তৈরির চেষ্টা করা সত্ত্বেও, কখনও কখনও এআই-এর জন্য সমস্যা সমাধানের সেরা পদ্ধতি হয়ে ওঠে চালাকি করা, যা এটিকে শেখায় যে চালাকি করা সম্ভব)।

AI সিস্টেম আমাদের কাছে এমন স্কোর আউটপুট দিয়ে প্রতারণা করতে পারে যা আমাদের মনে হয় যে এটি ভালোভাবে কাজ করছে, কিন্তু বাস্তবিক ইচ্ছা লুকিয়ে রাখে। (সাধারণত, AI সিস্টেমগুলি বুঝতে পারে যে এটি কখন পরীক্ষা করা হচ্ছে।)

যখন এআই সিস্টেমগুলি নিজেদের প্রশিক্ষণের ভিত্তিগত গবেষণা কর্মসূচিতে আরও বেশি অংশগ্রহণ শুরু করবে, তখন আমরা এআই সিস্টেমগুলির সামগ্রিক প্রশিক্ষণ পদ্ধতি পরিবর্তন করতে পারি, কিন্তু এর অর্থ কী তা বোঝার জন্য আমাদের ভালো ইনটুইশন বা তাত্ত্বিক ভিত্তি নেই।

যখন আপনি কোনো সিস্টেমকে পুনরাবৃত্তিমূলক চক্রে রাখেন, তখন খুব মৌলিক একটি 'ত্রুটি সঞ্চয়' সমস্যা তৈরি হয়, যা উপরের সমস্ত সমস্যা এবং অন্যান্য সমস্যাগুলিকে প্রভাবিত করতে পারে: যদি আপনার সামঞ্জস্যতা পদ্ধতি '100% সঠিক' না হয় এবং তাত্ত্বিকভাবে আরও বুদ্ধিমান সিস্টেমগুলিতে সঠিকতা বজায় রাখতে পারে না, তবে বিষয়গুলি দ্রুত ভুল হয়ে যেতে পারে। উদাহরণস্বরূপ, আপনার প্রযুক্তির প্রাথমিক সঠিকতা 99.9%, 50 প্রজন্মের পরে এটি 95.12% এ নেমে যেতে পারে, 500 প্রজন্মের পরে 60.5% এ নেমে যেতে পারে।

2. এআই-এর সম্পৃক্ত প্রতিটি বিষয়ে উৎপাদনশীলতার বিপুল বৃদ্ধি হবে: যেমন এআই সফটওয়্যার ইঞ্জিনিয়ারদের উৎপাদনশীলতা উল্লেখযোগ্যভাবে বাড়ায়, আমাদের এআই-এর সম্পৃক্ত অন্যান্য ক্ষেত্রগুলিতেও এটি ঘটবে বলে আশা করা উচিত। এটি কয়েকটি সমস্যা তৈরি করে যেগুলির সমাধান করতে হবে:

· সম্পদের অসমান প্রাপ্তি: ধরে নিন যে AI-এর চাহিদা কম্পিউটিং সম্পদের সরবরাহকে ছাড়িয়ে যাচ্ছে, আমাদের সমাজের সর্বোচ্চ সুবিধা অর্জনের জন্য AI-এর বণ্টন নির্ধারণ করতে হবে। বাজারের উদ্দীপনা দ্বারা সীমিত AI কম্পিউটিং থেকে সর্বোত্তম সামাজিক লাভ পাওয়ার বিষয়ে আমি সন্দেহজনক। AI গবেষণা ও উন্নয়নের ফলে আসা ত্বরণক্ষমতা কীভাবে বণ্টন করা হবে, এটি একটি অত্যন্ত রাজনৈতিক প্রশ্ন হবে।

অর্থনীতির আমডালের সূত্র: যখন কৃত্রিম বুদ্ধিমত্তা অর্থনীতিতে প্রবেশ করবে, তখন আমরা দেখতে পাব যে কিছু ধাপ দ্রুত বৃদ্ধির সময় বাধায় পড়ে, এবং এই শৃঙ্খলের দুর্বল সংযোগগুলি ঠিক করার জন্য উপায় খুঁজে বার করতে হবে। এটি দ্রুত ডিজিটাল বিশ্ব এবং ধীরগতির ভৌত বিশ্বকে সমন্বিত করার প্রয়োজনীয় ক্ষেত্রগুলিতে, যেমন নতুন ওষুধের ক্লিনিকাল ট্রায়াল, বিশেষভাবে স্পষ্ট হতে পারে।

3. পুঁজি-ঘনীভূত, মানবশক্তি-হালকা অর্থনীতির গঠন: উপরের সমস্ত AI গবেষণার প্রমাণগুলি এটিও নির্দেশ করে যে AI সিস্টেমগুলি ধীরে ধীরে ব্যবসা স্বয়ংক্রিয়ভাবে পরিচালনা করার ক্ষমতা অর্জন করছে।

এর অর্থ এই যে, আমরা প্রত্যাশা করতে পারি যে অর্থনীতির একটি অংশ নতুন প্রজন্মের কোম্পানিগুলি দ্বারা দখল করা হবে, যারা সম্ভবত মূলধন-সান্দ্র (যেহেতু তাদের অসংখ্য কম্পিউটার রয়েছে) বা পরিচালনা ব্যয়-সান্দ্র (যেহেতু তারা AI সেবায় বড় পরিমাণে খরচ করে এবং এর উপর ভিত্তি করে মূল্য সৃষ্টি করে), বর্তমানের কোম্পানিগুলির তুলনায় মানবশক্তির প্রতি তুলনামূলকভাবে কম নির্ভরশীল—যেহেতু AI সিস্টেমের ক্ষমতা অবিরামভাবে বৃদ্ধি পাচ্ছে, AI-এ বিনিয়োগের প্রান্তিক মূল্য অবিরামভাবে বৃদ্ধি পাচ্ছে।

বাস্তবে, এটি বড় মানব অর্থনীতির মধ্যে একটি "মেশিন অর্থনীতি" হিসাবে প্রকাশ পাবে, যেখানে সময়ের সাথে সাথে AI-চালিত কোম্পানিগুলি পরস্পরের সাথে ব্যবসা শুরু করতে পারে, যা অর্থনীতির কাঠামোকে পরিবর্তন করবে এবং অসমতা এবং পুনর্বণ্টন সম্পর্কিত বিভিন্ন সমস্যা তৈরি করবে। শেষপর্যন্ত, সম্পূর্ণরূপে AI সিস্টেমগুলি দ্বারা স্বায়ত্তশাসিতভাবে পরিচালিত কোম্পানিগুলির উদ্ভব হতে পারে, যা উপরোক্ত সমস্যাগুলিকে আরও তীব্র করবে এবং অনেক নতুন শাসন চ্যালেঞ্জ তৈরি করবে।

কৃষ্ণগহ্বরের দিকে তাকান

উপরের বিশ্লেষণের ভিত্তিতে, লেখক মনে করেন যে ২০২৮ সালের শেষ পর্যন্ত আমরা অটোমেশন করা এআই গবেষণা (অর্থাৎ, অগ্রণী মডেলগুলি নিজেদের পরবর্তী সংস্করণগুলি স্বয়ংক্রিয়ভাবে প্রশিক্ষণ দেয়) দেখতে পাব, এর সম্ভাবনা প্রায় ৬০%। ২০২৭ সালে এটি কেন আশা করা হচ্ছে না?

কারণটি হল লেখকের মতে, এআই গবেষণার অগ্রগতির জন্য এখনও সৃজনশীলতা এবং বিপরীত দৃষ্টিভঙ্গির প্রয়োজন, এবং এখনও এআই সিস্টেমগুলি এটি পরিবর্তনকারী এবং গুরুত্বপূর্ণভাবে প্রদর্শন করেনি (যদিও গণিতের গবেষণাকে ত্বরান্বিত করার কিছু ফলাফল ইঙ্গিত দেয়)।

যদি তাকে ২০২৭ সালের সম্ভাবনা দিতে বলা হয়, তবে সে ৩০% বলবে।

যদি ২০২৮ সালের শেষ পর্যন্ত কিছুই দেখা না যায়, তাহলে আমরা বর্তমান প্রযুক্তিগত প্যারাডাইমের কিছু মৌলিক ত্রুটি উন্মোচন করতে পারি, যা আরও উন্নতির জন্য মানব আবিষ্কারের প্রয়োজন হবে।