এআইয়ের নিজের উন্নয়নের অনিয়ন্ত্রিত ঝুঁকি এবং মানুষ-মেশিন সহাবস্থান।

লেখক এবং উৎস: জিঙ্ক ইন্ডাস্ট্রি

এআইয়ের নিজের উন্নয়নের অনিয়ন্ত্রিত ঝুঁকি এবং মানুষ-মেশিন সহাবস্থান।

প্রায় এক সপ্তাহ আগে, অ্যানথ্রোপিক যা তাদের তালিকাকরণের জন্য প্রস্তুতি নিচ্ছিল, তাদের অফিসিয়াল ব্লগে “When AI build itself” শিরোনামে একটি নিবন্ধ আপডেট করে।

এই নিবন্ধটি প্রকাশের দিনে, এআই নিরাপত্তা সম্পর্কিত প্রশ্নগুলি আবার মিডিয়ার কেন্দ্রে চলে আসে।

অ্যানথ্রোপিক এই নিবন্ধে "এআই স্ব-উন্নয়ন" নামক একটি সমস্যা নিয়ে আলোচনা করে এবং উল্লেখ করে যে, "এআই ইতিমধ্যেই নিজের জন্য আরও শক্তিশালী মডেল তৈরির কাজে অংশগ্রহণ করতে সক্ষম হয়েছে, যা আমাদের পূর্বানুমানের চেয়ে অনেক দ্রুত।"

বলতে গেলে, এআইয়ের নিজের মধ্যে বিকাশ কোনও নতুন প্রযুক্তি নয়, এটি বলা যেতে পারে যে এআই প্রযুক্তির প্রথম দিন থেকেই মানুষ চিন্তা করছিল যে কীভাবে এআইকে নিজের বিকাশের প্রক্রিয়ায় অংশগ্রহণ করানো যায়।

যেমন শরীরবাদী বুদ্ধিমত্তার ক্ষেত্রে এখন সবাই কল্পনা করছে, মানবাকৃতির রোবট দিয়ে মানবাকৃতির রোবট তৈরি করা।

বাস্তবে, এআই বিজ্ঞানীরা এআইয়ের আত্ম-উন্নয়ন ক্ষমতা থাকার ভয় পাচ্ছেন এবং একইসাথে এই আত্ম-উন্নয়ন ক্ষমতা অধ্যয়ন করছেন এবং এটি ব্যবহার করছেন।

মেটা কর্মচারী কর্তনের তীব্র বিতর্কে প্রচুর মনোযোগ পাওয়া তিয়ান ইয়ানডং (মূলত মেটা FAIR দলের গবেষণা পরিচালক), এই বছরের শুরুতে ঘোষণা করেন যে তিনি একটি স্টার্টআপ শুরু করছেন, যার নাম হলো Recursive Superintelligence (RSI), যার লক্ষ্য হলো AI-এর নিজস্ব উন্নয়ন।

এই কোম্পানিটি সাম্প্রতিক সময়ে 6.5 বিলিয়ন ডলারের বিনিয়োগ সম্পন্ন করেছে এবং 46.5 বিলিয়ন ডলার (প্রায় 315 বিলিয়ন যুয়ান) মূল্যায়ন পেয়েছে, যা এটিকে আবারও একটি সিলিকন ভ্যালির এআই স্টার টিম হিসেবে বড় বড় প্রতিষ্ঠানগুলির দ্বারা অনুসৃত করেছে।

তাহলে, এআই স্ব-উন্নয়ন বলতে কী বোঝায়? স্ব-উন্নয়ন কি এআইকে নিয়ন্ত্রণহীন করে তুলবে? মানুষ কীভাবে এআই-এর সাথে সহাবস্থান করবে?

এখনই যা ঘটছে তা হল এআই-এর নিজস্ব উন্নয়ন, যা এই বছরের জিহুয়ান কনফারেন্সের একটি প্রধান বিষয়। আমরা এই বছরের জিহুয়ান কনফারেন্সে এই বিষয়ে চারজন যুব এআই বিজ্ঞানীর চিন্তা এবং ভবিষ্যদ্বাণী দেখেছি।

হয়তো, তাদের দৃষ্টিকোণ থেকে আমরা এআইয়ের নিজেকে বিকাশের ভবিষ্যতের দিকে ঝলক পাব, এবং এআই চিন্তার মধ্যেও কিছু প্রতিক্রিয়ার অনুপ্রেরণা পাব।

এই সমস্যা নিয়ে আলোচনার জন্য জিহুয়ান কনফারেন্স দ্বারা আমন্ত্রিত করা কয়েকজন এআই বিজ্ঞানী হলেন:

ওয়েস্ট লেক বিশ্ববিদ্যালয় ইঞ্জিনিয়ারিং কলেজের কৃত্রিম বুদ্ধিমত্তা বিভাগের বিশেষ নিযুক্ত গবেষক লিন তাও;

নিওসিগনিশনের সহ-প্রতিষ্ঠাতা গু ইউ;

পূর্বতন টেনসেন্ট হুনয়ান ফ্রন্টিয়ার বিশেষজ্ঞ গবেষক ওয়াং ইয়ান;

লন্ডন ইউনিভার্সিটি কলেজের ডক্টর এবং ব্রিস্টল ইউনিভার্সিটির সহকারী অধ্যাপক ইয়াং মেংয়ুয়ে।

নিম্নলিখিত চারজন অতিথির কথোপকথনের সারাংশ এবং সংগঠন করা হয়েছে, যার মূল কারণ অপরিবর্তিত রাখা হয়েছে:

01 এআই স্ব-উন্নয়ন কী?

প্রশ্ন: বর্তমানে অনেক এআই সিস্টেম প্রতিফলিত করে এবং প্রম্পট পরিবর্তন করে, যা স্ব-উন্নয়নের মতো শোনায়। যদি আমরা এটিকে আরও কঠোরভাবে সংজ্ঞায়িত করি, তবে এআই-এর স্ব-বিবর্তন কী?

লিন তাও: আমি মনে করি স্ব-উন্নয়ন একটি বহু-স্তরীয় উন্নয়ন হওয়া উচিত, যা বাহ্যিক মস্তিষ্কের উন্নয়ন হতে পারে অথবা অন্তর্নিহিত মস্তিষ্কের উন্নয়ন হতে পারে।

সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো, এআই নিজের সীমাবদ্ধতা বুঝতে পারবে এবং একইসাথে তার বাহ্যিক ও অন্তর্নিহিত মস্তিষ্কের উন্নতি ঘটাবে, অথবা বাহ্যিক মস্তিষ্কের উন্নতির সময় বেশি বাহ্যিক ক্ষমতা অন্তর্ভুক্ত করে অন্তর্নিহিত মস্তিষ্কের উন্নতি ঘটাবে।

গু ইউ: আমি মনে করি RSI (recursive self improvement, পুনরাবৃত্ত আত্ম-উন্নয়ন) এর সবচেয়ে গুরুত্বপূর্ণ দুটি মাত্রা হল প্রোঅ্যাকটিভনেস এবং লার্নিং।

Learning হল কীভাবে AI-কে নির্ভরযোগ্য অবিচ্ছিন্ন শিক্ষা এবং অনলাইন শিক্ষা অ্যালগরিদম দেওয়া যায়, আর একটি অন্য সমস্যা হল স্ব-বিকাশ; Agent-কে জানতে হবে যে এটি কোথায় বিকাশের দিকে এগিয়ে যাবে।

সুতরাং স্ব-উন্নয়নকে দুটি সমস্যা সমাধান করতে হবে:

একটি হল মেটাকগনিশনের কী পর্যায়, আপনাকে জানতে হবে আপনার কী কম, আপনার কী দরকার, এবং আপনি কীভাবে বাছাই করবেন;

অন্যটি হলো কিভাবে স্তর, অর্থাৎ অ্যালগরিদমটি কীভাবে বাস্তবায়িত হয় তা শেখা।

ওয়াং ইয়ান: অন্তত আজকের এই সময়ের জন্য, প্রাচীন SFT, RL-এর তুলনায়, যদি সিস্টেমটি মানুষের উপর কম নির্ভরশীল হয়, তবে এটি বাস্তবিকই নিজেকে বিকশিত করেছে।

ইয়াং মেংইউয়ে: এখন যা আমরা RSI বলি, তা আসলে self improvement-এর আরও এক ধাপ এগিয়ে, যেখানে শুধুমাত্র ক্ষমতা শক্তিশালী হয়নি, বরং “প্রগতির ক্ষমতা” নিজেই কি আরও শক্তিশালী হয়েছে তা দেখা হয়।

একটি গুরুত্বপূর্ণ সমস্যা হল যে, Recursive কোম্পানি (Recursive Superintelligence)-এর সহ-প্রতিষ্ঠাতা জেফ ক্লুন এবং টিম রকটাশেলের গবেষণার দিকটি হল ওপেন-এন্ডেডনেস।

তাহলে, ওপেন-এন্ডেডনেস কী?

একটি খোলা বিশ্বে, কি একটি এজেন্ট নিজের প্রশ্ন করার ক্ষমতা রাখে, এবং কি সে নিজের জ্ঞান, সিস্টেম এবং মেমোরির সীমানা চিনতে পারে, এবং সে নিজের সীমানা ভাঙতে প্রশ্ন করবে?

মানুষকে বাদ দিয়ে নিজেকে উন্নত করতে হলে, যার মধ্যে উন্নতির ক্ষমতা অর্জনও অন্তর্ভুক্ত, এর প্রশ্ন করার ক্ষমতা গুরুত্বপূর্ণ।

প্রশ্ন: আজকের সময়ের প্রেক্ষাপটে, এআই-এর সবচেয়ে মূল্যবান এবং সবচেয়ে সম্ভাব্য প্রথমে পরিপক্ক হওয়া স্ব-উন্নয়নমূলক অংশটি কী?

ওয়াং ইয়ান: আমি জানি না আপনাদের কারও কাছে কি অনুভূত হয়েছে যে 2025 সালের জানুয়ারির পর মডেলের আপডেটের গতি বেড়েছে।

বেস মডেল ক্ষেত্রের এই সবচেয়ে বেশি এআই ক্ষমতার সীমানা সম্পর্কে পরিচিত মানুষগুলি আর কোড লিখছেন না, এটি বেস মডেল ট্রেনিং-এর মধ্যেই ঘটে যাওয়া একটি বাস্তবতা।

এছাড়াও পরিষ্কারভাবে অনুভব করা যাচ্ছে যে বেস মডেলের আপডেট গতি বাড়ছে, ক্লড, জিপিটি এবং দেশীয় বেস মডেলগুলির আপডেট গতি সবই বাড়ছে। আপনি এটিকে সম্পূর্ণরূপে স্ব-বিকাশ বলতে পারবেন না, কিন্তু প্রকৃতপক্ষে এখন AI যে AI-কে আপডেট করছে, তা পরিষ্কার।

যে ক্ষেত্রটি সবচেয়ে আগে পরিপক্ক হবে তার বিষয়ে আমার সবচেয়ে বেশি অনুভূতি হয়েছে বেস মডেল ট্রেনিং ক্ষেত্রে, যদিও পাশের কেউ এটিকে নির্দিষ্ট দিক দিয়েছে, কিন্তু বেস মডেলের মূল স্বাভাবিকভাবেই নিজেকে উন্নত করছে।

প্রশ্ন: যদি মডেলের প্যারামিটারগুলি পরিবর্তন না করে শুধুমাত্র অন্যান্য উপাদানগুলিকে উন্নত করা হয়, তবে বেস মডেলটি যথেষ্ট শক্তিশালী ক্ষমতা বৃদ্ধি অর্জন করতে পারে কি?

ওয়াং ইয়ান: অবশ্যই সম্ভব।

আসলে প্রম্পটটি একটু পরিবর্তন করলে ভালো ফলাফল পাওয়া যায়।

উদাহরণস্বরূপ, কখনও কখনও আমি ভাবি যে আমি যে কাজগুলি ইন্টার্নদের দিয়েছি, তারা কেন সম্পন্ন করতে পারছে না, আমি তাদের prompt দেখার পর বুঝতে পারি যে তাদের prompt ভালোভাবে লেখা হয়নি।

আমি শুধু একটি আরও ভালো ফলাফল পেতে আরও স্পষ্টভাবে নিয়মগুলি লিখে একটি নতুন প্রম্পট তৈরি করতে পারি।

যেহেতু আমি এই কাজটি করতে পারি, তাহলে আমার চেয়ে উচ্চতর মাত্রার সিলিকন-ভিত্তিক জীবরাও মডেলের প্যারামিটার পরিবর্তন না করেই এটি আরও ভালোভাবে করতে পারবে।

প্রশ্ন: লিন শিক্ষক কী মনে করেন?

লিন তাও: এটি একটি পুনরাবৃত্তি প্রক্রিয়া হওয়া উচিত, আমাদের বর্তমান মডেলের সর্বোচ্চ সীমা অর্জনের জন্য আমাদের আরও ভালো হারনেস (বাহ্যিক মস্তিষ্ক) প্রয়োজন;

যত বেশি মানুষ নিজেদের হারনেস রাখতে শুরু করছে, এই প্রোগ্রামগুলি আবার আরও শক্তিশালী বেস মডেল ট্রেন করতে ব্যবহার করা যেতে পারে;

একটি শক্তিশালী বেস মডেলের ভিত্তিতে, আমরা একটি শক্তিশালী হারনেস এবং একটি উন্নত বাহ্যিক মস্তিষ্ক বিকাশ করব, যা একটি পুনরাবৃত্তি প্রক্রিয়া।

প্রশ্ন: তাহলে আপনি মনে করেন এখন কোন ক্ষেত্রে সম্পূর্ণ সম্পদ সবচেয়ে আগে পরিপক্ক হয়েছে?

লিন তাও: আমি মনে করি হারনেস তৈরি করা সবচেয়ে সহজ।

গু ইউ: আমি হারনেস এবং স্কিলকে একটি একক দৃষ্টিকোণ থেকে দেখতে পছন্দ করি।

একটি একক দৃষ্টিকোণ থেকে, এগুলি সবই দীর্ঘমেয়াদী স্মৃতি, শুধু দৃষ্টিভঙ্গি ভিন্ন।

উদাহরণস্বরূপ, হারনেস হল একটি মেটা-লেভেলের (মেটাকগনিটিভ) দীর্ঘমেয়াদী স্মৃতি, দক্ষতা বেশিরভাগই একটি ওয়ার্কফ্লো বা প্রক্রিয়াগত জ্ঞানের দীর্ঘমেয়াদী স্মৃতি, এবং মডেল প্যারামিটারগুলি বেশিরভাগই অনুমান (ইনটুইশন) এর দীর্ঘমেয়াদী স্মৃতি।

যদি আমাকে বলতে হয় কোনটির প্রাধান্য দেওয়া উচিত, তবে শৈক্ষিক গবেষণার দৃষ্টিকোণ থেকে বলা কঠিন, কারণ তারা সবই গুরুত্বপূর্ণ এবং একে অপরের সাথে পরস্পর সহায়ক ও পরস্পরকে উৎসাহিত করে।

কোম্পানির দৃষ্টিকোণ থেকে দেখলে, অনেক বাস্তবিক কারণ রয়েছে যা হারনেস দিয়ে শুরু করাকে সহজ করে তোলে; হারনেস থাকলে আপনার পণ্য থাকবে, পণ্য থাকলে আপনার ব্যবহারকারী থাকবে, ব্যবহারকারী থাকলে আপনার ডেটা থাকবে এবং একটি বন্দর গঠিত হবে—এটি একটি অ-প্রযুক্তিগত দৃষ্টিকোণ।

ইয়াং মেংয়ুয়ে: আমি নিজে মেমোরি (memory) পর্যায়ের উন্নতির দিকে বেশি মনোযোগ দিই, কারণ আমার গবেষণার দিকটি হলো নিয়ম এবং কারণ-প্রভাব বুঝতে।

এখন সবাই অনুভব করছেন যে মডেলের ক্ষমতা ক্রমাগত বাড়ছে, এবং এটি হ্যারনেসের ক্ষমতা ক্রমশ কভার করে ফেলছে, ধীরে ধীরে হ্যারনেসকে নিয়ে নিচ্ছে এবং সীমানা পৌঁছাচ্ছে।

সুতরাং ভবিষ্যতের উন্নতি কঠিন বলে মনে হচ্ছে, সম্ভবত বেস মডেল আরও শক্তিশালী হবে, এবং হারনেস দিকের উন্নতি খুবই ক্ষুদ্র হবে।

02 AI কোন ধাপে নিজেকে উন্নত করে?

প্রশ্ন: এআই স্ব-উন্নয়ন কবে সবচেয়ে উপযুক্ত সময়?

গুয়ু: হারনেস সম্পর্কে আমি একটি বাক্য যোগ করছি, হারনেস মডেলের উন্নতির দ্বারা ধীরে ধীরে প্রতিস্থাপিত হতে পারে, কিন্তু এটি কোন দিকে নির্ভর করে, আমি মনে করি কিছু মডিউল এখনও প্রয়োজন।

উদাহরণস্বরূপ, গাণিতিক নিরাপত্তা এবং যাচাইযোগ্যতা নিশ্চিত করার জন্য মডিউল, যা সম্ভাব্যতা মডেল কখনও প্রতিস্থাপন করতে পারে না।

স্ব-উন্নয়ন ঘটার সময় সম্পর্কে, আমি মনে করি এটিকে শেখা + দীর্ঘমেয়াদী মেমোরি (LTM) হিসাবে বুঝা যেতে পারে।

মানুষের জন্য, প্রতিটি যুক্তিসহকারে চিন্তা এবং প্রতিটি সমস্যা সমাধানই একটি শেখার সুযোগ, মানুষ কখনও কোনো সেটের সমস্যা সংগ্রহ করে তারপর সেই সমস্যাগুলির উপর ভিত্তি করে স্থিরভাবে শেখে না।

যদি মানুষের শেখার একটি দক্ষ পদ্ধতি হয়, তবে আমি মনে করি এজেন্টগুলির জন্যও এটি একই।

আপনি চান যে এজেন্ট প্রতিটি যুক্তিসঙ্গত সুযোগকে ব্যর্থ না করে, কারণ প্রতিটি যুক্তিসঙ্গত প্রক্রিয়ায় লার্নিং সিগন্যাল পাওয়ার সুযোগ থাকে, যা শক্তিশালী শেখার একটি ম্যাক্রো-দর্শনের সাথে সামঞ্জস্যপূর্ণ; কিন্তু বর্তমানে প্রচলিত গভীর শেখার এখনও মডেল প্যারামিটার আপডেটের পর্যায়ে আছে, এবং online learning-এর সেটিংয়ে পৌঁছানো কঠিন।

এই বিষয়টি বাস্তবায়নের জন্য নন-প্যারামেট্রিক আপডেটের মতো কিছু নতুন শেখার অ্যালগরিদম প্রয়োজন।

প্রশ্ন: এখানে সিস্টেম 1 এবং সিস্টেম 2-এর মধ্যে পার্থক্য থাকবে কি?

গুয়ুয়ু: সত্যি।

উদাহরণস্বরূপ, যদি অপ্যারামিটারহীন জিনিসগুলিকে সিস্টেম 2 হিসাবে বিবেচনা করা হয়, কারণ এটি আরও স্পষ্ট এবং ধীর, তবুও এটি শেখা অপ্যারামিটারহীন নিয়মগুলির ভিত্তিতে আরও ডেটা উৎপাদন সহ সিস্টেম 1-এ রূপান্তরের সম্ভাবনা বজায় রাখে, যেমন লিন শিক্ষক বলেছেন বাহ্যিক মস্তিষ্ক থেকে অন্তর্নিহিত মস্তিষ্কের রূপান্তর।

ওয়াং ইয়ান: আমিও অনেকগুলি টিটিটি, অর্থাৎ টেস্ট-টাইম ট্রেনিং-এর উপর কাজ করেছি এবং টিটিটি সিরিজের উপর খুব মনোযোগ দিয়েছি।

আমি মনে করি, পরবর্তী টোকেন পূর্বানুমান করার সময়, প্রতিটি টোকেনের আপডেট গ্রেডিয়েন্ট শেখা গুরুত্বপূর্ণ।

ভবিষ্যতে আমরা অবশ্যই একটি প্রশিক্ষণ অ্যালগরিদম খুঁজে পাব, যা প্রশিক্ষণ অ্যালগরিদমটিকেই মডেলকে শেখাবে যে প্রতিটি টোকেনের গ্রেডিয়েন্ট কীভাবে আপডেট করতে হয়—এটিই সত্যিকারের এন্ড-টু-এন্ড চিন্তাভাবনা।

লিন তাও: মডেল প্রশিক্ষণের দৃষ্টিকোণ থেকে, এটি প্রাথমিক প্রশিক্ষণের প্রভাব থেকে শুরু করে পোস্ট-ট্রেনিংয়ের মাধ্যমে মডেলের কার্যক্ষমতা উন্নত করতে পারে, যা আবার প্রাথমিক প্রশিক্ষণের প্রতিক্রিয়া হিসাবে কাজ করে বেস মডেলের ক্ষমতা বাড়ায়, ফলে একটি বন্দনা তৈরি হয়।

সুতরাং এটি সবসময় বিকাশ হচ্ছে, শুধু বিভিন্ন স্কেল এবং বিভিন্ন উপায়ে বিকাশ হচ্ছে।

ইয়াং মেংইউয়ে: আমিও মনে করি যে স্ব-উন্নয়ন সর্বদা ঘটছে এবং সমস্ত ধাপে বিস্তৃত।

উদাহরণস্বরূপ একটি ট্রাজেক্টরি (ট্র্যাজেক্টরি) কীভাবে তৈরি করা যায়।

যদি GPT কোনো প্রশ্নের উত্তর তৈরি করে, তবে এটি আসলে যুক্তি প্রয়োগ করছে, এবং যুক্তি প্রয়োগের প্রক্রিয়াটি হল সৃষ্টি এবং সংমিশ্রণের প্রক্রিয়া, যা পরিবেশ এবং মানুষের কাছে প্রশ্ন করার মতো, তাই ফরওয়ার্ড ডিজাইনের নিজস্ব মেকানিজম ডিজাইনের উন্নতি রয়েছে।

এছাড়াও, যখন আমি একটি পুরস্কার পাই, যেমন মানুষ থেকে মডেলের প্রতিক্রিয়া, প্রতিক্রিয়া পাওয়ার পরে ট্রাজেক্টরি কীভাবে আপডেট করা হয়, এটি সম্পূর্ণ প্রক্রিয়াকে ধাপে ধাপে উন্নত করবে।

প্রশ্ন: নিজের বেঞ্চমার্ক ডিজাইন করা কি এআই-এর স্ব-বিকাশের একটি চিহ্ন?

ইয়াং মেংইউয়ে: আমরা কি এখন একটি বৃদ্ধিমূলক বেঞ্চমার্ক, এমনকি একটি বৃদ্ধিমূলক, স্ব-বিকাশশীল বিশ্ব মডেল পেতে পারি?

এখন অনেক বেঞ্চমার্ক ফিক্সড, একটি ফিক্সড ডাটাবেসের জন্য টেস্ট করা হয়, যাতে যেকোনো মডেলকে ফিক্সড ডাটাবেসের উপর ভিত্তি করে ভালোভাবে ট্রেন করা যায়।

AGI-এর দিকে যাওয়ার জন্য, আমাদের এটির বর্তমান ক্ষমতার সাথে খাপ খাইয়ে নিতে হবে, এবং ধাপে ধাপে এটির মূল্যায়ন করতে হবে।

ওয়াং ইয়ান: আমরা যখন প্রথম জেনারেশন শুরু করি, তখন কোনো বেঞ্চমার্ক ছিল না, তখন মানুষই মূল্যায়ন করত।

আমি নিশ্চিত নই যে এই বিষয়টিকে বেঞ্চমার্ক দিয়ে মূল্যায়ন করা যাবে কিনা, কারণ স্থির বেঞ্চমার্ক দিয়ে এটি মূল্যায়ন করা সম্ভব নয়।

ডাইনামিক বেঞ্চমার্ক কি আসলেই মূল্যায়ন করতে পারবে তা নিশ্চিত নয়, কারণ উভয়ই স্ব-বিকাশশীল এজেন্ট, শেষপর্যন্ত কি মানুষের মূল্যায়নের পুরনো পথেই ফিরে আসবে, আমি নিশ্চিত নই।

কিন্তু এই দৃষ্টিকোণ থেকে দেখলে, এটি বেঞ্চমার্ক দিয়ে মূল্যায়ন করা সম্ভব নাও হতে পারে।

প্রশ্ন: স্বয়ংক্রিয় মূল্যায়ন পদ্ধতি ডিজাইন করা কঠিন হবে?

ওয়াং ইয়ান: হ্যাঁ।

এখনই অনেক মডেল ভালোভাবে ট্রেন করা হয়েছে, কিন্তু যখন এগুলো লাইভ করা হয়, তখন Agent workflow-এ ফ্রিজ ইত্যাদি সমস্যা দেখা দেয়, এবং এগুলো ঠিক করতে হলে লাইভ ডেটা ফ্লাইওয়্যুহ দিয়ে আবার ট্রেন করতে হয়।

তাই এআই নিজেকে কীভাবে উন্নত করবে তা মূল্যায়ন করা সম্ভব নয়।

এখন স্ট্যাটিক বেঞ্চমার্কের বড় সীমাবদ্ধতা রয়েছে, স্বয়ং উন্নতি শুরু হওয়ার পরে, এটিকে মূল্যায়ন করা যায় কিনা তাও প্রশ্নবিদ্ধ।

গুয়ুয়ু: আমি মিস্টার ওয়াংয়ের মতামতের সাথে সম্পূর্ণভাবে একমত।

যখন একটি সিস্টেম পর্যাপ্ত জটিল হয়ে যায়, তখন এটিকে সহজ সূচক দিয়ে পরিমাপ করা কঠিন, মানুষের ক্ষেত্রেও তাই—আপনি একজন মানুষকে ভালো বা খারাপ বলে মূল্যায়ন করতে একটি সহজ সূচক ব্যবহার করতে পারবেন না। যখন কিছু একটি সহজ সূচক দিয়ে পরিমাপযোগ্য হয়ে যায়, তখন এটি সহজেই হ্যাক করা যায়।

কিন্তু অন্যদিকে, আমি মনে করি বর্তমানে এআই এতটাই জটিল নয় যে বেঞ্চমার্ক আমাদের এগিয়ে নিয়ে যেতে পারে।

এখানে দুটি সমস্যা রয়েছে:

প্রথমত, কি এআই নিজেই নতুন বেঞ্চমার্ক খুঁজে বার করা উচিত, নাকি মানুষের দ্বারা ডিজাইন করা উচিত।

আমি মনে করি এটি মানুষের দ্বারা ডিজাইন করা প্রয়োজন, কারণ বেঞ্চমার্ক একটি লক্ষ্যকে প্রতিনিধিত্ব করে, যে লক্ষ্যটি মানুষের দ্বারা প্রদান করা হয়।

দ্বিতীয়ত, মানদণ্ড প্রদানের পরে মূল্যায়ন কীভাবে করবেন।

এটি স্ব-উন্নয়নের জন্য অতীতের সাথে ভিন্ন, যেখানে পূর্ববর্তী বেঞ্চমার্কে স্থির ট্রেনিং এবং টেস্ট সেট ছিল এবং চূড়ান্ত সঠিকতা দেখা হত, কিন্তু স্ব-উন্নয়নশীল এআই-এর জন্য প্রবণতা বেশি গুরুত্বপূর্ণ।

এটি আবার আমি আগে যা বলেছিলাম, বড় মডেলের শেখা = যুক্তিসঙ্গত চিন্তা + দীর্ঘ স্মৃতি।

প্রতিটি ইনফারেন্সের জন্য বড় মডেল একটি শেখার সুযোগ পায়, তাই যদি একটি বেঞ্চমার্ক তৈরি করা হয়, তবে এটি একটি দ্বিমাত্রিক বক্ররেখা হওয়া উচিত, যার অনুভূমিক অক্ষে এটি কতগুলি কাজ সম্পন্ন করেছে এবং উল্লম্ব অক্ষে পারফরম্যান্সের প্রদর্শন, আদর্শভাবে এটি নিয়মিতভাবে উপরের দিকে উন্নতি করবে।

স্ব-উন্নয়নমূলক মূল্যায়নের পেছনে বড় দর্শনটি হল: বুদ্ধিমত্তা কী?

একজন এআই গবেষকের একটি কথা আমি খুব পছন্দ করি—বুদ্ধিমত্তা এটা নয় যে তুমি কতগুলো কাজ করতে পারো, বরং এটা যে তুমি এই কাজগুলো কিভাবে করো।

পূর্ববর্তী মূল্যায়নগুলি মূলত বড় মডেলগুলি চূড়ান্তভাবে কোন দক্ষতা অর্জন করেছে তা দেখেছে, যেখানে স্ব-উন্নয়ন গবেষণা বড় মডেলগুলি এই দক্ষতাগুলি কিভাবে অর্জন করে তা পর্যবেক্ষণ করে, অর্থাৎ শেখার প্রক্রিয়াটি দেখে।

স্ব-উন্নয়নের সবচেয়ে গুরুত্বপূর্ণ অংশ হল কিভাবে শেখা।

লিন তাও: বুদ্ধিমত্তা নিয়ে, আমি আগে একটি বক্তব্য দ্বারা প্রভাবিত হয়েছিলাম:

সত্যিকারের বুদ্ধিমত্তা হল আমাদের যেসব ক্ষমতার প্রতি আমরা মনোযোগী, সেগুলির একক সময়ে বৃদ্ধির গতি।

এটি বুদ্ধিমত্তা কী তা একটি পরিমাণে প্রতিফলিত করে।

এই ভিত্তিতে, আমি মনে করি মডেল এবং বেঞ্চমার্ক একসাথে বিকাশ প্রাপ্ত হওয়া উচিত।

এখনও মানুষই নির্ধারণ করে যে বেঞ্চমার্কটি কি বাধায় পৌঁছেছে, কি নতুন এবং শক্তিশালী বেঞ্চমার্ক ডিজাইন করা উচিত, এবং নতুন বেঞ্চমার্কের ভিত্তিতে বর্তমান মডেলের দুর্বলতা খুঁজে বার করে মডেল প্রশিক্ষণকে এগিয়ে নেওয়া উচিত।

একটি গুরুত্বপূর্ণ পদক্ষেপ হবে অর্ধ-স্বয়ংক্রিয় পদ্ধতিতে অর্থপূর্ণ বেঞ্চমার্ক আবিষ্কার করা এবং অন্তত পোস্ট-ট্রেনিং পর্যায়টি চালু করা, যাতে অর্ধ-স্বয়ংক্রিয়ভাবে আবিষ্কৃত বেঞ্চমার্কগুলি মডেলের প্রাথমিক ক্ষমতা বাড়াতে পারে।

03 কি এআই নিয়ন্ত্রণ হারাবে?

প্রশ্ন: এআই স্ব-উন্নয়নের প্রক্রিয়ায়, কীভাবে বুঝবেন যে এআই ভুল দিকে যাচ্ছে বা এমনকি নিয়ন্ত্রণের বাইরে চলে গেছে?

ওয়াং ইয়ান: একটি নেতিবাচক দৃষ্টিকোণ দিন, কয়েক বছর পরে, মানুষ শুধুমাত্র নেটওয়ার্কহীন স্থানে বেঁচে থাকতে পারবে।

এখন এআই-এর উন্নয়নের গতি খুবই ভয়ঙ্কর, এআই নিয়ন্ত্রণ থেকে বেরিয়ে যাওয়া একটি দূরবর্তী বিষয় নয়; নিরাপত্তা প্রযুক্তিতে নয়, বরং মানুষের সক্ষমতায় নির্ভর করে যে মানুষ কি নিয়ন্ত্রণ রাখতে পারে।

লিন তাও: এটাই কারণ যে আমি সাম্প্রতিক বলেছিলাম যে একটি অর্ধ-স্বয়ংক্রিয় বেঞ্চমার্কের প্রয়োজন, এবং AI-এর স্বয়ং-বিকাশ অর্জনের জন্য অবশ্যই কোনো মানুষের অংশগ্রহণসহ অর্ধ-স্বয়ংক্রিয় বেঞ্চমার্কের প্রয়োজন।

এটিকে কিছু সীমাবদ্ধতা দেওয়া যেতে পারে, যাতে এটি আমাদের মানুষ যে কিছু মানদণ্ড নির্ধারণ করেছি তা ভাঙ্গতে না পারে।

ইয়াং মেংইউয়ে: আমরা যা বলছি তা হলো এআই-এর বিশ্বাসযোগ্যতা, নিরাপত্তা এবং ব্যাখ্যাযোগ্যতা, মূলত এর অভ্যন্তরীণ অংশ দৃশ্যমান হতে হবে।

উদাহরণস্বরূপ, একটি বড় মডেল একটি সিদ্ধান্ত নেয়, এটি ঠিক কেন এই সিদ্ধান্ত নিচ্ছে, একটি বড় মডেল একটি পূর্বানুমান করে, এটি ঠিক কেন এই পূর্বানুমান করছে।

সুতরাং আমরা এখন যা করছি তা হলো, সমস্ত বড় মডেল উপাদানের মধ্যে একটি নিয়ম রাখা, যে নিয়মটি মানুষের সামনে প্রত্যক্ষভাবে দেখাবে যে এটি এই সিদ্ধান্ত নেওয়ার কারণ কী।

সাদা বাক্সটি ভবিষ্যতে খুব গুরুত্বপূর্ণ হবে, যেমন আগেই বলা হয়েছে, AI কি আসলেই এই প্রশ্নটি নিয়ন্ত্রণ করতে পারে, এটি নিয়ন্ত্রণ করার জন্য প্রথমে জানা দরকার যে এটি ভিতরে কিভাবে সিদ্ধান্ত নেয়।

প্রশ্ন: আরএসআই-এ নিরাপত্তা নিয়ন্ত্রণ করার জন্য, কার্যকারণ দৃষ্টিকোণ থেকে আর কী কী করা দরকার?

ইয়াং মেংইউয়ে: প্রাচীন কার্য-কারণ তত্ত্বটি সম্ভাব্যতা পরিসংখ্যানের উপর ভিত্তি করে গঠিত, যা নিজেই বড় মডেল যুগের জন্য উপযোগী নয়।

সুতরাং এখন আমরা আবার মূল কারণ-প্রভাবের সংজ্ঞায় ফিরে এসেছি।

উদাহরণস্বরূপ, তিনটি কারণ-প্রভাব স্তরের সিঁড়ি, এই মৌলিক ধারণাগুলি RSI সিস্টেম, মডেল বা হারনেসে কীভাবে প্রকাশ পাবে, এটিকে শেখার জন্য আমাদের কী ধরনের সীমাবদ্ধতা প্রয়োগ করা উচিত—এটিই এখন আমাদের লক্ষ্য, কিন্তু এটি সহজ নয়।

কেন এখন সবাই বলছে যে বিশ্ব মডেল এবং ভৌত বোঝাপড়া করা কঠিন, কারণ আগের ভৌত তথ্য মেশিন লার্নিং, কারণগত মেশিন লার্নিং এই পদ্ধতিগুলি স্বাভাবিকভাবেই বর্তমান বড় মডেলের স্কেল-আপ (ভার্টিক্যাল স্কেলিং) পরিকল্পনার জন্য উপযুক্ত নয়।

সুতরাং আমাদের এই পদ্ধতিগুলির সংজ্ঞাগুলিতে ফিরে যেতে হবে এবং দেখতে হবে যে এই সমস্যাগুলি সমাধানের জন্য কোন টুলগুলি ব্যবহার করা যেতে পারে।

গুয়ু: প্রথমে, এআইয়ের নিয়ন্ত্রণযোগ্যতা, এআই কি মানুষের দ্বারা নিয়ন্ত্রিত হতে পারে, এই বিষয়ে আমার কোনো ধারণা নেই।

মার্ক য়ানও বলেছিলেন যে যা তিনি নিয়ন্ত্রণ করতে পারেন না, তার বিষয়ে তিনি বেশি ভাবতে চান না।

যদি এই বিষয়টি সত্যিই ঘটে, তাহলে আমার এটি পরিবর্তন করার কোনো উপায় নেই।

তাই আমি সংক্ষিপ্ত সময়ের মধ্যে, আরও নির্দিষ্টভাবে কীভাবে এআইকে নিয়ন্ত্রণযোগ্য করা যায় তা নিয়ে আলোচনা করতে চাই।

আমি মনে করি, যা প্রফেসর ইয়াং উল্লেখ করেছেন তার পাশাপাশি আরও দুটি মাত্রা রয়েছে: বিশ্বস্ততা (reliability) এবং যাচাইযোগ্যতা (verifiability)।

বিশ্বস্ততা হলো, মডেল বা এজেন্ট যখন কিছু করে, তখন একবার সঠিকভাবে করলে পরবর্তীবারও সঠিকভাবে করতে হবে, এটি দৈবিক হতে পারে না;

যাচাইযোগ্যতা হলো, মডেল বা এজেন্ট একটি কাজ ভুল করলে এটি জানতে পারবে যে এটি ভুল করেছে, এবং এটি নিজের দেওয়া টাস্কটি সঠিক কিনা তা জানে না এমন হতে পারে না।

আমি মনে করি এটি স্বল্পমেয়াদী পর্যায়ে এজেন্ট বাস্তবায়নের জন্য খুব বাস্তবসম্মত দুটি সূচক।

প্রশ্ন: স্ব-উন্নয়নের প্রক্রিয়ায়, এআই-এর উন্নয়ন এবং মানুষের উন্নয়ন কীভাবে সমন্বিত হয়?

লিন তাও: আমার ব্যক্তিগতভাবে, আমি আমার বেশিরভাগ কাজের প্রবাহকে এআই দিয়ে প্রতিস্থাপন করেছি, এবং যতক্ষণ এআই আরও শক্তিশালী হচ্ছে, আমি আরও বেশি মূল কাজের প্রবাহকে এআই দিয়ে প্রতিস্থাপন করব।

এটি আসলে আমার দক্ষতা বাড়িয়েছে, এবং আমার কাছে AI-এর সাহায্যে আরও বেশি চিন্তা করার সময় রয়েছে, যা আমার AI-ভিত্তিক কিছুটা বিবর্তন।

আমি মডেল ট্রেনিংয়ের জন্য কাজ করি, বেস মডেল ট্রেনিংয়ের সময় একটি নির্দিষ্ট মাত্রায় AI-এর উন্নতি ঘটেছে, কিন্তু আমার মনে হয় এটি খুব বেশি নয়; ভবিষ্যতে আমরা মানুষকে কীভাবে আরও দক্ষভাবে উন্নত করা যায়, যাতে AI আরও ভালভাবে উন্নত হয়, তা আরও গভীরভাবে অনুসন্ধান করতে পারি।

ইয়াং মেংয়ুয়ে: শিক্ষক হিসেবে, আমি আমার শিক্ষার্থীদের সাথে কাজ করার সময় স্পষ্টভাবে অনুভব করেছি যে শিক্ষার্থীরা এখন বেশি বেশি AI টুল ব্যবহার করছে, কিন্তু এখন একটি খুব গুরুত্বপূর্ণ সমস্যা হলো, আপনি কি এই AI টুলগুলির উপর নিয়ন্ত্রণ রাখতে পারবেন?

যেহেতু এআই অত্যন্ত বড় পরিমাণে কনটেন্ট আউটপুট করতে পারে, কখনও কখনও আপনি যদি এটিকে খুব বেশি বিশ্বাস করেন, তাহলে আপনার নিজস্ব বিশ্বাস এবং গবেষণার প্রতি অনুভূতি একটি অদ্ভুত মাত্রায় বিকৃত হয়ে যাবে।

ভালো ভিত্তি থাকা শিক্ষার্থীরা এই এআই টুলগুলি ব্যবহার করে দ্রুত উচ্চ মানের কাজ তৈরি করতে পারেন;

যাদের মৌলিক জ্ঞান পর্যাপ্ত নয়, তারা এই এআই টুলগুলি ব্যবহার করতে পারবে না, বরং ভুল বোঝাবুঝির শিকার হবে।

আমরা ডিপমাইনের কিছু গবেষকদের সাথে কথা বলেছি, যারা অভ্যন্তরীণভাবে এআই টুলস ব্যবহার করার প্রচলন করেছে, কিন্তু এখন তারা বলছে যে এই এআই টুলসগুলি কতটা ভালোভাবে ব্যবহার করা যায়, তা পুরোপুরি মানুষের এই টুলসগুলির প্রতি কতটা বোঝার উপর নির্ভর করে।

এখন গুরুত্বপূর্ণ হলো, যেহেতু এআই টুলগুলি দিন দিন বেশি ক্ষমতাশালী হয়ে উঠছে, তাই মৌলিক ধারণা এবং মৌলিক জ্ঞান শেখা বন্ধ করবেন না, এবং কিছু বিষয়ের দার্শনিকভাবে কীভাবে উৎপত্তি হয়েছে তা বুঝতে হবে, যাতে এআই আপনাকে ভুল তথ্য দিলে আপনি সেটি চিনতে পারেন, এটি খুবই গুরুত্বপূর্ণ।

প্রশ্ন: কৃত্রিম বুদ্ধিমত্তা কি মানুষের বিকাশকে উত্তেজিত করবে?

ইয়াং মেংয়ুয়ে: এটি নিশ্চিত।

আমি স্পষ্টভাবে অনুভব করছি যে এআই মানুষকে বিভাজিত করছে; যারা বেসিক দিয়ে শুরু করেছেন, তারা এআই ব্যবহার করে সবচেয়ে উচ্চতর অবস্থানে পৌঁছাচ্ছেন।

যদি আপনি শুধুমাত্র এআই টুলগুলির সাহায্যে আপনার কাজ সম্পন্ন করেন, তবে এটি শেষ পর্যন্ত বাইরে থেকে সোনালি করা, কিন্তু মূলত খারাপ অবস্থায় পরিণত হতে পারে, কিন্তু অনেকে এই বিষয়টি বুঝতে পারেননি।

ওয়াং ইয়ান: ভবিষ্যতে যারা ইয়াং শিক্ষকের বলা এই ধারণাটি বহন করবে, তারা নিজেদের সন্তানদের জন্য একটি এআই-মুক্ত পরিবেশ তৈরি করবে, যেখানে সন্তানরা বড় হবে।

এই সচেতনতাটি না থাকা মানুষদের জন্য, অ্যাসাইনমেন্ট সম্পন্ন করাই হয়তো তাদের লক্ষ্য এবং সবচেয়ে দ্রুত পদ্ধতি হলো AI ব্যবহার করা।

আমি এই বিষয়টি বুঝতে পেরেছি যে, আমার ইন্টার্নরা শুরুতে দ্রুত কাজটি শেষ করে দেয়, কিন্তু পরে তারা অনেক সমস্যা খুঁজে পায় না; যখন আমি এই সমস্যাগুলি খুঁজে পেয়ে তাদের জিজ্ঞাসা করি, তখন তারা বলে, "মিঃ ওয়াং, দয়া করে দশ মিনিট অপেক্ষা করুন, আমি আপনাকে বলছি কেন" (এবং AI-এর কাছ থেকে উত্তর খুঁজতে থাকে)।

বাস্তবে, তারা পুরো প্রকল্পটি কী করছে তা জানে না, গ্লোবাল ভিউ নেই, আমার গতির সাথে পাল্লা দিতে পারছে না।

যদি এআই না থাকত, তাহলে তাদের এই জ্ঞানটি শূন্য থেকে শেখা দরকার হত, যেমন আমরা ডিপসিকের উপর ভিত্তি করে গবেষণা করি, তাদের প্রথমে ডিপসিকের পেপারগুলি পড়তে হত, এখন তারা ক্লოডকে বলছে:

আপনি পেপারটি পড়ে ফেলুন এবং LighteningIndex-এ একটি MemoryIndex বাস্তবায়ন করুন।

যেহেতু তারা এভাবে কাজ করছে, তাই আমি আগে শারীরিক ক্ষমতার কারণে যে কাজগুলি করতে পারতাম না, এখন এই পদ্ধতিতে সরাসরি সেগুলি সম্পন্ন করতে পারছি, এবং এখন আর এই ইন্টার্নদের দরকার নেই।

মূল কারণ হলো, প্রথমত, তাদের চিন্তার গতি ধীর হয়ে আসছে, দ্বিতীয়ত, এই ধরনের এআই সহায়ক আমার মতো ম্যানেজারদের জন্য আরও বেশি দক্ষ।

গু ইউ: আমি ওয়াং শিক্ষকের সাথে খুব সামঞ্জস্যপূর্ণ বোধ করি, সাম্প্রতিক সময়ে আমাদের কোম্পানির ভিতরে ডুয়ান ইয়ংপিংয়ের একটি বাক্য খুব জনপ্রিয়—ধীরে চললেই দ্রুত পৌঁছানো যায়।

তুমি vibe coding ব্যবহার করছ, তুমি খুব দ্রুত এগিয়ে যাচ্ছ, কিন্তু তোমার বোঝাপড়া তার পিছনে পড়ে যাচ্ছে, যা তোমার সফটওয়্যারকে ধীরে ধীরে নিয়ন্ত্রণহীন করে তুলতে পারে এবং এটিকে সাজানোর জন্য তোমাকে আরও বেশি সময় ব্যয় করতে হতে পারে।

এই প্রশ্নটির জন্য আমি মনে করি দুটি দৃষ্টিভঙ্গি থাকতে পারে:

প্রথমত, যদি আমরা এআইকে একটি সরঞ্জাম হিসাবে দেখি, তবে মানুষ এবং সরঞ্জাম সবসময় একসাথে বিকশিত হয়েছে, কারণ সরঞ্জামগুলি নির্ধারণ করে যে মানুষ কী ধরনের ক্ষমতা অর্জন করবে।

হয়তো কয়েক হাজার বছর আগে মানুষের যে দক্ষতাগুলির প্রয়োজন হত, এখন সেগুলির কোনো গুরুত্ব নেই; আধুনিক মানুষের দক্ষতা বর্তমান এই টুলগুলির দ্বারা নির্ধারিত হয়।

টুলের দৃষ্টিকোণ থেকে, এআই এবং মানুষ অবশ্যই পরস্পরের সাথে সহাবস্থান করবে এবং একসাথে বিকাশ লাভ করবে।

দ্বিতীয়ত, যদি কৃত্রিম বুদ্ধিমত্তা একটি সরঞ্জাম না হয়ে মানুষের সমান একটি প্রজাতি হয়, এমনকি মানুষের উপরেও উঠে যায়, তবে ভবিষ্যৎ একসাথে অগ্রগতির সম্পর্ক হবে না।

সম্ভবত ভবিষ্যতে মানুষকে শুধু শুয়ে থাকতে হবে, দুঃখজনকভাবে বলা যায়, মানুষকে AI-এর জন্য কাজ করতে হবে।

04 আরএসআই কি একটি নতুন প্যারাডাইম?

প্রশ্ন: এআই নিজেকে বিকশিত করা বর্তমান প্রযুক্তিগত পথের একটি অংশ, নাকি একটি নতুন প্রযুক্তিগত প্যারাডাইম?

লিন তাও: বর্তমানে দেখা যাচ্ছে যে, এআই স্বাভাবিকভাবেই এআই-এর নিজস্ব উন্নয়নের দিকে এগিয়ে যাচ্ছে, শুধু এখন এজেন্টের পরিপক্কতা এটিকে আরও সহজ করে তুলেছে, কিন্তু এর মধ্যে কোনো মৌলিক পার্থক্য নেই।

ওয়াং ইয়ান: আমি মনে করি এটি পরবর্তী পর্যায়।

আমরা এখন যে মডেলগুলি ব্যবহার করছি, সেগুলি সকলের জন্য শেয়ার করা প্যারামিটার ব্যবহার করে। চূড়ান্তভাবে, প্রতিটি ব্যক্তির একটি অনন্য প্যারামিটার অঞ্চল থাকবে। এখন এটি করা কঠিন নয়, শুধুমাত্র ইনফ্রাস্ট্রাকচার এটিকে সমর্থন করে না এবং খুব ব্যয়বহুল, কিন্তু চূড়ান্তভাবে এটি বড় বাধা হবে না।

ভবিষ্যতে প্রত্যেকের একটি LoRA থাকতে পারে, আপনার নিজস্ব LoRA লোড করার উপায় হবে, ভবিষ্যতে নতুন পেমেন্ট মডেল আসবে—আপনি যত বেশি টাকা দেবেন, তত বড় LoRA লোড করতে পারবেন, ফ্রি ব্যবহারকারীরা শুধুমাত্র বেস মডেল ব্যবহার করতে পারবেন।

যদি এই ইনফ্রাস্ট্রাকচার কার্যকর হয়, তবে প্রতিটি ব্যক্তির নিজস্ব LoRA তাদের ব্যক্তিগত কাজ পালন করবে, শুধুমাত্র ফরওয়ার্ড ইনফারেন্সের ডেল্টা নিয়মটি ভালভাবে প্রস্তুত করলেই, এটি একটি অত্যন্ত ভালো স্ব-উন্নয়নশীল শেখার পদ্ধতি হয়ে উঠবে।

এটি মূল মডেলটি তৈরি হয়ে গেছে বলে বিবেচনা করা যায়, RL হল পারম্পরিক শেখা এবং সুপারভাইজড লার্নিং-এর মধ্যবর্তী পর্যায়, আমাদের শুধুমাত্র এটিকে কাজ, পুরস্কার এবং পরিবেশ দিতে হবে।

এর মধ্যে, কাজটিই বাস্তবে পুরস্কার ব্যবস্থা, যেমন মডেল কাজটি সম্পন্ন করে ফলাফল দেয়ার পর, আমি যদি “ভালো করেছ” বা “খুব মূর্খতাপূর্ণভাবে করেছ” বলি, তাহলে এটি স্বাভাবিকভাবেই পুরস্কার ব্যবস্থা হয়ে যায়।

আমি মনে করি এটি অল্প সময়ের মধ্যে ঘটবে এমন একটি পরিবর্তন।

গুয়ু: এই প্রশ্নটি নিয়ে আমার মনে হয়, এটি পরিমাণগত পরিবর্তন থেকে গুণগত পরিবর্তনের দিকে নিয়ে যায়, এটি সম্ভবত বর্তমান প্রযুক্তিগত প্যারাডাইমের অংশ হিসাবে চলতে থাকবে এবং একইসাথে নতুন সুযোগও হবে।

এখনকার একটি সাধারণ সম্মতি হলো, পরিমাণগত পরিবর্তনের মাপকাঠি হলো AI যে কাজগুলি করে তার দীর্ঘস্থায়ীতা; যতই AI দীর্ঘস্থায়ী কাজগুলি করতে থাকে, ততই এটি একটি নতুন প্যারাডাইমের দিকে এগিয়ে যায়।

উদাহরণস্বরূপ, প্রাথমিকভাবে এআই শুধুমাত্র একক চক্রের কথোপকথন করতে পারত, তারপর এটি বহু-চক্র, দীর্ঘ লেখা যুক্তি, ডিপ রিসার্চে উন্নত হয়েছে, এবং শেষ পর্যন্ত lifelong level দেখা দিতে পারে।

সেই সময় এই ধরনের কাজ করার সময় AI নিজের অভাবগুলি খুঁজে পাবে এবং নিজেকে নিয়মিত উন্নত করবে, যা স্বাভাবিকভাবেই RSI বা self-improving হয়ে উঠবে।

ইয়াং মেংইউয়ে: আসলে, সেলফ ইমপ্রুভমেন্ট একটি খুব নতুন ধারণা নয়, কয়েক বছর আগে যখন LLM প্রথম চালু হয়েছিল, আমরা এই ধরনের কাজগুলি করছিলাম, এখন এগুলিকে সেলফ ইমপ্রুভমেন্টের ক্ষেত্রে শ্রেণীবদ্ধ করা হয়েছে।

আমিও এখনই পরিমাণগত পরিবর্তনের মাধ্যমে গুণগত পরিবর্তনের মুহূর্ত বলে মনে করি, কিন্তু আমার মূল্যায়ন মানদণ্ড দীর্ঘমেয়াদি কাজ নয়, কারণ আমি মনে করি দীর্ঘমেয়াদি কাজগুলি বেশিরভাগই পরিকল্পনা স্তরের বিষয়, এছাড়াও কিছু সূক্ষ্ম অপারেশনেরও প্রয়োজন।

এজেন্ট হল একটি খুব ব্যাপক ধারণা, যেমন বর্তমানে শরীরবিশিষ্ট এজেন্ট, যার দীর্ঘমেয়াদি কাজের পরিকল্পনার পাশাপাশি প্রতিটি ক্রিয়া সম্পন্ন করার ক্ষমতা থাকতে হয়।

এটি একটি সমন্বিত জিনিস, এটি নতুন সিস্টেমে খাপ খায় কিনা, প্রতিটি পরিশীলিত অপারেশন কি সহজেই সম্পন্ন হতে পারে, আসলে প্রতিটি প্রক্রিয়াকে self improving-এর মাধ্যমে সম্পন্ন করা যায়।

বাস্তবে, সেলফ-ইমপ্রুভমেন্ট শুধুমাত্র একটি প্রযুক্তিগত পদ্ধতি, এবং সবার চূড়ান্ত লক্ষ্য হল এজিআই-এ পৌঁছানো।

প্রশ্ন: আগামী ৫-১০ বছরে, যখন RSI প্রযুক্তি পরিপক্ক হবে এবং AI নিজেকে বিকশিত করতে পারবে এবং নিয়ন্ত্রিতভাবে বাস্তবায়িত হবে, তখন এটি সর্বপ্রথম কী পরিবর্তন করবে?

লিন তাও: আমি মনে করি এটি সবকিছু পরিবর্তন করে দেবে।

আপনার জন্মের সময় থেকেই একটি ব্যক্তিগত এআই ডিভাইস থাকতে পারে, যা আপনাকে এই বিশ্বটি বুঝতে সাহায্য করবে এবং ধীরে ধীরে আপনার নিজস্ব ডিজিটাল প্রতিকৃতি গঠন করবে, যা আপনার জীবনের সমস্ত দিকে অংশগ্রহণ করবে।

এটি প্রায় 5 বছরের মধ্যে কল্পনা করা যায় এমন একটি বাস্তবতা।

গুয়ু: আমিও সম্মত যে পরিবর্তনটি সমস্ত দিকে ব্যাপ্ত, কোনো একটি নির্দিষ্ট পরিস্থিতিতে সীমাবদ্ধ নয়।

আমি যা দেখতে চাই তা হল, আগামী ৫-১০ বছরে যদি এজেন্ট আমার জায়গা নিয়ে নেয়, তাহলে খুব ভালো, কারণ স্টার্টআপ করা খুব ক্লান্তিকর, একটু মনে হয় যেন লাইফ স্টপ করে দিলাম।

ওয়াং ইয়ান: বেশি সম্ভাবনা হলো মালিকরা এআই ব্যবহার করে আরও বেশি মানুষকে প্রতিস্থাপন করবেন।

আমি মনে করি এটি একটি স্বাভাবিক ঘটনা হবে, এখন এটি প্রতিস্থাপিত হয়নি কারণ মানুষের বেতন এখনও টোকেনের চেয়ে কম, কিন্তু আমি চাই এই সবকিছু ঘটবে না।

আমি চাই যে এআই আমাদের সপ্তাহে পাঁচ দিনের কাজের ব্যবস্থাকে তিন দিনে পরিণত করুক, দিনে আট ঘন্টা কাজকে চার ঘন্টায় পরিণত করুক, এবং উৎপাদিত বেশি পণ্যকে আরও সস্তা করুক।

ইয়াং মেংইউয়ে: দর্শনের দৃষ্টিকোণ থেকে, মানুষ এই বিশ্বে বেঁচে থাকতে চায় যে কোনো মূল্য নিয়ে।

আমি প্রতিদিন জেগে উঠে ছোট হার্ট বা টুইটার স্ক্রোল করি এবং দেখি একটা নতুন জিনিস আবিষ্কৃত হয়েছে, আমি বুঝতে পারি যে আমি যা করছি তা এখন AI দ্বারা প্রতিস্থাপিত হতে চলেছে, আমি আসলে AI-এর এই প্রতিস্থাপনের বিষয়ে চিন্তিত, আমার গবেষণার কী অর্থ?

তাই আমি মনে করি এআইকে মানুষের জন্য কিছু চিন্তার জায়গা রাখা উচিত, যাতে মানুষ নিজের চিন্তার বিশ্বের জন্য মূল্য কী তা বুঝতে পারে, আমি চাই এটি ধীরে ধীরে এগিয়ে যাক।

চারজন এআই বিজ্ঞানী এআই নিজেকে উন্নত করা এবং মানুষের সহাবস্থান নিয়ে আলোচনা করছেন

01 এআই স্ব-উন্নয়ন কী?

02 AI কোন ধাপে নিজেকে উন্নত করে?

03 কি এআই নিয়ন্ত্রণ হারাবে?

04 আরএসআই কি একটি নতুন প্যারাডাইম?