CUSP বেঞ্চমার্ক প্রকাশ করেছে যে এআই মডেলগুলি বৈজ্ঞানিক পূর্বাভাসের ক্ষমতা হারিয়েছে
KuCoinFlash
শেয়ার
সারাংশ
AI এবং ক্রিপ্টো সংবাদ প্ল্যাটফর্মগুলি স্ট্যানফোর্ড, অক্সফোর্ড এবং অ্যালেন ইনস্টিটিউট ফর এআই দ্বারা বিকশিত একটি নতুন বেঞ্চমার্ক CUSP ট্র্যাক করছে। পরীক্ষাটি দেখায় যে GPT-5.4 এবং Claude Sonnet 4.5 এর মতো শীর্ষ মডেলগুলি বৈজ্ঞানিক অগ্রগতির পূর্বানুমান করতে সমস্যায় পড়ছে। সঠিকতা প্রায় র্যান্ডমের মতো, এবং সময়ের অনুমানগুলি মাসের পরিমাণে ভুল। CUSP ডেটাসেটে 4,760টি মাইলস্টোন এবং 17,429টি কাজ রয়েছে। নতুন টোকেন লিস্টিংগুলি প্রায়শই পূর্বানুমানমূলক মডেলের উপর নির্ভরশীল, কিন্তু এই অধ্যয়নটি তাদের বিশ্বস্ততা নিয়ে চিন্তার বিষয় তুলে ধরেছে।
ME AI সংবাদ, অনুসন্ধান বেটিং মনিটরিং-এর তথ্য অনুযায়ী, স্ট্যানফোর্ড বিশ্ববিদ্যালয়, অক্সফোর্ড বিশ্ববিদ্যালয় এবং অ্যালেন আইএআই ইনস্টিটিউট একসাথে CUSP নামক একটি সময়ক্রমভিত্তিক বেঞ্চমার্ক চালু করেছে, যা AI-এর বৈজ্ঞানিক অগ্রগতির ভবিষ্যদ্বাণীর ক্ষমতা মূল্যায়ন করে। এই মূল্যায়নে GPT-5.4, Claude Sonnet 4.5 এবং DeepSeek R1-এর মতো প্রগতিশীল বড় মডেলগুলির পরীক্ষা করা হয়েছে। ফলাফলগুলি দেখিয়েছে, বড় মডেলগুলি বিদ্যমান প্রযুক্তির পথগুলির মতো মেকানিজম-ভিত্তিক যুক্তির ক্ষেত্রে উত্তম পারফরম্যান্স দেখিয়েছে। তবে, নতুন আবিষ্কারগুলির বাস্তবায়নের সম্ভাবনা ভবিষ্যদ্বাণী করতে গিয়ে, তাদের সঠিকতা একটি র্যান্ডম অনুমানের কাছাকাছি। এছাড়াও, বৈজ্ঞানিক অগ্রগতির বিপ্লবের সময়কালের ভবিষ্যদ্বাণীতেও, বড় মডেলগুলির সিস্টেমেটিকভাবে দেরি দেখা গেছে।
প্রচলিত AI-এর মূল্যায়নের ক্ষেত্রে, তথ্যের লিকেজ খুবই সহজেই ঘটতে পারে। মডেলগুলি শুধুমাত্র প্রশিক্ষণের ডেটা-এর মধ্যেই প্রকাশিত বৈজ্ঞানিক অর্জনগুলির পুনরুচ্চারণই করতে পারে। প্রকৃতপক্ষে,ভবিষ্যদ্বাণীর ক্ষমতা পরীক্ষা করতে, CUSP-এ 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টि
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।