CUSP বেঞ্চমার্ক প্রকাশ করেছে যে এআই মডেলগুলি বৈজ্ঞানিক পূর্বাভাসের ক্ষমতা হারিয়েছে

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
AI এবং ক্রিপ্টো সংবাদ প্ল্যাটফর্মগুলি স্ট্যানফোর্ড, অক্সফোর্ড এবং অ্যালেন ইনস্টিটিউট ফর এআই দ্বারা বিকশিত একটি নতুন বেঞ্চমার্ক CUSP ট্র্যাক করছে। পরীক্ষাটি দেখায় যে GPT-5.4 এবং Claude Sonnet 4.5 এর মতো শীর্ষ মডেলগুলি বৈজ্ঞানিক অগ্রগতির পূর্বানুমান করতে সমস্যায় পড়ছে। সঠিকতা প্রায় র‍্যান্ডমের মতো, এবং সময়ের অনুমানগুলি মাসের পরিমাণে ভুল। CUSP ডেটাসেটে 4,760টি মাইলস্টোন এবং 17,429টি কাজ রয়েছে। নতুন টোকেন লিস্টিংগুলি প্রায়শই পূর্বানুমানমূলক মডেলের উপর নির্ভরশীল, কিন্তু এই অধ্যয়নটি তাদের বিশ্বস্ততা নিয়ে চিন্তার বিষয় তুলে ধরেছে।
ME AI সংবাদ, অনুসন্ধান বেটিং মনিটরিং-এর তথ্য অনুযায়ী, স্ট্যানফোর্ড বিশ্ববিদ্যালয়, অক্সফোর্ড বিশ্ববিদ্যালয় এবং অ্যালেন আইএআই ইনস্টিটিউট একসাথে CUSP নামক একটি সময়ক্রমভিত্তিক বেঞ্চমার্ক চালু করেছে, যা AI-এর বৈজ্ঞানিক অগ্রগতির ভবিষ্যদ্বাণীর ক্ষমতা মূল্যায়ন করে। এই মূল্যায়নে GPT-5.4, Claude Sonnet 4.5 এবং DeepSeek R1-এর মতো প্রগতিশীল বড় মডেলগুলির পরীক্ষা করা হয়েছে। ফলাফলগুলি দেখিয়েছে, বড় মডেলগুলি বিদ্যমান প্রযুক্তির পথগুলির মতো মেকানিজম-ভিত্তিক যুক্তির ক্ষেত্রে উত্তম পারফরম্যান্স দেখিয়েছে। তবে, নতুন আবিষ্কারগুলির বাস্তবায়নের সম্ভাবনা ভবিষ্যদ্বাণী করতে গিয়ে, তাদের সঠিকতা একটি র‍্যান্ডম অনুমানের কাছাকাছি। এছাড়াও, বৈজ্ঞানিক অগ্রগতির বিপ্লবের সময়কালের ভবিষ্যদ্বাণীতেও, বড় মডেলগুলির সিস্টেমেটিকভাবে দেরি দেখা গেছে। প্রচলিত AI-এর মূল্যায়নের ক্ষেত্রে, তথ্যের লিকেজ খুবই সহজেই ঘটতে পারে। মডেলগুলি শুধুমাত্র প্রশিক্ষণের ডেটা-এর মধ্যেই প্রকাশিত বৈজ্ঞানিক অর্জনগুলির পুনরুচ্চারণই করতে পারে। প্রকৃতপক্ষে,ভবিষ্যদ্বাণীর ক্ষমতা পরীক্ষা করতে, CUSP-এ 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টি 1টि
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।