ربما لا تكون أكبر مشكلة غير محلولة في الذكاء الاصطناعي هي التوافق أو التوهّم. بل هي التقييم. ⚠️ ما زلنا لا نمتلك طرقًا موثوقة لقياس ما إذا كانت النماذج تصبح حقًا أكثر ذكاءً — أم أنها تتحسن فقط في المعايير المرجعية. قانون جودهارت: "عندما يصبح المقياس هدفًا، يتوقف عن كونه مقياسًا جيدًا." تُحسّن المختبرات الأداء بالنسبة لـ: ↳ MMLU ↳ HumanEval ↳ MATH وتُتقن النماذج هذه المعايير. 🏆 لكن الذكاء في العالم الحقيقي أكثر تعقيدًا: ↳ التفكير على المدى الطويل ↳ المهام المفتوحة ↳ البيئات غير المعروفة ↳ التفاعل البشري الحقيقي قد نكون نقيّم أنفسنا نحو شعور زائف بالتقدم. 🧠 #AI #Edu3Labs

مشاركة







المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.