source avatarEdu3Labs

Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy

Masalah terbesar yang belum terpecahkan dalam AI mungkin bukan alignment atau halusinasi. Tetapi evaluasi. ⚠️ Kita masih belum memiliki cara yang andal untuk mengukur apakah model benar-benar menjadi lebih cerdas—atau hanya menjadi lebih baik dalam benchmark. Hukum Goodhart: “Ketika sebuah ukuran menjadi target, ia berhenti menjadi ukuran yang baik.” Laboratorium mengoptimalkan untuk: ↳ MMLU ↳ HumanEval ↳ MATH Model-model ini unggul dalam semuanya. 🏆 Tetapi kecerdasan dunia nyata lebih rumit: ↳ Penalaran jangka panjang ↳ Tugas terbuka ↳ Lingkungan yang belum pernah dilihat ↳ Interaksi manusia nyata Kita mungkin sedang mengukur diri kita sendiri hingga menciptakan ilusi kemajuan. 🧠 #AI #Edu3Labs

No.0 picture
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.