source avatarEdu3Labs

Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy

Самая большая нерешённая проблема в ИИ, возможно, не в согласовании или галлюцинациях. А в оценке. ⚠️ Мы до сих пор не имеем надёжных способов измерить, действительно ли модели становятся умнее — или просто лучше справляются с тестами. Закон Гардта: «Когда показатель становится целью, он перестаёт быть хорошим показателем». Лаборатории оптимизируют под: ↳ MMLU ↳ HumanEval ↳ MATH Модели без труда справляются с ними. 🏆 Но реальный интеллект гораздо сложнее: ↳ Долгосрочное рассуждение ↳ Открытые задачи ↳ Незнакомые среды ↳ Реальное взаимодействие с людьми Мы можем оценивать себя так, что создаём ложное ощущение прогресса. 🧠 #AI #Edu3Labs

No.0 picture
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.