source avatarEdu3Labs

共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy

AIにおける最大の未解決問題は、アライメントや幻覚ではないかもしれない。 それは評価だ。⚠️ まだ、モデルが本当に賢くなっているのか、それともベンチマークにだけ強くなっているのかを正確に測る方法がない。 グハートの法則: 「測定基準が目標になると、それはもはや良い測定基準ではなくなってしまう。」 ラボは以下を最適化している: ↳ MMLU ↳ HumanEval ↳ MATH モデルはこれらを完璧にこなす。🏆 しかし、現実世界の知性ははるかに複雑だ: ↳ 長期的な推論 ↳ 開放的なタスク ↳ 未経験の環境 ↳ 実際の人間とのやり取り 私たちは、ベンチマークによって進歩の錯覚に陥っている可能性がある。🧠 #AI #Edu3Labs

No.0 picture
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。