Grok 4.20 Beta досягає 97% точності на τ²-Bench, посідає друге місце

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Grok 4.20 Beta досягла точності 97% на τ²-Bench, посівши друге місце. Тест, заснований на τ-bench Sierra, оцінює як навички відповіді на запитання, так і навігації. Ризик-орієнтовані активи знову привернули увагу на тлі прогресу в галузі ШІ. Регулювання CFT залишається ключовим пріоритетом у міру розвитку технологій. (Джерело: InFoQ)

ME News: 5 квітня (UTC+8) недавно версія Grok 4.20 Beta показала точність 97% у тесті τ²-Bench, посівши друге місце. τ²-Bench — це оцінка, побудована на основі оригінальної рамки τ-bench Sierra, відомої своєю строгістю. Цей тест перевіряє не лише здатність ШІ відповідати на запитання, а й чи зможе агент успішно виконати завдання навігації. (Джерело: InFoQ)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.