Согласно наблюдениям Beating, разработчик Райан Шиа запустил новую платформу AI IQ (aiiq.org), которая размещает все передовые крупные модели на кривой нормального распределения человеческого IQ и с помощью одного числа наглядно отвечает на вопрос: «Насколько умна эта модель?». По данным на официальном сайте, среди ключевых протестированных моделей: • GPT-5.5: 136 баллов (на первом месте) • Claude Opus 4.7 и Gemini 3.1 Pro: по 132 балла (разделяют второе место) • Grok 4.3: 125 баллов • Kimi K2.6: 122 балла • DeepSeek V4 Pro и Muse Spark: по 117 баллов (разделяют пятое место) • Qwen3.6: 108 баллов Алгоритм платформы извлекает исходные оценки по 12 стандартным тестам из открытых рейтингов, преобразует их с помощью откалиброванной кривой сложности в скрытый IQ и вычисляет среднее значение по четырем измерениям: абстрактное рассуждение, математическое рассуждение, программирование и академическое рассуждение. Отсутствующие данные в отдельных измерениях заполняются консервативно, и модель не становится умнее только потому, что прошла меньше тестов. Поскольку все базовые данные получены из существующих тестов, AI IQ не проводит новых испытаний — его основная ценность заключается в том, чтобы перевести разрозненные результаты в шкалу, понятную обычному пользователю. Помимо общего рейтинга IQ, сайт предлагает несколько перекрестных представлений. Пользователи могут наглядно отфильтровать соотношение «IQ к стоимости» на графике «IQ против затрат» или проследить темпы развития моделей разных компаний на «временной шкале передовых IQ». Кроме того, платформа добавила показатель эмоционального интеллекта (EQ), полученный по тесту EQ-Bench, чтобы оценить, насколько хорошо модель умеет «хорошо говорить».
Новая платформа AI IQ присвоила GPT-5.5 результат 136 по шкале человеческого IQ
MarsBitПоделиться






Сайт новостей об ИИ и криптовалюте MarsBit сообщает, что Райан Шиа запустил AI IQ (aiiq.org) — платформу, ранжирующую модели ИИ по шкале человеческого IQ. GPT-5.5 лидирует с результатом 136, за ним следуют Claude Opus 4.7 и Gemini 3.1 Pro с результатом 132. Платформа конвертирует результаты тестов в метрики, подобные IQ, по четырем направлениям: абстрактное мышление, математика, программирование и академическое рассуждение. Она также предоставляет перекрестные графики, включая IQ против стоимости и EQ для качества диалога. Ончейн-новости и развитие ИИ продолжают формировать ландшафт токен-проектов.
Источник:Показать оригинал
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации.
Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.