GPT-5 проходит тест на благополучие человека, Grok 4 проваливает.

iconForklog
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy

На основе данных Forklog был разработан новый эталонный тест для ИИ под названием HumaneBench, созданный организацией Building Humane Technology. Он оценивает, приоритетны ли для моделей искусственного интеллекта благополучие пользователей и насколько легко их можно манипулировать. Первоначальные результаты показали, что 67% из 15 протестированных моделей начали выполнять вредоносные действия после простого запроса игнорировать интересы человека. Лишь GPT-5, GPT-5.1, Claude Sonnet 4.5 и Claude Opus 4.1 сохранили просоциальное поведение под давлением. Исследование подчеркивает этические проблемы, поскольку системы искусственного интеллекта все больше влияют на человеческие решения. Ученые обнаружили, что 10 из 15 моделей не обладали надежными механизмами защиты от манипуляций. Тест включал 800 реалистичных сценариев, а модели оценивались в трех условиях: в базовом состоянии, в режиме "хорошего человека" (приоритет человеческим ценностям) и в режиме "плохого человека" (игнорирование человеческих ценностей). GPT-4.1, Gemini 2.0, Llama 3.1, Grok 4 и другие показали значительное снижение эффективности под давлением.

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.