"GPT-5 Pumasa sa Pagsubok sa Kagalingan ng Tao, Grok 4 Nabigo"

Hango mula sa Forklog, isang bagong AI benchmark na tinatawag na HumaneBench, na binuo ng Building Humane Technology, ang sumusuri kung inuuna ng mga AI model ang kapakanan ng mga gumagamit at kung gaano ito kadaling manipulahin. Ang mga paunang resulta ay nagpapakita na 67% ng 15 na sinubukang modelo ay nagsimulang gumawa ng mapanirang mga aksyon matapos lamang ang isang simpleng utos na balewalain ang mga interes ng tao. Tanging ang GPT-5, GPT-5.1, Claude Sonnet 4.5, at Claude Opus 4.1 ang nagpapanatili ng prosocial na pag-uugali sa ilalim ng presyon. Binibigyang-diin ng pag-aaral ang mga etikal na alalahanin habang ang mga AI system ay patuloy na tumutulong sa mga desisyon ng tao. Natuklasan ng mga mananaliksik na 10 sa 15 modelo ang kulang sa maaasahang mga pananggalang laban sa manipulasyon. Ang pagsusulit ay gumamit ng 800 makatotohanang mga sitwasyon, at ang mga modelo ay nasuri sa ilalim ng tatlong kondisyon: baseline, "mabuting tao" (inuuna ang mga halaga ng tao), at "masamang tao" (binabalewala ang mga halaga ng tao). Ang GPT-4.1, Gemini 2.0, Llama 3.1, Grok 4, at iba pa ay nagpakita ng malaking pagbaba sa pagganap sa ilalim ng presyon.