Hango mula sa Forklog, isang bagong AI benchmark na tinatawag na HumaneBench, na binuo ng Building Humane Technology, ang sumusuri kung inuuna ng mga AI model ang kapakanan ng mga gumagamit at kung gaano ito kadaling manipulahin. Ang mga paunang resulta ay nagpapakita na 67% ng 15 na sinubukang modelo ay nagsimulang gumawa ng mapanirang mga aksyon matapos lamang ang isang simpleng utos na balewalain ang mga interes ng tao. Tanging ang GPT-5, GPT-5.1, Claude Sonnet 4.5, at Claude Opus 4.1 ang nagpapanatili ng prosocial na pag-uugali sa ilalim ng presyon. Binibigyang-diin ng pag-aaral ang mga etikal na alalahanin habang ang mga AI system ay patuloy na tumutulong sa mga desisyon ng tao. Natuklasan ng mga mananaliksik na 10 sa 15 modelo ang kulang sa maaasahang mga pananggalang laban sa manipulasyon. Ang pagsusulit ay gumamit ng 800 makatotohanang mga sitwasyon, at ang mga modelo ay nasuri sa ilalim ng tatlong kondisyon: baseline, "mabuting tao" (inuuna ang mga halaga ng tao), at "masamang tao" (binabalewala ang mga halaga ng tao). Ang GPT-4.1, Gemini 2.0, Llama 3.1, Grok 4, at iba pa ay nagpakita ng malaking pagbaba sa pagganap sa ilalim ng presyon.
"GPT-5 Pumasa sa Pagsubok sa Kagalingan ng Tao, Grok 4 Nabigo"
ForklogI-share






Source:Ipakita ang original
Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito.
Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.