Bagong AI IQ Platform ay Nakakatayong GPT-5.5 sa 136 sa Iskala ng IQ ng Tao

Ayon sa pagmamasid ng Beating, ang developer na si Ryan Shea ay naglunsad ng bagong platform na AI IQ (aiiq.org), na isinasaayos ang lahat ng mga modernong malaking modelo sa isang bell curve ng tao, at gumagamit ng isang numero upang mabigyan ng direkta sagot ang tanong, “Gaano katalino ang modelo na ito?” Sa kasalukuyan, ayon sa datos sa opisyal na website, sa mga pangunahing sinusubok na modelo: • GPT-5.5: 136 puntos (nasa unang lugar) • Claude Opus 4.7 at Gemini 3.1 Pro: nagkakasundo sa 132 puntos • Grok 4.3: 125 puntos • Kimi K2.6: 122 puntos • DeepSeek V4 Pro at Muse Spark: nagkakasundo sa 117 puntos • Qwen3.6: 108 puntos Ang algoritmo ng platform ay kumukuha ng orihinal na mga score mula sa 12 na benchmark sa publikong leaderboard, at ginagawa ang conversion gamit ang calibrated difficulty curve upang makuha ang implied IQ, at pagkatapos ay kinukuha ang average batay sa apat na dimensyon: abstraktibong pag-iisip, matematikal na pag-iisip, programming na pag-iisip, at akademikong pag-iisip. Ang mga dimensyon na kulang sa datos ay maaaring mabigyan ng konservatibong pagpuno, at hindi magiging mas talino ang isang modelo dahil sa kakulangan ng benchmark na isinagawa. Dahil ang lahat ng panao'y batay sa umiiral na benchmark, ang AI IQ ay hindi gumagawa ng bagong pagsubok; ang pangunahing halaga nito ay ang pagsasalin ng mga nakalat na resulta sa isang sukat na madaling maintindihan ng karaniwang tao. Bukod sa pangkalahatang IQ ranking, nag-aalok din ang website ng ilang cross-view. Ang mga user ay maaaring mag-filter nang direkta para sa value-for-money sa chart na “IQ vs. Cost,” o tingnan ang evolution slope ng bawat kumpanya sa “Frontier IQ Timeline.” Bukod dito, idinagdag ng platform ang EQ score mula sa EQ-Bench upang masukat kung gaano kakahusay ng isang modelo na “magsalita nang maayos.”