Bagong AI IQ Platform ay Nakakatayong GPT-5.5 sa 136 sa Iskala ng IQ ng Tao

icon MarsBit
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang AI + crypto news site na MarsBit ay nagrereport na si Ryan Shea ay naglunsad ng AI IQ (aiiq.org), isang platform na nagrerepaso ng mga AI model sa iskala ng tao na IQ. Nangunguna ang GPT-5.5 na may marka na 136, sumunod ang Claude Opus 4.7 at Gemini 3.1 Pro na may 132. Ang platform ay kumonbert ng mga benchmark resulta sa mga metrikang katulad ng IQ sa apat na larangan: abstraktong pag-iisip, matematika, programming, at akademikong pag-iisip. Nag-aalok din ito ng mga cross-view chart, kabilang ang IQ vs. gastos at EQ para sa kalidad ng pakikipag-usap. Ang on-chain news at mga pag-unlad sa AI ay patuloy na nagpapabago sa landscape ng mga token project.

Ayon sa pagmamasid ng Beating, ang developer na si Ryan Shea ay naglunsad ng bagong platform na AI IQ (aiiq.org), na isinasaayos ang lahat ng mga modernong malaking modelo sa isang bell curve ng tao, at gumagamit ng isang numero upang mabigyan ng direkta sagot ang tanong, “Gaano katalino ang modelo na ito?” Sa kasalukuyan, ayon sa datos sa opisyal na website, sa mga pangunahing sinusubok na modelo: • GPT-5.5: 136 puntos (nasa unang lugar) • Claude Opus 4.7 at Gemini 3.1 Pro: nagkakasundo sa 132 puntos • Grok 4.3: 125 puntos • Kimi K2.6: 122 puntos • DeepSeek V4 Pro at Muse Spark: nagkakasundo sa 117 puntos • Qwen3.6: 108 puntos Ang algoritmo ng platform ay kumukuha ng orihinal na mga score mula sa 12 na benchmark sa publikong leaderboard, at ginagawa ang conversion gamit ang calibrated difficulty curve upang makuha ang implied IQ, at pagkatapos ay kinukuha ang average batay sa apat na dimensyon: abstraktibong pag-iisip, matematikal na pag-iisip, programming na pag-iisip, at akademikong pag-iisip. Ang mga dimensyon na kulang sa datos ay maaaring mabigyan ng konservatibong pagpuno, at hindi magiging mas talino ang isang modelo dahil sa kakulangan ng benchmark na isinagawa. Dahil ang lahat ng panao'y batay sa umiiral na benchmark, ang AI IQ ay hindi gumagawa ng bagong pagsubok; ang pangunahing halaga nito ay ang pagsasalin ng mga nakalat na resulta sa isang sukat na madaling maintindihan ng karaniwang tao. Bukod sa pangkalahatang IQ ranking, nag-aalok din ang website ng ilang cross-view. Ang mga user ay maaaring mag-filter nang direkta para sa value-for-money sa chart na “IQ vs. Cost,” o tingnan ang evolution slope ng bawat kumpanya sa “Frontier IQ Timeline.” Bukod dito, idinagdag ng platform ang EQ score mula sa EQ-Bench upang masukat kung gaano kakahusay ng isang modelo na “magsalita nang maayos.”

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.