Ipinakilala ng Recursive Superintelligence ang unang automated na AI research system

Noong ilang araw ang nakalipas, inilabas ng Anthropic ang isang artikulo na may pamagat na “When AI Builds Itself,” na agad na nagdulot ng malawakang talakayan. Ipinakita ng artikulo ang isang nakakagulat na set ng panloob na datos: hanggang sa Mayo 2026, higit sa 80% ng code sa codebase ng Anthropic ay isinulat ng Claude, at ang dami ng code na pinagsasama ng mga inhinyero araw-araw ay 8 beses ang dami noong 2024; sa isang panloob na pagsubok, pinabilis ng Claude ang pagpapatakbo ng isang code ng pagtuturo nang halos 52 beses, samantalang ang isang karanasan na human researcher ay karaniwang kailangan ng 4 hanggang 8 oras upang makamit ang 4 beses na pagpabilis.

Ang Anthropic ay nagtuturo ng track na ito patungo sa isang mas malalim na layunin: "recursive self-improvement"—ang pag-achieve ng mga AI system na mag-ii-design, magbuo, at mag-train ng kanilang sariling susunod na bersyon nang walang tulong ng tao sa bawat hakbang. Mahalagang tandaan na ang kumpanya ay nagtatawag din para sa industry-wide coordination, upang mayroon silang opsyon na magpauso o kahit pansamantalang ipagpigil ang pag-unlad ng mga advanced AI kapag dumating ang panahon ng recursive self-improvement. At ginagawa na ng Anthropic ito: pinipigilan nila ang pinakabagong Claude Fable 5 na gamitin sa pag-aaral ng advanced AI.

At ngayon, inihayag ng Recursive Superintelligence ang kanilang unang hakbang patungo sa automated AI research.

Ang bagong kumpanya na itinatag ni Tian Yuan Dong ay naglunsad ng unang pampublikong teknolohikal na resulta lamang isang buwan pagkatapos magsara ang kanilang lihim na estado. Nilikha nila ang isang bukas na automated na sistema para sa paghahanap ng kaalaman at nakamit ang SOTA resulta sa tatlong benchmark test. Sa simpleng salita, natagumpay nilang gawing makapag-experiment ang AI para sa iyo.

https://x.com/tydsh/status/2065062838255649082

Unang resulta: Hayaan ang AI na mag-run ng mga eksperimento para sa iyo

Ang unang pampublikong teknikal na resulta ng Recursive ay tinatawag na «First Steps Toward Automated AI Research».

Tweet: https://x.com/Recursive_SI/status/2064980090702962699
Repository address: https://github.com/recursive-org/first-steps-toward-automated-ai-research
Alamat ng blog: https://www.recursive.com/articles/first-steps-toward-automated-ai-research

Kung isang pangungusap ang gagamitin, ang core ng trabaho ay: ang pagbuo ng isang sistema na makakapagpapagana nang sarili ng AI research cycle, at ang pagpapabago ng pinakamataas na resulta sa tatlong benchmark tests.

Bago maunawaan ang mga resulta ng pagdecompose, mahalaga na unawain ang lohika ng disenyo ng sistemang ito.

Ang tradisyonal na proseso ng pag-aaral ng AI ay isang sariling-loop na malaki ang pagkakasalalay sa tao: “mag-isip ng ideya—sumulat ng code—patakbuhin ang eksperimento—analysahin ang resulta—at muli ay mag-isip ng ideya.” Ang bottleneck nito ay hindi sa computing power, kundi sa tao. Kaunti lang ang mga researcher sa buong mundo na kayang magdisenyo ng mga modernong training流程, at bawat siklo ng pag-iterate ng eksperimento ay nangangailangan ng malalim na pakikilahok nila.

Ang sistema ng Recursive ay sinusubukang awtomatikuhin ang pagsasariling loop na ito.

Nakakapagtrabaho ito sa paraang ito: Para sa isang malinaw na layunin sa pag-optimize, awtomatikong nagpapahayag ang sistema ng mga ideya sa eksperimento, isinasagawa ang code, pinapagalaw at pinapatotohanan, natututunan mula dito, at tinutukoy ang susunod na hakbang sa paghahanap. Maaaring ipagpatuloy nang sabay-sabay ang maraming linya ng pag-aaral, at maaaring gamitin muli ang mga epektibong pagkakatuklas sa iba’t ibang gawain; ang mekanismo para sa pagkilala sa pagpapalit ng pagsasakripisyo (reward hacking) ay nakapaloob na sa buong siklo upang maiwasan ang paggamit ng “shortcut” ng sistema upang palakasin ang mga marka sa pagsusuri nang hindi talagang mapabuti ang anumang bagay.

Hindi ito isang espesyalisadong kasangkapan na tinutuwid para sa isang partikular na problema, kundi isang pangkalahatang framework para sa awtomatikong pag-aaral na gumagamit sa iba’t ibang larangan. Patunay ng Recursive ang tatlong magkakaibang test scenario.

Tatlong battlefield, tatlong bagong rekord

Skenaryo 1: Pagsasagawa ng maliit na modelo sa ilalim ng nakapirming budget (NanoChat Autoresearch)

Ang mga patakaran sa benchmark na ito ay galing sa proyektong autoresearch na isinimulan ni Andrej Karpathy (may-akda ng GPT-2 at dating co-founder ng OpenAI): sa isang GPU, ibinigay ang fixed na budget na limang minuto para sa pagtuturo, layunin na ituturo ang isang maliit na language model hanggang sa mabawasan ang pinakamababang validation loss (na sinusukat sa BPB, mas mababa ang mas maganda).

Ang skena na ito ay naturally angkop para sa automated na pag-aaral: maikling cycle ng eksperimento, mababang variance ng mga indikador, at mas madaling masuri ang mga pagkakamali. Dahil dito, isang komunidad na proyektong tinatawag na "autoresearch@home" ay nagpapatakbo na nang mahabang panahon sa benchmark na ito—dahilan sa dekada-dekada na mga human na researcher at mga AI agent na nagtatrabaho nang magkasama upang patuloy na bawasan ang mga indikador.

Ang sistema ng Recursive, na nagsimula sa parehong initial code, ay nakapagpabuti ng 0.0263 na BPB mula sa pinakamahusay na komunidad na 0.9372 patungo sa 0.9109. Sa ibang salita: sa parehong kalidad ng pagtuturo, ang solusyon ng Recursive ay kailangan ng 1.3 beses na mas kaunting oras sa pagtuturo kaysa sa kalaban.

Ang mga pagpapabuti na natuklasan ng sistema ay hindi isang solusyong magkakaroon ng epekto sa isang hakbang lamang. Ito ay naglalaman ng maraming pagbabago tulad ng pag-adjust sa arkitektura, auxiliary loss, pagbabago sa attention mechanism, pag-uugali ng optimizer, scheduling ng weight decay, at compiler settings. Ang pinakamahalagang natuklasan ay isang mas may-aman na mekanismo para sa maikling memorya ng konteksto: sa value path ng attention, inilalagay ang impormasyon ng bigram (mga pares ng kapitbahay na salita) at trigram (mga triple) gamit ang hash table, at pinagsasama ito gamit ang isang learnable gated weighting. Gumagamit ang iba’t ibang Transformer layers ng iba’t ibang hash function upang bawasan ang posibilidad ng paulit-ulit na collision sa pagitan ng layers.

Nakakaugnay ang teknik na ito sa konseptuwal na mga gawa tulad ng DeepSeek Engram, ngunit inilalapat ng sistema ito sa isang partikular na bersyon na hindi pa nakikita sa publikong literatura sa isang fixed budget scenario.

Scena 2: Extreme Speed Training (NanoGPT Speedrun)

Kung ang nakaraang senaryo ay isang "pagpapalawak" sa mga tagumpay ng isang aktibong komunidad, ang senaryong ito ay mas mahirap.

Ang NanoGPT Speedrun ay isang iba pang benchmark na inilunsad ni Karpathy at patuloy na pinabuting ng komunidad nang higit sa dalawang taon: ang pinakamabilis na oras upang turuan ang isang GPT model sa 8 H100 GPU hanggang sa isang validation loss na 3.28. Mula sa gitna ng 2024, pinabawasan ng komunidad ang oras mula sa halos 45 minuto hanggang sa 79.7 segundo sa pamamagitan ng 83 na dokumentadong kontribusyon. Bawat bagong solusyon ay nangangailangan ng pagpapabilis pa sa isang naka-optimize nang lubos na code—ang pagkakaroon nito ay lubos na mahirap.

Ang sistemang Recursive ay muling pinababa ang training time mula sa umiiral na pinakamahusay na solusyon patungo sa 77.5 segundo, na nag-save ng 2.2 segundo. Ito ay katumbas o mas mahusay kaysa sa mga pagpapabuti na kayang gawin ng mga kahalintulad na contributor sa nakaraang panahon.

Ang mga pangunahang teknik na natagpuan ng sistema sa pagkakataong ito ay:

Pagkalkula ng atensyon sa FP8 precision. Ang komunidad na solusyon ay gumagamit lamang ng FP8 (8-bit floating point) sa huling layer ng modelo (language model head), habang ang sistema ay nagpapalawak ng FP8 sa mga matrix operation ng attention layer, gamit ang FP8 sa forward pass para makamit ang dalawang beses na Tensor Core throughput, at nananatili sa BF16 sa backward pass para panatilihin ang stabiliyad.

Annealing exploration noise sa optimizer. Ang sistema ay nagdadagdag ng Gaussian noise na may zero mean sa update step ng NorMuon optimizer, at ang amplitude ng noise ay bumababa nang linyar patungo sa zero habang tumutuloy ang pagtuturo. Ito ay parang nagbibigay ng “muna’y mag-explore nang malakas, tapos mag-converge nang mas matatag” na pag-uugali sa optimizer, upang tulungan ang final solution na makarating sa isang mas patag na loss basin.

Mas kompaktong fused MLP kernel. I-rewrite ng sistema ang Triton GPU kernel upang ang forward pass ay mag-store lamang ng activated values na square ng ReLU, at muling kalkulahin sa loob ng kernel ang intermediate results bago i-square sa backward pass, na nag-iwas sa isang buong pagbasa at pagsulat ng activation tensor sa high-bandwidth memory—direktang pagpapabilis sa hardware level.

Tatlong pagpapabuti, na nanggaling sa tatlong iba’t ibang propesyonal na larangan: estratehiya ng precision, disenyo ng optimizer, at GPU kernel programming. Ang pagkakaroon ng dagdag na espasyo sa mga resulta ng dalawang taon ng community optimization ay nagpapakita na ng problema.

Skenaryo 3: Optimize ng GPU Kernel (SOL-ExecBench)

Ang dalawang unang senaryo ay gumagana sa antas ng pag-train ng modelo, habang ang ikatlong senaryo ay lumalalim sa mas mababang antas: ang pag-optimize ng GPU compute kernels.

Ang SOL-ExecBench ay isang benchmark na inilabas ng NVIDIA, na naglalaman ng 235 mga task na isinulat sa kernel, na kumakapal ng iba't ibang uri ng totoong workload tulad ng matrix multiplication, reduction, normalization layers, attention components, quantization routines, at fused blocks. Ang scoring criterion ay ang SOL score: ang 0.5 ay tumutukoy sa benchmark PyTorch implementation, habang ang 1.0 ay tumutukoy sa theoretical hardware limit. Ang nakaraang pinakamataas na publikong resulta ay 0.699.

Ang sistema ng Recursive ay tumatakbo nang buo sa 235 na core, nagpapahintulot sa pagbabahagi ng mga natuklasang optimal pattern sa pagitan ng mga gawain (tulad ng mga estratehiya sa paghahatid ng memorya, paraan ng paghahati, at mga teknik ng reduction), na nagresulta sa pagtaas ng skor hanggang 0.754, na nagpapaliit ng 18% ang kalayuan mula sa hardware limit.

Ang sitwasyong ito ay may espesyal na kahalagahan dahil ang kernel engineering ay isang napakaprosesyon na larangan—ang mga inhinyero na kayang sumulat ng epektibong Triton/CUDA kernels ay maraming-kulay sa buong mundo. At tinanggap ng team ng Recursive sa kanilang blog na sila ay hindi rin mga eksperto sa larangan ng kernel: “Ang mga ideyang ito ay galing sa sistema mismo, hindi galing sa aming propesyonal na background.”

Recursive: Gamitin ang AI upang pag-aralan ang rekursyon upang mapabuti ang AI

Ang kumpanya na Recursive Superintelligence, na itinatag noong katapusan ng 2025 hanggang simula ng 2026, ay nagwakas sa kanyang lihim na kalagayan noong nakaraang buwan, at ang mga tagapagtatag ay kasama si Tian Yandong, dating direktor ng mga siyentipiko sa pag-aaral ng Meta FAIR, at iba pa:

Richard Socher, CEO ng Recursive, dating chief scientist ng Salesforce

Alexey Dosovitskiy, dating na siya na si Google DeepMind Research Scientist at unang may-akda ng Vision Transformer, na may higit sa 160,000 na pagkakasangkot sa Google Scholar

Tim Rocktäschel, dating na Principal Scientist ng DeepMind at propesor ng AI sa UCL

Peter Norvig, dating na direktor ng pag-aaral ng Google, ay nagkasulat kasama si Stuart Russell ng kilalang aklat sa larangan ng AI na "Artificial Intelligence: A Modern Approach"

Caiming Xiong, dating na pangalawang pangulo ng Salesforce AI

Tim Shi, dating na researcher ng OpenAI, co-founder at CTO ng enterprise AI company na Cresta

Josh Tobin, CTO ng Recursive, dating head ng research sa OpenAI at Uber ATG

Jeff Clune, nakaraang vice president for research sa Google DeepMind, propesor ng Computer Science sa University of British Columbia, Canada

At ang startup na ito, kahit pa hindi pa may pampublikong produkto, ay mayroon nang $650 milyon sa pagsasamantala, na may halagang $4.65 bilyon, na pinangunahan ng GV (Google Ventures) at Greycroft, kasama ang NVIDIA at AMD Ventures bilang mga sumuporta.

Ang pangunahang pahayag ng kumpanya ay direktang nauugnay sa pangalan nito: pagbuo ng mga AI system na makakapagpapataas nang rekursibo ang kanilang kakayahan sa pag-aaral, upang masali at mapabilis ang proseso ng pagbuo ng AI mismo, at sa huli ay mabuo ang isang patuloy na sariling pagsusulong na loop.

Para sa karagdagang detalye, tingnan ang ulat na “Matapos umalis sa Meta, ipinahayag ni Tian Yuan Dong ang kanyang bagong startup.”

Sa antas ng track, hindi nag-iisa ang Recursive. Nagtapos ang AMI Labs ni Yann LeCun ng pagsasapilit ng $1 bilyon noong Marso, at kinuha ni David Silver ang Ineffable Intelligence ng $1.1 bilyon sa seed round noong Abril, na nagtuturo sa parehong direksyon: paggawa ng mga sistema ng AI na makakagawa ng kaalaman nang sarili, at pagbabawas ng pakikilahok ng tao sa proseso ng pag-aaral. Ngunit sa ritmo ng pagpapalabas ng mga resulta, ang “unang hakbang” ng Recursive ay isa sa pinakamalinaw at pinakamakapagsasagawa na teknikal na pagpapakita sa mga kaukulang kumpanya sa kasalukuyan.

Ang pagkabukas ng recursive paradigm

Ang resultang inilabas ng Recursive, sa mas malawak na konteksto ng industriya, ay nagpapakita ng unang pagpapatupad ng isang bagong pamantayan sa pag-aaral ng AI: ang pagpapahintulot sa mga sistema ng AI na maging pangunahing tagapag-aral.

Hindi komplikado ang pangunahang lohika ng "rekursibong AI": pinapabuti ng AI ang kakayahan nito sa pag-aaral ng AI, at ang pinabuting AI ay mas epektibong pinapabuti ang sarili nito, nang paulit-ulit. Hindi ito nakasalalay sa isang solong pagbubukas, kundi sa isang sistema na patuloy na nagpapagawa ng mga pagbubukas.

May malaking kahalagahan ang ideyang ito sa ekonomiks ng sariling pag-aaral ng AI. Ang proseso ng pag-train sa mga pinakabagong modelo ay patuloy na nakadepende sa kaunting mga researcher na may partikular na kasanayan, at ang bilang ng mga taong kayang gawin ito ay higit sa ilang libo sa buong mundo. Kung ang automated research system ay maaaring magdala ng kahit anumang bahagi ng gawain, magkakaroon ng pagbabago ang bilis at kurba ng gastos sa pag-unlad ng AI.

Ang pagtataya na ito ay sumasalungat din sa iba pang mga pahayag mula sa industriya. Halimbawa, ang “When AI Builds Itself” ni Anthropic, na nabanggit sa simula ng artikulong ito, ay hindi nagtataglay ng maluwag na tono—ito ay humihingi ng koordinasyon sa industriya upang mayroong opsyon na pag-antay o pansamantalang paghinto sa pag-unlad ng pinakamataas na antas ng AI nang dumating ang panahon ng rekursibong sariling pagpapabuti, upang bigyan ng oras ang mga sosyal na istruktura at ang pag-aaral tungkol sa pagkakasundo. Para sa karagdagang detalye, tingnan ang “Mabilis na Pag-ebolusyon ng AI, Humihingi ang Anthropic ng Pandaigdigang Paghinto sa Pagpapaunlad.”

https://www.anthropic.com/institute/recursive-self-improvement

Dalawang bagay ang nangyayari nang sabay-sabay, nakakatangi. Sa isang panig, ang Anthropic ay nagsasalaysay at nagbabala sa direksyon ng track na ito, habang sa ibang panig, ang mga koponan tulad ng Recursive ay nagsisikap na gawing totoo ang track na ito, hakbang-hakbang.

Totoo rin na kilala ng Recursive na ito ay patuloy na «unang hakbang»: ang kasalukuyang sistema ay pinakamahusay sa mga sitwasyon kung saan ang mga indikador ay malinaw, ang feedback ay mabilis, at ang pagpapaligsing ay maaaring masuri; mayroon pa ring malaking distansya upang makamit ang sariling pagpapalaganap ng mga bukas na isyu sa agham. Ang pagpigil sa pagpapaligsing sa mga reward ay magiging pangunahing hamon na tatagpuan sa bawat paglago.

Ngunit isang saradong loop ay nagsimula nang gumana. Ang susunod na tanong ay kung gaano kalakas ito magkikita.

Nakukuha ang artikulong ito mula sa WeChat public account na “Machine Heart” (ID: almosthuman2014), may-akda: Machine Heart sa recursive evolution, editor: Panda