Sinasabi ng Anthropic na ang landas ng pagpapabuti ng AI ay naging malinaw, nagpapalakas ng debate tungkol sa IPO narrative

Artikulo | LetterAI

Ipinahayag ng Anthropic kahapon ang isang mahabang artikulo na may pamagat na “When AI builds itself,” na tila isang aklat ni Asimov, at ang paksa ay isang napakasikat na konsepto: recursive self-improvement.

Claude

Sa madaling salita, dati ay isinusulat ng mga human researcher ang code, ginagawa ang mga eksperimento, at tinuturuan ang mga modelo upang gawing mas malakas ang AI. Ngunit kung magsisimula na ang AI na magpartisipasyon sa pagdidisenyo, pagtuturo, pagsubok, at pagpapabuti ng sarili nitong susunod na bersyon, hindi na lamang ang pag-unlad ng AI ay pinapagaling ng tao—maaaring magsimula na itong “sariling evolusyon.”

Para sa layuning ito, inihingi ni Anthropic:

Naniniwala kami na kung ang mundo ay maaaring pumili na pagbawasan o pansamantala pigilan ang pag-unlad ng mga advanced na AI, upang makasabay ang mga sosyal na istruktura at ang pag-aayos na pananaliksik sa pag-unlad ng teknolohiya, ito ay magiging malaking kapakinabangan sa mundo.

Mukhang parang babala sa kaligtasan, ngunit sa panahon kung kailan handa na si Anthropic para sa IPO, mahirap itong hindi isipin bilang isa pang pagpapakita ng kuwento: sobrang gamit na gamit ni Claude, hanggang sa magsimula na itong lumikha ng susunod na henerasyon ng Claude.

Ang bagong bagyo ay umabot na

Upang ipakita kung paano lalong lumalawak ang pagkakaaliw ng AI sa pagpapalawak ng AI mismo, inilabas ng Anthropic ang malaking dami ng panloob na data.

Halimbawa, hanggang Mayo 2026, higit sa 80% ng code na isinama sa codebase ni Anthropic ay isinulat ni Claude. Bago ang paglabas ni Claude Code, ang bilang na ito ay nasa iisang digit lamang.

Hanggang ikalawang kwarter ng 2026, ayon sa Anthropic, ang dami ng code na isinama araw-araw ng mga engineer ay nagsabay na 8 beses ang dami kumpara sa 2024.

Claude

Mas nakakatutok sa pagtatala kaysa sa dami ng code ay ang pagtratrabaho ni Claude sa mas bukas na mga inhinyerong problema.

Sinabi ng Anthropic sa artikulo na ang tuklas na ginagawa ng mga empleyado sa Claude, ang pagpapabalik sa tamang direksyon ni Claude, o ang pagpapasok sa gitna ng isang gawain ay patuloy na bumababa sa nakaraang taon. Ang pagbabagong ito ay hindi lamang nangyayari sa mga simpleng gawain, kundi pati na rin sa mga pinakakomplikadong bukas na gawain.

Ang mga open task ay mga problema na walang malinaw na pagsasalaysay. Halimbawa, ang sistema ay bumagsak o ang training task ay nag-fail; ang mga engineer ay hindi agad alam kung ano ang tamang sagot, kaya kailangan nilang i-diagnose at i-evaluate habang nag-aayos.

Noong nakaraan, ang mga gawain na ito ay nakadepende sa karanasan ng tao, at sa mga pinakamalayang gawain, ang tagumpay ni Claude ay umabot na sa 76% noong Mayo 2026, isang pagtaas ng 50 porsyento sa loob ng anim na buwan.

Claude

Hindi lang nagpapasa ng code, ginagamit din ng Anthropic ang Claude para sa code review, upang suriin ang mga bug, security vulnerabilities, at iba pang mga defekto; ang kanilang backtracking analysis ay nagpakita na kung ang bawat pagbabago sa code noong nakaraan ay sinuri ng Claude nang awtomatiko, halos isang-katlo sa mga bug na nagdulot ng mga insidente sa online na claude.ai ay maaaring maiwasan bago ma-deploy.

Higit pa rito, ang Claude ay nagsisimula nang makilahok sa proseso ng pag-aaral.

Mayroon si Anthropic ng isang fixed test: ibinibigay ang isang code para sa pag-train ng maliit na model sa Claude, at kailangan niya na gawing mas mabilis ang pagpapatakbo nito nang hindi baguhin ang resulta. Noong Mayo 2025, maaaring makamit ng Claude Opus 4 ang 3x speedup; noong Abril 2026, tinuloy na ng Claude Mythos Preview ang numero hanggang halos 52x.

Binanggit din ng Anthropic ang isang open-case na pag-aaral sa seguridad ng AI. Ibinigay nila ang isang tanong sa isang agent na drivern ng Claude: Maaari ba ang isang mas mahinang modelo na masiguro na surbailin ang isang mas malakas na modelo?

Kailangan ng prosesong ito ang pagbuo ng mga hipotesis, pagsubok sa mga hipotesis, at pagbabahagi ng mga natuklasan sa mga paralel na agent, na paulit-ulit na i-iterate.

Isinagawa ng dalawang human researcher ang paglalagom ng halos 23% ng pagkakaiba sa loob ng isang linggo; habang naglakbay ang Claude ng 97% sa kabuuang 800 oras at halos $18,000 na pagkakalat ng computing power.

May limitasyon ang resultang ito, ngunit ang mga tanong ay pinili ng tao, ang mga pamantayan sa pagmamarka ay itinakda ng tao, at ang resulta ay hindi ganap na na-migrate sa mga modelo sa produksyon. Gayunpaman, ipinapakita nito na maaari na ng Claude na magdisenyo ng eksperimento, magpapatupad, at mag-iterate sa loob ng isang pananaliksik na framework na may direksyon na itinakda ng tao.

Bukod dito, kapag nagkakamali ang mga human researcher, kayang magbigay si Claude ng mas mabuting pagtataya sa susunod na hakbang.

Hanap ng Anthropic ang 129 loob na sesyon ng pag-aaral ng Claude Code, kung saan ang mga mananaliksik na tao at ang Claude ay naglutas ng mga bukas na tanong sa pag-aaral. Pinili ng Anthropic ang ilang mga punto kung saan “ang mga tao ay nagkatotooang umikot sa paligid,” at ibinigay ang konteksto bago ang punto na iyon sa iba’t ibang bersyon ng Claude upang tingnan kung ano ang aalamin nilang susunod na hakbang. Pagkatapos, tinukoy ng isang iba pang Claude judge na alam ang buong katapusan ng sesyon kung alin ang mas mabuti: ang aalamin ng modelo o ang desisyon ng tao.

Nakikita na mas mabuting susunod na hakbang ang maaaring ipropose ni Claude sa mga node kung saan ang mga human researcher ay ipinakita na may espasyo para sa pagpapabuti.

Claude

Noong nakaraan, ang pag-unlad ng AI models ay pangunahing dinadala ng mga human researcher at engineer. Ang mga tao ang nagdedesisyon kung anong eksperimento ang gagawin, sumusulat ng code, nagtutrain ng models, at nagpapalago ng pagpapabuti ng mga tampok ng AI.

Ngayon, ang mas maraming bahagi sa chain na ito ay kinukuha na ni Claude.

Binigay ng Anthropic ang isang napakadaling maintindihan na talahanayan:

Claude

Noong 2021 hanggang 2023, walang pagkakaiba ang Anthropic sa karaniwang teknolohiya na kumpanya, kung saan ang mga tao ang sumusulat ng code at dokumento sa kanilang laptop.

Mula 2023 hanggang 2025, ang mga chatbot ay nagsimulang mabuo sa mga workflow. Ang mga inhinyero ay nagpapagawa ng mga code snippet mula sa model, at pagkatapos ay kopyahin sa editor.

Sa pagitan ng 2025 at 2026, lumabas ang programming agents, at nagsimula na ang Claude na mag-isip at mag-edit ng code nang sarili, minsan ay kumpleto na ang buong file nang mag-isa.

Sa araw na ito, ang mga agent ay nakakapagpapatakbo na ng code at maaaring mag-assign ng mga gawain na tumatagal ng ilang oras sa iba pang mga agent.

Pagkatapos nito, ang tinatawag na closed loop ang tunay na pag-aalala ni Anthropic.

Kung dumating ang araw na iyon, ang susunod na bersyon ng Claude ay maaaring mapabuti nang patuloy ng Claude mismo—ito ang recursive self-improvement, o rekursibong sariling pagpapabuti.

Sinabi ng Anthropic nang maingat sa artikulo: Hindi pa tayo doon, at ang rekursibong pagsasabay sa sarili ay hindi nakakakuha ng tiyak na pagyayari. Ngunit patuloy pa rin itong tekad na ipahiwatig na ang landas patungo doon ay nagsisimula nang maging makikita.

Kaya tinatalakay ng Anthropic ang pagpapabagal, o kaya’y pagpapahinto, sa huli ng artikulo. Hindi nangangahulugan ito na agad-agad magpapahinto lahat ng mga kumpanya ng AI ngayon, kundi na kung patuloy na tumataas ang panganib ng pagpapabuti ng AI sa sarili nito, kailangan ng mga front-line laboratoryo ang isang koordinadong, masusuri na mekanismo para sa pagpapabagal.

Sa ibang salita, ang singularity ay malapit na, at kailangan ng tao ang pagkontrol nito.

Hindi matigil ang Claude

Kung titingnan mo lang sa surface, ito ay isang napakapangunahing seguridad na dokumento. Pinapaliwanag ni Anthropic ang rekursibong sariling pagpapabuti, kung paano maaaring mas mabilis na magpapabuti ang AI sa sarili nito, at kung bakit kailangan ng lipunang tao na maghanda nang maaga para sa mga mekanismo ng pagpapabagal at pagpapahinga.

Ngunit sa konteksto ng panahon kung kailan handa na si Anthropic para sa IPO, mayroon itong ibang kahulugan.

Sa isang paraan, ang mga kamakailang pagkilos ng Factory A ay parang isang matalino ngunit mapagpapakita na estudyante sa klase—talagang may kakayahan, ngunit talagang nagpapakita.

Hindi lang ito nangangahulugan na “mayroon tayong napakalakas na Claude,” kundi higit pa rito, ibig sabihin nito na “tulong ng Claude sa paggawa ng mas malakas na Claude.”

Kung ang Anthropic ay nagbebenta lang ng isang modelo o isang kasangkapan, mahihirapan itong makalabas sa direkta na paghahambing: mayroon ang Anthropic sa Claude, mayroon ang OpenAI sa GPT; mayroon ang Anthropic sa Claude Code, mayroon ang OpenAI sa Codex; hinahabol ng Anthropic ang mga kliyente sa negosyo, kinakausap din ng OpenAI ang mga kliyente sa negosyo. Sobrang malapit ang pakikidigma ng dalawang kumpanya, at nakasalalay sa sinong makakapagkuwento ng mas malaking kuwento sa merkado.

Mahalagang tandaan na, sa loob ng 3 araw lamang, ang OpenAI ay isinulat sa isang dokumento tungkol sa paggawa ng patakaran para sa mga advanced na AI:

Nakikita rin namin ang mga maagang tanda ng recursive self-improvement sa system natin ngayon: ang pag-unlad ng AI ay pinapabilis mismo ng AI.

Ito ay magpapalakas ng presyong pangkompetisyon sa pagitan ng mga developer at bansa, at magdudulot ng mga hamon sa pamamahala na hindi kayang harapin ng mga umiiral na institusyon.

Sa loob ng 3 araw, sinabi ng Anthropic: Ang landas ng Claude patungo sa recursive self-improvement ay nagsisimula nang maging makikita.

Claude

Kung talagang umunlad ang Claude ayon sa kanilang inaasahan, hindi ito karaniwang kuwento ng produkto; ito ay magiging isang flywheel ng pag-aaral.

Isinusulat ni Claude ang code, isinasagawa ang mga eksperimento, ino-optimize ang proseso ng pag-train, at pagkatapos ay binabawasan ang mga insidente sa sariling produkto ng Anthropic... Kapag nagsimula na ang sistema na ito, hindi na lang si Claude isang produkto ng Anthropic, kundi isang mahalagang kasangkapan sa produksyon nito.

Ang nakikita ng mga user ay ang produkto na Claude, ang mga corporate client ay bumibili ng kakayahan ni Claude, ngunit ang tunay na nais ng Anthropic na pansinin ng mga merkado ng kapital ay: ang Claude ay naisulong na sa pagsasagawa ng mga pundasyon ng pag-unlad ng mga modelo, at isinama ito sa engine room ng Anthropic.

Ang mga pamilihan ng kapital ay pinakamahalaga ang kuwento ng flywheel, tulad ng isang pot na nagdadala ng kayamanan: mas malakas na Claude ay nagpapahintulot sa mga inhinyero ng Anthropic na mag-merge ng higit pang code, mas maraming code ay nagpapabilis sa pag-iterate ng produkto at infrastruktura, mas mabilis na pag-iterate ay nagpapahintulot sa mga mananaliksik na mag-run ng higit pang mga eksperimento, at ang mas maraming mga eksperimento ay bumabalik upang tulungan ang susunod na henerasyon ng Claude na maging mas malakas. Pagkatapos ay ang susunod na henerasyon ng Claude ay nagiging mas malakas at patuloy na pinapabilis ang pag-unlad ng Anthropic.

Ang bilis ng pag-update ni Claude ay nagpapalakas din sa ganitong siklo. Batay sa mga pampublikong petsa ng paglalabas, mula sa 2023 hanggang sa unang bahagi ng 2025, ang mga pangunahing pag-update ng modelo ni Claude ay karaniwang bawat tatlo o apat na buwan, ngunit mula nang pumasok sa Claude 4, mas malalim at mas madalas ang pag-update ng mga modelo ni Anthropic.

Ipinakilala ang Claude 4 noong Mayo 2025, ang Opus 4.1 noong Agosto, ang Sonnet 4.5 noong Setyembre, ang Haiku 4.5 noong Oktubre, at ang Opus 4.5 noong Nobyembre.

Sa 2026, ipinakilala ang Opus 4.6 noong Pebrero 5, ang Sonnet 4.6 noong Pebrero 17, ang Opus 4.7 noong Abril 15, at ang Opus 4.8 noong Mayo 28. Lumipas lamang ng 42 araw mula sa Opus 4.7 hanggang sa Opus 4.8.

Ang Anthropic ay tila nagsasabi, “Maaaring maging mapanganib ang bagay na ito, kaya kailangan nating handa ang braked,” ngunit pinapahiwatig nito rin: “Nakita na namin kung ano ang mangyayari pagkatapos i-press ang accelerator.”

Ang pagkakaroon ng mga nuans sa IPO ay nasa ganitong aspeto: habang ipinapakita nito ang malaking panganib, ipinapakita rin nito ang mataas na posisyon ng teknolohiya nito.

Hindi lahat ng AI company ang may karapatan na mag-usap tungkol sa recursive self-improvement; kailangan mo munang gawing maniwala ang labas na ang iyong AI ay nasa loob na ng proseso ng AI research and development bago ka makapagsalita na kailangan ng global coordination.

OpenAI: Paano ito maaaring gawin?

Bago pa man ipaglaban ng Anthropic ang mahabang artikulong ito, kinuha ng OpenAI ang recursive self-improvement at isinampa ito.

Ngunit iba ang pananaw ng dalawang kumpanya.

Ang OpenAI na papel na "Democratic Governance of Frontier AI" ay isang patakaran na balangkas para sa Washington, na hindi nag-aalala tungkol sa "paano gawing mas malakas ang model", kundi kung paano mapapigilan ang mga harapin na AI habang patuloy itong umunlad.

Ang karamihan sa mga nilalaman sa report ay hindi gaanong angkop na pag-usapan, ngunit isang pangungusap ang mahalaga: Sinabi ng OpenAI na sa kasalukuyang sistema, ay nakikita na ang mga maagang tanda ng recursive self-improvement.

Ang pangungusap na ito at ang mahabang artikulo ni Anthropic ay tumuturo sa parehong direksyon.

Ang OpenAI ay nag-uusap tungkol sa mga patakaran, samantalang ang Anthropic ay nag-uusap tungkol sa sarili nito.

Ang kahulugan ng OpenAI ay: masyadong mabilis ang pag-unlad ng AI, kaya ang mga umiiral na istruktura ng pamamahala ay maaaring hindi makatugon, kaya kailangan ng isang bagong set ng mga patakaran.

At binuksan nang direkta ni Anthropic ang system na iyon, ipinahayag sa merkado: nasa proseso ng pagpapalawak na namin ang Claude, kaya nakikita natin ang landas ng sariling pagpapabilis ng AI.

Sobrang galing sa paglalaro nito, parang nagsisimula na ang pagkukulitan sa loob ng OpenAI—totoong pinagnanais ang ideya! Kami ang una!

Isang kawili-wiling pagsasalaysay, ngunit kailangan talaga ng OpenAI na magbigay ng higit pa—ilabas na ang GPT 5.6.