Babala ni George Hotz na maaaring masira ng AI programming agents ang kalidad ng code

Binibigkas ng CoinWorld:

Ayon sa mga komento mula sa dayuhang media, ang pag-uusap tungkol sa AI programming agents ay nagbabago mula sa “kakayahan nito na mapabilis ang proseso” patungo sa “posibleng maging sanhi ng pagbaba sa kalidad ng engineering.” Noong recent, ang hacker na si George Hotz, na kilala sa pag-break ng unang generation ng iPhone jailbreak at PlayStation 3, ay nag-post na ang malawakang paggamit ng mga tool na ito sa industriya ng software ay maaaring maging isang napakadakilang pagkakamali.

Negative judgment after six months of testing

Sinabi ni Hotz na hindi siya nasa labas at nagkakritika. Sa nakalipas na anim na buwan, patuloy niyang ginamit ang AI agents sa totoong mga proyekto, kabilang ang ilang pag-unlad ng kanyang open-source deep learning framework na tinygrad, at ang buong reverse engineering ng isang USB-PCIe chip firmware.

Ang kanyang konklusyon ay ang ganitong mga kasangkapan ay karaniwang nagbibigay ng mabilis na progreso sa simula, ngunit mas mahirap makumpleto sa huli. Sa paningin, ang output ng modelo ay lalong nagiging mas maayos, ngunit ang mga tunay na problema ay mas mahirap makita nang maaga. Ayon sa kanya, ang mga developer ay patuloy pa ring kailangang manu-manong i-patch ang mga resulta.

Ang pagkakaiba ay hindi sa efficiency, kundi kung sino ang magiging responsable

Naniniwala ang artikulo na ang totoong panganib ay hindi lamang kung tama o mali ang isang output, kundi kung babagsak ba ang quality control sa organisasyon. Ang pangunahing pagpapasiya ni Hotz ay ang mga inhinyero na may malakas na kakayahan ay karaniwang makakaintindi pa rin ng mga code na ginawa ng machine, makakakita ng mga butas, at makakapagdesisyon kung kailan pipiliin ang pagtitiwala sa kasangkapan; ngunit hindi lahat ng mga inhinyero na may mas mababang kakayahan ay may parehong kakayahang i-verify.

Kung gumamit ang huli ng isang proxy upang palakasin ang output sa ilang beses ang nakaraan, maaaring tumaas ang pangkalahatang efisensya ng tim, ngunit mas mabilis na bababa ang average na kalidad ng code, at ang pagbaba na ito ay maaaring malikha ng mas mataas na bilang ng pag-submit. Batay dito, babala si Hotz na maaaring makarating ang industriya sa isang malaking dami ng “mukhang gumagana, ngunit puno ng mga problema” na code.

Nagkakaroon ng malaking pagkakaiba kay Karpathy

Bago ma-publish ang artikulong ito, sumali si Andrej Karpathy, isang researcher sa AI, sa pre-training team ng Anthropic. Binanggit ng ulat na nagkaroon ng pagbabago si Karpathy sa kanyang pananaw tungkol sa AI agents sa taong ito, at naniniwala na malinaw na nagbago ng paraan ng pagbuo ng software ang mga bagong modelo.

Noong una, sinabi ni Dario Amodei, CEO ng Anthropic, na ang ilang inhinyero ng kumpanya ay nabawasan ang kanilang pagkakasulat ng code nang personal at nagpalit sa paggamit ng model para mag-generate ng code, na sinusuri ng tao. Ngunit ibinigay ni Hotz ang kabaligtarang karanasan: subukan niya ang katulad na proseso, ngunit sa huli, kailangan niyang i-adjust ang code nang personal sa halos bawat pagkakataon.

Dahil sa mabilis na pagtataas ng “vibe coding” sa nakaraang taon, ang mga pangunahing AI company ay nagpapakilala ng agent-based programming bilang pangunahing direksyon. Ang Microsoft ay nagsaliksik na ang GitHub Copilot sa isang mas kompletong agent-based system at inilarawan ang pagbabagong ito bilang isang platform-level shift.

Sa paniniwala ni Hotz, ang problema ay hindi kung takot ang mga programmer na palitan, kundi kung magkakaroon ba ng sobrang pagpapalaganap ng mga kasangkapan dahil sa presyong pangkalakalan. Tinukoy niya na kung ang mga malalaking kumpanya ay magpapalaganap nang buong team ng engineering sa AI coding tools, hindi naman siguradong masusulong ang kalidad ng software sa mga susunod na dalawang taon.