George Hotz Memperingatkan Bahawa Agen Pemrograman AI Mungkin Merosakkan Kualiti Kod

Laman web berita kripto melaporkan:

Komen media asing menyatakan bahawa perbincangan mengenai agen pemrograman AI sedang berpindah dari “bolehkah ia meningkatkan kecekapan” kepada “akankah ia merosakkan kualiti kejuruteraan”. Haker George Hotz, yang sebelum ini berjaya menembusi jailbreak iPhone generasi pertama dan PlayStation 3, baru-baru ini menulis bahawa penggunaan besar-besaran alat-alat ini dalam industri perisian mungkin menjadi kesilapan yang sangat mahal harganya dalam bidang ini.

Memberikan penilaian negatif selepas ujian enam bulan

Hotz menyatakan bahawa beliau tidak hanya mengkritik dari luar. Dalam enam bulan terakhir, beliau terus menggunakan agen AI dalam projek nyata, termasuk sebahagian pembangunan kerangka pembelajaran mendalam sumber terbuka tinygrad, serta proses reverse engineering penuh firmware cip USB-PCIe.

Kesimpulannya, alat-alat semacam ini seringkali memberikan kemajuan pantas pada peringkat awal, tetapi semakin ke belakang, semakin sukar untuk menyelesaikannya. Secara lahiriah, output model semakin kelihatan baik, tetapi masalah sebenar lebih sukar untuk dikesan pada masanya. Menurutnya, pembangun akhirnya masih perlu kerap membaiki hasil secara manual.

Perbezaan bukan pada kecekapan, tetapi siapa yang akan menanggung kerugian

Artikel tersebut berpendapat bahawa risiko sebenar bukan sahaja sama ada output tunggal mengandungi kesilapan, tetapi sama ada kawalan kualiti di peringkat organisasi akan gagal. Penilaian utama Hotz ialah jurutera yang berkebolehan tinggi biasanya masih mampu membaca kod yang dihasilkan, mengesan lubang keamanan, dan menentukan kapan untuk mempercayai alat tersebut; tetapi jurutera yang kurang berkebolehan mungkin tidak memiliki kemampuan semakan yang sama.

Jika yang terakhir menggunakan agen untuk memperbesar output hingga beberapa kali ganda daripada sebelumnya, kecekapan permukaan pasukan mungkin meningkat, tetapi kualiti kod purata akan menurun lebih cepat, dan penurunan ini akan ditutupi oleh jumlah penghantaran yang lebih tinggi. Hotz memperingatkan bahawa industri mungkin akan menghadapi banyak kod yang "kelihatan berfungsi tetapi sebenarnya penuh dengan masalah".

Berkontras tajam dengan Karpathy

Tidak lama sebelum artikel ini diterbitkan, penyelidik AI Andrej Karpathy baru saja menyertai pasukan pra-pelatihan Anthropic. Laporan tersebut menyebut bahawa sikap Karpathy terhadap agen AI telah berubah tahun ini, dengan beliau percaya bahawa model generasi baharu telah mengubah cara pembangunan perisian secara ketara.

Dario Amodei, CEO Anthropic, sebelumnya juga menyatakan bahawa sebahagian jurutera syarikat telah mengurangkan peratusan penulisan kod secara manual, dan beralih kepada penghasilan kod oleh model, diikuti dengan semakan oleh manusia. Hotz pula memberikan pengalaman yang bertentangan: beliau mencuba proses serupa, tetapi hampir setiap kali perlu memperbaiki sendiri.

Seiring dengan populariti "vibe coding" yang pesat dalam setahun terakhir, syarikat AI utama telah menjadikan pengaturcaraan agen sebagai arah utama. Microsoft juga telah memperkenalkan GitHub Copilot ke dalam sistem agen yang lebih lengkap, dan menggambarkan perubahan ini sebagai peralihan peringkat platform.

Hotz berpendapat, masalahnya bukan sama ada pengaturcara bimbang akan digantikan, tetapi sama ada syarikat akan mempercepatkan pelaksanaan alat-alat tersebut di bawah tekanan persaingan. Beliau secara khusus menyebut bahawa jika syarikat besar menerapkan alat pengkodean AI secara seragam di seluruh pasukan kejuruteraan, kualiti perisian dalam dua tahun ke depan belum tentu akan meningkat.