Media asing menyatakan bahawa alat pengaturcaraan AI telah berubah dari “pilihan” menjadi “konfigurasi lalai” dalam pasukan pembangunan, tetapi jangkaan optimis terhadap peningkatan kecekapan sedang ditarik balik semula kepada realiti berikutan peningkatan kos dan isu kualiti. Pelbagai kajian dan kes perusahaan menunjukkan bahawa AI memang mampu mempercepatkan penulisan kod, tetapi tidak semestinya mengurangkan kerja semula seterusnya.
Pembangun tidak lagi ingin meninggalkan AI
Institut penyelidikan AI METR mengungkap pada Februari tahun ini bahawa penyelidik awalnya ingin mengulangi satu eksperimen mengenai kecekapan pemrograman, membandingkan perbezaan antara pengembang yang menulis kod secara manual dengan yang menggunakan AI untuk menyelesaikan tugas, tetapi menghadapi rintangan semasa pelaksanaan: ramai pengembang bahkan tidak bersedia meletakkan alat AI sementara demi eksperimen.
METR sebelum ini menjalani ujian berkaitan pada tahun 2025. Peserta secara umum merasa kecekapan mereka lebih tinggi, tetapi keputusan pengukuran sebenarnya bertentangan: walaupun kod dihasilkan lebih pantas, pembangun perlu menghabiskan lebih banyak masa menunggu output model, membetulkan ralat, dan membimbing alat tersebut berulang kali untuk menyelesaikan tugas.
Kerana sukar untuk meneruskan penyertaan pembangun tanpa AI, METR kemudian menukar kepada pengedaran satu soal selidik untuk membolehkan kakitangan teknikal menilai faedah AI secara sendiri. Responden secara amnya percaya bahawa AI meningkatkan nilai kerja mereka sebanyak dua kali ganda.
Perusahaan mulai meninjau semula pelaburan AI
Artikel tersebut menyatakan bahawa penilaian "diri sendiri lebih efisien" semacam ini sedang diuji oleh perbelanjaan korporat dan output sebenar. Sejak 2026, Silicon Valley pernah menggemari penggunaan jumlah token yang digunakan untuk mengukur kekuatan penggunaan AI, bahkan menjadikannya sebagai indikator proxy produktiviti, tetapi pendekatan ini kini telah mengalami reaksi negatif yang jelas.
The Financial Times melaporkan minggu ini bahawa Amazon telah menutup senarai peringkat token dalaman Kirorank, kerana pekerja menggunakan agen AI secara berlebihan untuk "menggoreng" senarai peringkat, yang meningkatkan kos tanpa peningkatan hasil yang sepadan.
The Information melaporkan bahawa Uber telah menghabiskan anggaran AI tahunan mereka dalam empat bulan pertama tahun 2026. Ketua pegawai operasi syarikat, Andrew Macdonald, baru-baru ini menyatakan dalam podcast bahawa perbelanjaan sebegini belum membawa pertumbuhan projek atau peningkatan produktiviti yang boleh diukur.
Lebih pantas menulis kod, bukan bererti kurang penjagaan
Artikel tersebut berpendapat bahawa masalah yang lebih besar ialah penjagaan kod. Programmer dan penulis James Shore baru-baru ini menunjukkan dalam sebuah blog yang banyak dibahagikan bahawa jika kelajuan penulisan kod meningkat dua kali ganda, tetapi kos penjagaan tidak menurun secara sepadan, maka pasukan hanya menukar peningkatan jangka pendek kepada beban jangka panjang.
Mengenai perkara ini, terdapat banyak data di pasaran. Aiswarya Sankar, pendiri syarikat kejuruteraan kebolehpercayaan Entelligence AI, menyatakan bahawa sekitar 44% penggunaan token perusahaan digunakan untuk memperbaiki kecacatan yang dihasilkan oleh AI. Syarikat alat semakan kod Code Rabbit juga menyatakan bahawa analisis mereka terhadap permintaan tarikan projek sumber terbuka menunjukkan bahawa jumlah masalah yang dibawa oleh kod yang dihasilkan AI adalah 1.7 kali ganda berbanding kod buatan manusia.
Walaupun data ini berasal daripada penyedia perkhidmatan yang berkaitan dan mengandungi faktor sikap yang jelas, penyelidikan bebas juga memberikan amaran yang serupa. Pada bulan April tahun ini, penyelidik dari Universiti Pengurusan Singapura menerbitkan laporan yang menyatakan bahawa kod yang dihasilkan oleh AI mungkin membawa kos penjagaan jangka panjang kepada projek perisian sebenar.
Penyelidik mencadangkan untuk mengurus AI sebagai "pengembang peringkat awal"
Mengenai cara menangani masalah ini, artikel tersebut menyebut bahawa sebahagian pembuat agen pemrograman AI berpendapat untuk terus menggunakan lebih banyak AI untuk memperbaiki masalah yang dihasilkan oleh AI. Scott Wu, pendiri Cognition, pembangun agen pemrograman AI Devin, memegang pandangan ini.
Namun, beliau juga mengakui bahawa Devin, walaupun mampu menyelesaikan sebahagian tugas secara berdiri sendiri, kemampuannya pada masa ini masih berada di antara peringkat pengaturcara peringkat permulaan hingga pertengahan, bergantung kepada jenis tugas. Ini bermakna, pasukan pembangunan masih belum boleh menyerahkan sepenuhnya tugas kepada agen dan membiarkannya berjalan sendiri.
Sebaliknya, cadangan daripada penyelidik Universiti Pengurusan Singapura lebih cenderung kepada pengawasan manusia: pembangun perlu memahami sempadan tugas yang menjadi kekuatan dan kelemahan AI, membina proses jaminan kualiti yang berfokus pada output AI, dan mengulas hasil yang dihasilkan oleh model sebagaimana mengulas kod jurutera peringkat permulaan.
Artikel tersebut menyimpulkan bahawa pembangun manusia masih tetap menjadi pemutus utama dalam kerja-kerja peringkat tinggi seperti arkaitektur perisian dan reka bentuk keselamatan, satu perkara yang secara umum disetujui oleh mereka yang menyokong agen AI.
