外媒稱,AI 編程工具在開發團隊中已從「可選項」變成「預設配置」,但關於效率提升的樂觀預期,正被更多成本與品質問題拉回現實。多項研究和企業案例顯示,AI 確實能加快寫代碼的速度,卻未必能減少後續返工。
開發者已不願脫離 AI 工作
AI 研究機構 METR 在今年 2 月披露,研究人員原本想重複一項關於程式設計效率的實驗,比較開發者手寫代碼與借助 AI 完成任務的差異,但在推進過程中遇到阻力:不少開發者甚至不願為了實驗短暫放棄 AI 工具。
METR 此前於 2025 年進行過相關測試。參與者普遍感覺自己效率更高,但實際測量結果卻相反:雖然生成代碼更快,開發者卻要花更多時間等待模型輸出、糾正錯誤,並反覆引導工具完成任務。
由於難以讓開發者在無 AI 的情況下繼續參與,METR 後來改為發佈一份調查,讓技術員工自行評估 AI 帶來的收益。受訪者普遍認為,AI 讓自己的工作價值提升了一倍。
企業開始重新審視 AI 投入
文章指出,這類「自我感覺更高效」的判斷,正受到企業支出和實際產出的檢驗。自 2026 年以來,矽谷一度流行用 token 消耗量衡量 AI 使用強度,甚至把它當作生產力代理指標,但這種做法已出現明顯反噬。
英國《金融時報》本周報道稱,亞馬遜已關閉內部 token 排行榜 Kirorank,原因是員工透過過度調用 AI 代理來「刷榜」,推高了成本,卻未帶來相應的產出改善。
《The Information》則報道,Uber 在 2026 年前四個月就用完了全年 AI 預算。公司首席運營官 Andrew Macdonald 近期在播客中表示,此類支出尚未帶來可量化的項目增長或生產力提升。
寫代碼更快,並不等於維護更少
文章認為,更大的問題在於代碼維護。程式設計師兼作者 James Shore 近日在一篇被廣泛轉發的部落格中指出,如果寫代碼速度提升了一倍,但維護成本沒有同步下降,那麼團隊只是把短期提速換成了長期負擔。
圍繞這一點,市場上也出現了不少數據。可靠性工程初創公司 Entelligence AI 創始人 Aiswarya Sankar 表示,企業約 44% 的 token 消耗被用於修復 AI 生成的缺陷。代碼審查工具公司 Code Rabbit 也稱,其對開源項目拉取請求的分析顯示,AI 生成代碼帶來的問題數量是人工代碼的 1.7 倍。
雖然這些數據來自相關服務提供方,存在明顯立場因素,但獨立研究也給出了相近提醒。新加坡管理大學研究人員今年 4 月發布報告稱,AI 生成代碼可能給真實軟件項目帶來長期維護成本。
研究人員建議將 AI 當作「初級開發者」管理
關於如何應對,文章提到,部分 AI 編程代理廠商主張繼續用更多 AI 去修復 AI 生成的問題。AI 編程代理 Devin 的開發商 Cognition 創始人 Scott Wu 就持這一看法。
不過,他也承認,Devin 雖然可以獨立完成部分任務,但當前能力大致仍處於初級到中級程式設計師之間,取決於任務類型。這意味著,開發團隊還無法把工作完全交給代理後放手不管。
相比之下,新加坡管理大學研究人員提出的建議更偏向人工把關:開發者需要清楚 AI 擅長和不擅長的任務邊界,建立面向 AI 輸出的質量保障流程,並像審查初級工程師代碼一樣審查模型生成結果。
文章最後指出,在軟體架構、安全設計等高層級工作上,人類開發者仍然是主要決策者,這一點連支持 AI 代理的從業者也基本認同。
