Editör Notu: AI Agent'lar giderek daha ucuz ve daha kolay erişilebilir hale geldikçe, yazılım geliştirme yeni bir aşamaya giriyor: soru artık daha fazla Agent başlatıp başlatamayacağımız değil, insanların bunların çıktılarını yönetmek, yargılamak ve birleştirmek için yeterli dikkate sahip olup olmadığı.

Bu makale, "düzenleme vergisi" adlı çok ilham verici bir kavram ortaya atıyor. Bir Agent’ı başlatmak için düşük maliyetli; sadece bir Prompt veya bir tıklama yeterli. Ancak gerçek maliyet, sonuçların doğruluğunun kontrol edilmesinde, sistemin mimarisi üzerindeki etkisinin anlaşılmasında, farklı Agent’lar arasındaki çatışmaların çözülmesinde ve nihayetinde hangi kodların ana dalga dahil edileceğine karar vermede yatar. Bu işler basitçe paralelleştirilemez; hâlâ aynı sıralı kaynakta kalır: insanın yargı gücü.

Yazar, geliştiricileri AI Agent sistemindeki, paralel sistemin nihai verimliliğini sınırlayan tek iş parçacıklı kilit olan "GIL" ile karşılaştırıyor. Birden fazla Agent aynı anda çalışabilir, ancak mimari değerlendirme, kod incelemesi ve çakışma birleştirme aşamalarına girildiğinde, tüm işlemler tekrar geliştiricinin zihninden geçmek zorundadır. Bu nedenle, Agent sayısı arttıkça çıktı mutlaka artmayabilir; bunun yerine, incelenmesi bekleyen görevlerin listesi daha da uzayabilir ve geliştirici daha sık context switch'lere ve bilişsel yorgunluğa maruz kalabilir.

Bu, şu anki AI programlama araçları dalgasında kolayca gözden kaçırılan bir noktadır: verimlilik hissi ve gerçek üretkenlik her zaman aynı şey değildir. Ekranı dolduran bir Agent panosu, «yüksek üretkenlik» yanılsaması yaratabilir; ancak geliştiriciler bu değişiklikleri gerçekten anlayamaz, inceleyemez ve entegre edemezse, sistem sonunda üretkenlik değil, teknik borç ve bilişsel borç biriktirebilir.

Bu nedenle, bu makale aslında “daha fazla Agent nasıl kullanılır” değil, “çalışma akışlarını insan dikkatine göre yeniden nasıl tasarlanır” konusunu tartışmaktadır. Agent eraında, temel beceri sadece soru sormak ve görevleri dağıtmak değil, hangi görevlerin makineye paralel olarak verilebileceğini ve hangi görevlerin insan kararına bırakılması gerektiğini bilmektir; ne zaman toplu inceleme yapılmalı, ne zaman düzenlemeyi durdurup bir ana soruna odaklanılmalıdır.

Yapay zeka, yazılım üretiminin eşzamanlı kapasitesini genişletiyor, ancak insan dikkati hâlâ sistemde en kıymetli ve kopyalanamaz kaynaktır. Gerçekten olgun bir Ajan iş akışı, tüm görevleri makineye bırakmak değil, dikkat mimarinizi üretim sistemi gibi dikkatlice tasarlamaktır.

Aşağıda orijinal metin yer almaktadır:

Artık daha fazla AI Agent başlatmak çok daha kolay. Ancak daha fazla Agent aynı anda çalıştırmanın, sizin de çoğaldığı anlamına gelmediği unutulmamalı. Sizlerin bunları yönlendirmek, sonuçları değerlendirmek ve düzenlemek için kullandığınız tüm karar verme yeteneği, nihayetinde aynı seri işlemci—yani siz—aracılığıyla geçmek zorunda.

“Düzenleme vergisi” denilen şey, aslında bunu unuttuğunuzda ödediğiniz maliyettir. Tek gerçek çözüm, kendi dikkatinizi herhangi bir paralel sistem gibi tasarlamaya başlamaktır.

Daha önce Google I/O'da Richard Seroter, Aja Hammerly ve Ciera Jaspan ile bir masa turu tartışmasına katıldım ve yazılım mühendisliğinin şu anki durumunu ve gelecekte nasıl evrilebileceğini konuştuk. Tartışma sonuna yaklaştığında, Richard bize şunu sordu: Geliştiriciler bu konuşmadan sonra en çok neyi alıp değiştirmeli?

Dikkat mimarisi

Bu birkaç aydır sürekli düşündüğüm noktayı söyledim: Çok meşgul hissetmek, gerçek bir çıktı üretmek anlamına gelmez. Aynı anda 20 adet Agent çalıştırabilir ve çok meşgul olduğunuzu hissedebilirsiniz. Ancak bu, 20 adet Agent'e karşılık gelen iş yükünü teslim ettiğiniz anlamına gelmez.

O diyalogun daha erken kısmında, Richard bu soruna bir isim verdi. Şöyle dedi: "Daha önce bahsettiğiniz şey aslında vergi düzenlemesi. Zihninizde 20 adet Agent yönetmek mümkün değil."

Tamamen doğru söylüyor. Bu, disiplin meselesi değil, yapısal bir sorun olduğu için kavramı daha tam olarak parçalayayım.

O masa round'un bir cümlesi, neredeyse ağızdan çıktı ve sonra kafamda sürekli döndü: Birden fazla Agent çalıştırmak, dünyada bir tane daha senin olmadığını anlamına gelir.

Hesaba katılmayan asimetri

Agent iş akışında gizli bir asimetri vardır.

Bir Agent başlatmak çok ucuzdur. Sadece bir tuşa basmanız veya bir Prompt yazmanız yeterlidir. Ancak Agent'in döngüsünü tamamlamak çok ucuz değildir. Agent'in döndürdüğü sonuçların doğru olup olmadığını kontrol edip, diğer Agent'lerin değiştirdiği içeriklerle yeniden uyum sağlaması gereken biri olmalıdır.

Bu kişi sensin. Ve sen sadece bir tanesin.

Geçen ay, "Paralel Agent Sınırlarınız" adlı yazımda bu sorunun bir kısmını ele almıştım; özellikle hangi paralel iş parçacığının sessizce başarısız olduğunu bilmediğiniz durumdaki çevresel kaygıyı tartışmıştım. Bu makale, bu maliyetin arkasındaki yapıyı ele almayı amaçlıyor.

Agent geliştirme konusunu bir paralel sistem olarak gördüğünüzde, insanın sadece bu sistemin bir bileşeni olduğunu fark edersiniz. Çok yavaş bir seri bileşen.

Sen o tek iş parçacıklı kaynaksın

Eğer eşzamanlı kod yazdıysanız, bu sorunu anlamanın sezgisini zaten sahipsinizdir. Sadece bu sezgiyi daha önce yanlış yerde kullandınız.

Python, GIL olarak bilinen küresel yorumlayıcı kilitine sahiptir. İstediğiniz kadar iş parçacığı oluşturabilirsiniz, ancak aynı anda yalnızca bir iş parçacığı, bu kilit alınana kadar Python bayt kodunu çalıştırabilir.

Sen, AI Agent'in GIL'sin.

Bunlar aynı anda çalışabilir. Ancak sistem mimarisini gerçekten anlama veya birleştirme çatışmalarını çözme ihtiyacı duyulduğunda, bu kilit alınmalıdır. Ve bu kilit sadece bir tane vardır, sizde tutulur.

Amdahl Yasası, bu durumu çok net şekilde ifade eder: Paralelleştirmeden kaynaklanan hızlanma sınırı, hâlâ sıralı olarak tamamlanması gereken işin oranına bağlıdır. Süreçlerinizde paralelleştirilemeyen büyük bir bölüm varsa, ne kadar çok çekirdek harcarsanız harcayın, nihayetinde bir üst sınıra çarparaksınız.

Agent geliştirme sürecinde, bu seri bölüm karar verme yeteneğidir.

8 Agent başlatmak, karar verme sürenizi hızlandırmaz. Sadece işlem bekleyen kuyruğunuzu uzatır.

Performans mühendisliğinde bu oldukça eski bir gerçek olmakla birlikte, birçok kişi hâlâ bunu şaşırtıcı bulur: Sıkışma noktasının dışındaki kısımları optimize etmek, toplam verimliliği artırmaz. Sadece tamamlanmamış işleri sıkışma noktasının önüne yığarsınız.

Agent'in artırılması, zaten kısıt olmayan kısmı optimize eder. Gerçek kısıt, inceleme aşamasıdır ve tüm sistemin verimliliği tam olarak bu aşamanın verimliliğine eşittir.

Düzenleme vergisi, ajentin üretim kapasitesi ile sizin gerçek olarak birleştirebileceğiniz şeyler arasındaki yapısal boşluktur. Bu, tek iş parçacıklı bir kaynakla eşzamanlı bir sistem yönetmeye çalıştığınızda ortaya çıkar.

Yapısal üst sınırları zorla aşmak mümkün değildir.

O yuvarlak masa toplantısında, şu cümleyi söyledim: Araçlarım şimdiye kadar hiç olmadığı kadar verimli hissediliyor, ancak şimdiye kadar hiç olmadığı kadar yorgun da hissediyorum.

Bu iki duygu da tamamen gerçek ve aynı nedenden kaynaklanıyor.

Bu yorgunluğun çok spesifik bir kaynağı var: seri bir işlemciyi %100'e kadar sürekli yüklemek ve hiçbir boşluk bırakmamak hissidir.

Her seferinde dikkat alanınızdan ayrılan bir Agent'i kontrol ettiğinizde, bir bağlam geçiş maliyeti ödersiniz. Zihninizi boşaltıp başka bir bağlamı sıfırdan yeniden yüklemek zorundasınız.

CPU bu işi mikrosaniyeler içinde tamamlayabilir, ancak mimarlar hala sıklıkla geçiş yapmaktan kaçınır. Siz ise bunu tamamlamak için dakikalar harcarsınız ve asla bağlamı mükemmel şekilde geri yükleyemezsiniz.

5 adet Agent, 1 kat iş yükünü 5 kez tekrarlamak değildir. Bu, 5 kez soğuk başlatma tabanlı bağlam yenilemesi ve arka planda sürekli çalışan, şu anda hangi Agent’i kontrol etmeniz gerektiğini sürekli endişelenen bir beyni içerir.

Yapısal bir sınırlamayı daha fazla çaba göstererek çözemezsiniz. Bu vergi her zaman ödenmelidir.

Eğer zorla direnmeye çalışırsanız, sonunda başka bir biçimde ortaya çıkar: ya kod incelemeleri giderek daha yüzeysel hale gelir, ya da kendi yargılarınızı oluşturmak çok fazla dikkat tükettiği için "bilişsel teslim" durumuna girersiniz—ve Agent'in yazdığı kodu doğrudan kabul edersiniz.

Bu vergiyi ya aktif olarak ödersiniz, ya da karanlıkta kendi sisteminiz hakkındaki anlayışınızı yavaşça yok etmesine izin verirsiniz.

Dikkatinizi bir sistem gibi tasarlayın

Bu nedenle, dikkatinizi nadir bir seri kaynak olarak ele almalısınız.

Dağıtık bir sistem tasararken tamamen bir darboğaz düşünmeyebilirsiniz. O zaman beyninize de aynı saygıyı gösterin.

Şunlar benim için gerçekten işe yarayan bazı yöntemler:

Gözden geçirme yeteneğine göre Agent ekibini genişletin, UI yeteneğine göre değil.

İyi bir eşzamanlı sistem, kuyruğun sonsuz büyümesini önlemek için geri basınç mekanizması kullanır. Üreticiler, tüketicinin işleme kapasitesine uyum sağlamak için hızlarını azaltmalıdır.

Agent sayınız üreticidir, inceleme yeteneğiniz tüketicidir. Doğru paralel Agent sayısı, kod incelemesini dikkatle tamamlayabileceğiniz sayıdır. Çoğu insan için bu genellikle çok düşük bir tek basamaklı sayıdır.

AI araçları elbette 20 adet Agent başlatmanıza izin verecek, ancak bu yalnızca bir UI özelliğidir ve bunları gerçekten yönetme yeteneğiniz olduğu anlamına gelmez.

Görevleri kategorilendirin.

Richard, bu durumu nasıl çözeceğimi sorduğunda, bu yöntemi bahsetmiştim. Görevleri iki yığına ayıracağım.

Birinci grup, nispeten bağımsız bir işdir ve bunu bulut arka planında çalışan Birime vermek isterim. Bu görevler asenkron olarak yürütülebilir ve genellikle son aşamada yalnızca bir kez denetimim gereklidir.

İkinci grup, karmaşık görevlerdir; gerçek iş, yargılamaktır. Örneğin, çok garip bir hata veya bir mimari tasarım.

Yapabileceğiniz en büyük hata, ikinci tür görevleri de paralelleştirmeye çalışmaktır. Birden fazla karmaşık görevi paralel işlemek, üretiminizi artırmaz; sadece o kiliti sürekli olarak çekişme haline getirir ve sonuçların hepsi daha kötüleşir.

Toplu inceleme.

Her bağlam değişikliği yüksek bir maliyet getirir. Bir agentin sonucunu inceleyip başka bir şeyle uğraşarak sonra başka birine geri dönmekten, dört agentin sonucunu tek seferde incelemek çok daha ucuzdur.

Agent'e daha uzun bir çekme iple verin. İşleri biraz biriktirin, ardından onları bir toplu olarak işleyin.

Bu kilit yalnızca yargılamada kullanın.

Beyninizi makinenin kendi kendine doğrulayabileceği şeylere harcamayın. Agent'e geçerli testleri yazdırın veya ekran görüntüsü oluşturun.

Onların %80'lik, sıkıcı ama doğrulanabilir kısmını kendi kendilerine kanıtlamalarına izin verin. Böylece, nadir olan dikkatiniz sadece insan kararı gerektiren %20'ye odaklanacaktır.

Sıra sürenizi koruyun.

Boğaz, birkaç Agent kontrolü arasında kalan parçalanmış zamanınız değil, en iyi zamanınızı gerektirir.

Bazen en yüksek kaldıraç hareketi, tamamen kurguyu durdurmaktır: Agent'larla dolu bilgisayarı kapatın, sadece bir sorunu düşünün ve süreç boyunca o anahtarı sıkıca tutun.

Düzenleme gerçek bir iş değildir. Sadece işin etrafında oluşan maliyetlerdir.

Aja, mimari becerisinin artık en acil beceri olduğunu belirtti: Hangi görevlerin bir Agent'e uygun olduğunu, hangi görevlerin ise için çok büyük olduğunu bilmelisiniz.

Bir şey daha eklemek istiyorum: sen de bu sistemin bir bileşeniysin. Dikkatin, bilinen ve oldukça düşük bir seri verimliliğe sahip. Sistem bu sayıyı saygıyla karşılar ya da onu gizlice düşürerek atlar.

Meşgul olmak yüksek verimlilik anlamına gelmez

Bu nokta çok önemlidir, çünkü bu tür bir hata modu sizin için neredeyse görünmezdir.

20 adet çalışan Agent, size bir «verimlilik patlaması» hissi verir. Panonuz doludolu, her şey hareket halindedir. Ancak bu his, kaliteli kodların ana kola entegre edilmesiyle tamamen ayrılmıştır.

En fazla meşgul olabilirsiniz, ancak neredeyse hiçbir gerçek çıktı üretmezsiniz. İçsel deneyim açısından, bunlar neredeyse tamamen aynıdır.

Ciera, Margaret-Anne Storey'nin borçlar üzerine olan araştırmasını aktardı. Teknik borç ve bilişsel borç hakkında konuştuk.

Ödenmeyen düzenlemeler vergisi, aynı anda bu iki borcu biriktirmenize neden olur.

Dikkatlice okumadığınız şeyleri birleştirdiniz. Kod tabanı hakkında zihinsel modeliniz tamamen güncellemeye ihtiyaç duyuyor. Bu sorunlar bugün panoda görünmeyecek. Üretim ortamında arıza olduğunda ortaya çıkacak—o anda sisteme bakıp, tam olarak nasıl çalıştığını artık bilmediğinizi fark edeceksiniz.

Yani gerçek sonuç şudur: Agent başlatmak bir yetenek değil. Herkes 20 tane çalıştırabilir.

Gerçek yetenek, klonlanamayan ve paralelleştirilemeyen seri kaynak etrafında sistem tasarlamaktır.

Bu kaynak, dikkatinizdir.

Bunu, üretim ortamında kullanılan kritik bileşenler gibi tasarlayın.