Claude'nin Derin Araştırmalar İçin Dinamik İş Akışlarını Nasıl Kullanılır

Bu üç yıl boyunca, endüstri araştırmaları yapmak için AI destekli olmaksızın kalamadım ve bilginin filtrelenmesi, özetlenmesi, bağlantılandırılması, doğrulanması ve biriktilmesi için bir dizi beceri ve yardımcı sistem kurdum.

Bu hafta Claude Code'un dinamik iş akışını derinlemesine deneyimleyene kadar, "İnsan büyük çağa karşı gelmemelidir" sözünün gerçek anlamını anladım.

AI çağında insanın yapması gereken derin araştırmalar nelerdir ve AI ile nasıl bir iş birliği ve tamamlayıcı ilişki kurulur?

Birinci olarak, anket tuzaklarından başlayalım

Teknik araştırmalar yapmak aslında bir sürü tuzağa sahiptir (hem insanlar hem de AI için), çünkü araştırmaya başladığınızda çok sayıda bilgi alırsınız, bilgi ve görüşler arttıkça sonuçlar giderek bulanıklaşır. Bu nedenle her zaman hedefe dönmeyi bilmelisiniz.

Bu, neden AI'nın yeterince iyi olmadığını her zaman gösterir, çünkü dikkat ve bağlantı kurma açısından, insanlardan daha çok mevcut bilgi miktarına bağlı kalır ve gerçekten değerli çapraz bağlantılar yapmakta zayıftır.

Elbette AI'nın güçlü olduğu yer, yürütme yeteneğidir; agent formunda katman katman arama, sınıflandırma ve özetleme yaparak detay kaybını tamamen önleyebilir.

Bu yarım yıl boyunca sosyal medya kanalıma pek çok içerik paylaşmadım, ancak sektördeki neredeyse tüm anahtar alanları kapsamlı olarak izliyorum ve araştırıyorum; bu girdi ve çıktıları destekleyen ise kendi derin araştırmam sistemimdir.

Geçen hafta Claude Code'un Dinamik İş Akışları özelliğini piyasaya sürmesiyle, varsayılan yeteneklerinin beni tamamen aşıp aşamayacağını görmek için bir yarışa girmek istedim.

İkinci: Dinamik İş Akışları nedir

Dinamik İş Akışları, görevi gerçekleştirmeden önce AI'nın bu görevin hangi iş akışıyla tamamlanması gerektiğini otomatik olarak tasarlaması ve ardından yürütülmesini başlatması fikrine dayanır.

Bu, daha önce kullandığımız "plan modu" ve "beceri" ile temel farklılıklar taşır. Plan modu, görevleri daha da küçük parçalara ayırır, ancak her zaman mantıklı bir iş akışıyla uyumlu olmayabilir; sadece ipuçlarınızı düzenledikçe, kabul kriterleri eklenme olasılığı ortaya çıkar (bu, Araştırma için kritik öneme sahiptir). Benzer şekilde, yalnızca ipuçlarınız varsa, bazı harnes kurallarını daha iyi önceden ayarlayabilir.

Ancak dinamik iş akışı, kabul mantığını, sonuçların birleşimini ve karşılaştırma doğrulamasını otomatik olarak dahil eder.

Tetikleme yöntemi çok basit: cc içinde doğrudan /deep-research komutunu kullanın ve bazı araştırma şablonları ile giriş materyalleri sağlayın. Dinamik iş akışı özelliğini ayrı olarak kullanmak istiyorsanız, talimat olarak ultracode yazın veya doğrudan söyleyin. Kullanmadan önce, token tüketiminin normalde olduğundan onlarca kat daha fazla olacağını unutmayın.

Üç: Dahili Altı İş Akışı Modu

Dinamik iş akışının temelinde, bunun normal diyalog/agent/beceriden daha güçlü olmasının nedeni olan resmi olarak özetlenen altı temel zamanlama modeli yer alır.

Aslında bu altı modun arkasında sadece iki temel soru var: Görevler nasıl ayrılır? Sonuçlar nasıl birleştirilir? Altı farklı modun temelinde bunların permütasyonları yatıyor.

3.1 Yönlendirme Modu (Sınıflandır ve Uygula)

Bir görevin türü önce bir ajan tarafından belirlenir, ardından en uygun özel ajanlara yönlendirilir. Temel mantık, rota seçimi mantığıdır, paralel veya yinelemeli değildir. Bir görev yalnızca bir yol izler, diğer yollar tamamen yürütülmez.

Resim

Örneğin, üç önceden tanımlanmış alt ajan rolüne sahip olabilirim: bir veriyi sıkıca doğrulayan analiz ajanı, yazım konusunda uzman bir çıktı ajanı ve açıkları bulmaya odaklanan bir meydan okuma ajanı. Rota katmanı, mevcut alt görevin kimin tarafından yürütüleceğini belirler, bir ajanın tüm işi tek başına üstlenmesini engeller.

Bu modelin değeri, hassasiyet ve tasarrufdadır; her bir agentin talimatları diğer hedeflerden bağımsız olarak özelleştirilebilir ve dikey derinlikte bir keşif oluşturur. Token tüketimi en düşük düzeydedir ve yanıt süresi en hızlıdır. Sorumluluk sınırları çok nettir.

Aynı zamanda sınırları belirsiz görevlerde (örneğin, "hem teknik sorun hem de hesap sorunu") performansı zayıftır.

3.2 Bölünme ve Birleştirme (Fan-out & Merge)

Aynı zamanda en çok kullandığım model, paralel + birleştirme temel mantığına dayanır. Görev, N adet bağımsız alt görev haline ayrılır ve hepsi aynı anda çalıştırılır; tümü tamamlandığında birleştirilir.

Resim

Avantaj, hız ve izolasyondur. Toplam süre, tüm alt görevlerin toplamı yerine en yavaş alt görevle eşittir. Her alt görevin kendi bağımsız bağlamı vardır, birbirini etkilemez ve bir alt görevin gürültüsü diğerlerini kirletmez.

Zayıf nokta, token maliyetinin N katı sıralı olması ve birleştirme katmanının (Synthesize) kendisinin zorlu olmasıdır—N yol farklı yapıdaki çıktıları nasıl birleştireceğiniz bir tasarım zorluğudur. Alt görevlerin iyi tanımlanmaması, eksikliklere veya tekrarlı kapsama yol açabilir.

3.3 Düşmanca Doğrulama

Temel mantık, aynı sonuca ulaşan birden fazla ajanın "itiraz" açısından eleştirmesidir ve oyların çoğunluğu ile geçerlidir.

Resim

Avantaj, Verifier'in Worker'un düşüncelerini bilmeden yalnızca sonucu görmesi nedeniyle, "modelin kendi yazdığı kodu kontrol etmesi" durumunda ortaya çıkan kendi kendini değerlendirme yanlılığını yapısal olarak ortadan kaldırmasıdır.

Bu model, uzun süredir beni rahatsız eden bir sorunu çözüyor: Sık sık yapay zekâyla günlük dilde konuşuruz, ancak yapay zekâ, beklentilerinize uygun şekilde cevap verme eğilimindedir ve "onaylama yanlılığına" yol açar. Karşıt doğrulama sayesinde yapay zekâya karşı örnekler bulmaya, verilere ve deneylere dayalı olarak doğrulama yapmaya zorlanır; sizin fikirlerinize uyum sağlamaz.

Ancak bu durumu doğrularken, eğer Verifier yanlış bir yargı verirse, Worker'ı yanıltarak Verifier'e uyum sağlamaya zorlayabilir. Bu nedenle öncelikle görüşlere değil, tekrarlanabilir gerçeklere dayanılmalıdır.

Sadece bir şaka yapayım, eğer bir yapay zekâya sorun bulmasını söylersen, sonsuz sayıda sorun bulabilir; bu yüzden onun sorun bulma sınırını sınırlamanız gerekir.

3.4 Oluşturma ve Filtreleme

Temel mantık, dağılıp sonra tekrar odaklanmaktır. Önce yapay olarak fazla aday üretin, ardından kriterlerle yalnızca yüksek güvenilirlikli sonuçları seçin.

Resim

Bir ajentin "iyi" bir cevap vermesi yerine, onu on cevap üretmeye zorlayın ve ardından bir doğrulama katmanıyla filtreleyin. Bu nedenle avantaj, çeşitliliktedir. Birden fazla üretici, farklı stratejiler ve farklı ipuçları kullanarak insanlar tarafından öngörülemeyen çözümler üretebilir; filtreleme adımı, nihai çıktı kalitesini yoğunlaştırır.

Zayıf taraf ise, Filter'in rubriği kalitesi sonucu doğrudan etkiler; rubrik tasarımı hatalıysa tüm süreç boşa çıkar.

Doğru cevabın önceden bilinmediği durumlar, çeşitli olasılıklar arasından en iyisini seçme gerekliliği ve çeşitlilik için açık bir ihtiyaç olduğunda uygundur.

Fanout-And-Synthesize ile sadece yüzeysel benzerlik vardır: ikisi de "çoklu paralel → tek çıktı" şeklindedir ve en çok karıştırılır.

Ana fark niyettedir: Fanout'un her yolu, görevin farklı bir kısmını işler ve sonuçlar birbirini tamamlar; birleştirildiğinde tüm yollar katkıda bulunur. Generate-And-Filter'in her yolu aynı görevi işler ve sonuçlar rekabet eder; birleştirildiğinde çoğu atılır. İlk durum "puzzle", ikinci durum "yarışma"dır.

3.5 Yarışma Modu (Tournament)

Temel mantık rekabet ve elemedir. N adet agent, tekil olarak aynı işi yapar, çiftli karşılaştırmalarla tur tur elenir ve en iyi çözüm seçilir.

Resim

Bunu daha önce elle yapmıştım—aynı kod değişikliğini iki veya üç versiyonda çalıştırdım, sonra AI'ya hangisinin daha iyi olduğunu karşılaştırmak için bıraktım. Şimdi bunu doğrudan iş akışına dahil edebiliyorum.

Avantaj, kararlılık değerlendirilmesindedir. Mutlak puanlama ("A'ya puan verin") yerine ikili karşılaştırma ("A ve B'den hangisi daha iyi?"), puanlama standartlarındaki kaymaların dışlanmasından dolayı çok daha kararlıdır. Sonuçlar, çok sayıda rekabet sonrası elde edilir ve kazananın güvenilirliği yüksektir.

Generate-And-Filter ile de yüzsel olarak benzer: ikisi de birden fazla aday arasından en iyiyi seçer. Ana fark, seçme mekanizmasındadır: Tournament, ikili değerlendirme ile adayları karşılıklı olarak kıyaslar, yani "adayların birbirleriyle yarışmasını sağlar". Rubrik nicelleştirilmesi zor olduğunda ve değerlendirme özgün olarak göreceli olduğunda, daha güvenilirdir.

3.6 Döngü Modu (Loop)

Temel mantık, uyumlu yinelemeli olup, sürekli denemeler yapar, engel karşılaşıldığında hata bilgileri toplanır, bağlam genişletilir ve kabul kriterleri sağlanana kadar yeniden denenir.

Resim

Temelde AI'nın rastgeleliğine karşı çıkmaktadır: birkaç kez daha deneyin, daha iyi bir sonuçla karşılaşacaksınız. Ancak daha olgun bir yaklaşım, her döngüyü sadece rastgeleliğe değil, karşı doğrulama ile birlikte daha fazla bilgiyle gerçekleştirmektir.

Avantajı, iş miktarı bilinmeyen görevlerle başa çıkma yeteneğidir. Diğer beş mod, görev sınırlarının belirli olduğunu varsayar; Loop Until Done, "kaç tur yapılacağını bilinmeyen" görevleri işleyen tek moddur.

Zayıf nokta, potansiyel kontrol kaybı riskidir—durdurma koşulları iyi tasarlanmazsa sonsuz döngü oluşur. Her turdaki agent tamamen yeni bir bağlamdır ve arka arkaya durumları biriktemez (dosyaya açıkça yazılmadıkça).

Dört: Kendi becerilerim ve resmi iş akışı arasındaki mücadele

Dinamik iş akışı çıkmadan önce kendi derin araştırmamı özel olarak tasarladım. O becerilerimin mantığı şöyleydi:

Midnight (NIGHT) Artık KuCoin'de!
AI'yi tüm ilgili kaynakları aramaya yönlendirin: resmi belgeler, kaynak kodu, pazar yorumları
Bilgiyi anlamlı bir özet haline getirin
Çoklu agent rolleriyle rekabetçi analiz yaparak rapor oluşturuyor
Otomatik tekrar kaldırma, çünkü çoklu ajan içeriklerinde tekrar oranı yüksektir

Bir süre kullandıktan sonra oldukça kullanışlı buldum. Ancak temel bir eksikliği var: hedefe yönelik yakınsama yok.

Ayrıca birçok durumda beşinci adımın tekrar kaldırılması bile olsa, bu sırada değerli bilgileri sıklıkla siler; tekrar kaldırılmazsa, beceri size on binlerce kelime uzunluğunda, tüm bilgileri içeren ancak "bu olay sizinle ne ilgili, ne yapmalısınız" gibi doğrudan bilgi vermeyen bir metin verir.

Ancak araştırma, "karar alma" hizmeti için yapılır; bu nedenle birçok beceri sadece araştırma düzeyinde kalır ve 80 puan alır, ancak en kritik 20 puan eksiktir.

Bu nedenle, AI ilk araştırmayı tamamladıktan sonra, memnun edici ve kapsamlı bir sonuca varmak için on kez daha düşünme ve diyalog yapmalıdır.

Resmi duyurular iş akışı ne daha fazla yaptı

Bu hafta yapılan birkaç karmaşık araştırma görevinin deneyimleri sonucunda, Claude Code'un yerleşik derin araştırma iş akışını (sadece beceri değil, CC'ye entegre edilmiş modül) inceledim ve kendi becerilerime kıyasla birkaç kritik aşama daha içerdiğini fark ettim:

Soruyu parçalama katmanı: Doğrudan aramaya başlamaz, önce sorular sorar, sorularımı birkaç alt soruya ayırır: Gerçekten neyi anlamak istiyorsunuz? Bu olay sizinle nasıl ilgili? Hangi boyutlar derinlemesine incelenmeye değer? Bu adımı daha önce atlıyordum.
Güvenilirlik Değerlendirmesi: Her bilgi için, geleneksel SEO'daki yetkinlik puanlaması gibi, doğrulanabilirlik değerlendirilir—kaynak güvenilir mi? Atıf sayısı nedir? Bu daha önce düşünmediğim bir aşama.
Çapraz silme, ortalama birleştirme yerine: Daha önce tüm sonuçları ortalama olarak seçiyordum, bu nedenle belge çok büyük oluyordu. Dinamik iş akışı, her sonucu çoklu ajan oylamasıyla değerlendirir ve yeterli oyu almayanları siler, basit bir birleştirme yapmaz.
Hedefe odaklı çıktı: Son rapor, bilgi yığını değil, orijinal hedefinize dayalı yargılar ve öneriler sunar. Bunu gerçekleştirmenin anahtarı, çoklu alt ajanların önceden tanımlanmış yeteneklerini yönetmektir. Daha önce neden becerilerim son hedefe odaklı olmuyordu, çünkü devasa bilgi sonrası talimat ağırlığının azalmasıydı.

Bu mekanizmalar hangi sorunları çözmektedir?

AI'nin uzun görevlerde karşılaştığı birkaç tipik soruna odaklanılıyor:

Hedef kayması: Görev başlangıcında durum iyi, ortada ne yaptığınız belli olmuyor, bitişte tekrar ritmi buluyorsunuz—insanların ders sırasında dikkatini kaybetmesine benzer. Görev ne kadar uzunsa, bu o kadar belirgin olur.

Erken durma: Koşarken zorlukla karşılaşıldığında, AI kendi kendine "tamamlandı" diye düşünüp duruyor, aslında kabul kriterleri henüz sağlanmadı.

Bağlam kirliliği: Tek bir ajanın karmaşık bir görevi yerine getirmesi, önceden verilen büyük miktarda prompt ile sonraki yürütme alanını daraltır. Daha iyi bir yaklaşım, öncü prompt'ları birkaç kB ile sınırlamak ve bağlamı birden fazla ajan arasında paylaşmaktır.

AI, beklentileriniz doğrultusunda cevap verme eğilimindedir; konuşma dilinde soru sormak bu sorunu tetiklemektedir.

Ancak dinamik iş akışı, bu dört sorunu yapılandırılmış bir şekilde çözer: erken durdurmayı önlemek için otomatik kabul ölçütleri ekler; paralel olarak bağlamları izole eder; doğrulama ile çıktı eğilimlerini dengelemek için mücadele eder; sorunu parçalara ayırır ve AI'nın önce hedefi anlayıp ardından eyleme geçmesini sağlar.

Beşinci: Özet

Son olarak, yazar olarak uzun yıllardır araştırmacı olarak çalışan biri olarak, bu CC yeni mekanizmasına hayran kalıyorum; içindeki altı mod—rota seçimi, bölme birleştirme, rekabetçi doğrulama, üretme filtreleme, turnuva seçimi, Loop döngüsü—çoğu karmaşık araştırma görevinin zamanlama ihtiyaçlarını kapsıyor.

Agent planlamayı elle tasarlamama gerek kalmadı, tekrarları ve çapraz doğrulamaları da kendim yapmama gerek kalmadı, bunlar tüm iş akışına dahil edildi.

Ayrıca, bilgi eksikliği ve açık uçlu soruların araştırılmasında düşünmek için özellikle uygundur, çünkü doğal olarak çok ajanlı zamanlama ve görev hedeflerinin ayrıştırılması, genel yeteneğini tekrar artırır. Aslında, 3 yıl önceki AI'lar, katmanlı kısıtlamalarla sadece çok net küçük soruları çözmek konusunda zaten çok iyi performans gösteriyordu, ancak AI'nın gerçek kalitatif değişimine neden olan şey genel yetenektir; bu, rakiplerini basit kodlardan gerçek bir ajanlara, sabit bir sorunu çözmekten herhangi bir soruna uyum sağlamaya dönüştürmüştür.

Dinamik İş Akışları, "daha akıllı bir tek konuşma" değil, araştırma sürecini kendisi yapılandırmaktır.

Daha önce onlarca bağımsız diyalog gerçekleştirmem gerekiyordu, şimdi bu sayı 3-4'e indi. Bununla birlikte, karşılık gelen Token tüketimi onlarca kat arttı.

Peki neden hâlâ 3-4 kez daha gerekli? Benim düşünceme göre kök neden bu ihtiyaçlardaki farklılıklardır.

İlk olarak doğrulama mekanizmasının sertliği; ben temel olarak blok zincirindeki yeni teknolojilere odaklanıyorum ve birçok konuda resmi belgeler geride kalıyor, daha değerli referanslar olarak açık kaynak kodları, zincir üzerindeki işlemler ve diğer veriler var; ancak şu anda AI varsayılan olarak gerçekçi doğrulama yerine resmi belgeleri temel alıyor.

İkinci, tamamen disiplinler arası derin düşünmedir; bu, iş akışı ön tanımları (farklı boyutlardaki alt ajanları önceden tanımlayarak) aynı soruyu düşünmek için biraz çözülebilir. Ancak AI'nın güçlü olduğu hâlâ ana akım düşünme modelleridir; çok yeni, çok derin ve veriye dayalı olmayan durumlar için biraz yetersiz kalır.

Üçüncü, çözüm tasarımı ve doğrulamasıdır; çözümün amacı öne sürmekten ziyade doğrulamak ve desteklemektir, bu da mevcut mekanizmalar, yatırımlar ve maliyetlerin ölçülmesine dayanır. AI iyi şekilde eğitilirse daha iyi sonuçlar elde edilebilir, ancak bu genellikle uyumluluğu ihlal eder.

Son olarak, bilginin en yoğun hali, bilginin hedef kitlesinin ne kadar farkında olduğuna dönüştürülür; bazıları tamamen temel bilgiye sahip değildir ve insanla benzer şekilde ifade etmeniz gerekir, bazı dinleyicilerse bir cümleyle etkilenir~.