Paano Gamitin ang Dynamic Workflows ni Claude para sa Malalim na Pag-aaral

Sa loob ng tatlong taon, hindi na ako makalayo sa paggamit ng AI para sa pag-aaral ng industriya, at para sa gayon, isinagawa ko ang pagbuo ng isang serye ng skill at mga辅助系统 upang lutasin ang pagpili, pagsasama, pag-uugnay, pagpapatotoo, at pagpapalalim ng impormasyon.

Hanggang sa pagkakaroon ng malalim na pagkakaunawa sa dynamic workflow ni Claude Code sa linggong ito, natutunan ko ang tunay na kahulugan ng pahayag na "Huwag kang lumaban sa malaking panahon."

Isa pang pag-iisip: Ano ang dapat gawin ng tao bilang malalim na pag-aaral sa panahon ng AI, at paano buuin ang aking pakikipagtulungan at komplemento sa AI.

Isa, mula sa mga jamboree ng pag-aaral

Ang paggawa ng teknikal na pag-aaral ay isang proseso na puno ng mga trap (parehong para sa tao at AI), dahil mula sa simula ng pag-aaral, makakatanggap ka ng malaking dami ng impormasyon, lalong maraming mga opinyon, at lalong nabubuo ang mga konklusyon. Kaya mahalaga na palaging mabalik sa sariling layunin.

Ito rin ang palaging kahinaan ng AI, dahil sa pananaw ng atensyon at pag-uugnay, mas nakakapagod ito sa kasalukuyang dami ng impormasyon at mahina sa tunay na may-kahulugang pag-uugnay sa iba’t ibang larangan.

Ang mga masusing aspeto ng AI ay ang kanyang pagkakaroon ng kakayahang magpatupad, na naglalayong hanapin, i-nnagkakaisa, at i-summarize sa pamamagitan ng mga agent, na lubos na maiiwasan ang pagkawala ng detalye.

Bagaman hindi ako nagpapalabas ng marami sa aking public account sa nakalipas na anim na buwan, sinusubaybayan at binabasa ko ang lahat ng pangunahing battlefield sa industriya, at ang suporta sa aking pag-input at pag-output ay isang sariling deep-research system.

Samantalang tinatapos na ni Claude Code ang Dynamic Workflows noong nakaraang linggo, gustong mag-battle ako upang tingnan kung ang kanyang default na kakayahan ay maaaring lubos na labis sa akin.

Ano ang Dynamic Workflows

Ang Dynamic Workflows (dynamikong workflow) ay batay sa pangunahing ideya: bago isagawa ang isang gawain, unang disenyo ng AI kung anong workflow ang dapat gamitin upang matapos ang gawain, bago magsimula ang pagsasagawa.

May malaking pagkakaiba ito sa dating “plan mode” at “skill” na ginagamit namin. Ang plan mode ay naghihiwalay ng mga gawain sa mas maliit na bahagi, ngunit hindi ito laging sumusunod sa isang makabuluhang workflow; ang pagpapasya kung magdadagdag ng mga pagsusuri ay depende sa pagkakasunod-sunod ng iyong prompt—ito ay mahalaga para sa Research. Parehong paraan, ang pagpapahintulot sa pagpapahalaga ng ilang harness rules ay nangyayari lamang kung mayroon kang prompt.

Ngunit ang dinamikong workflow ay awtomatikong isasama ang mga lohika ng pagtatanggap, pagkonsolida ng resulta, at pagsubok sa pagtutol.

Ang pag-trigger ay simpleng gamitin ang /deep-research sa cc, at ibigay ang ilang mga template para sa pag-aaral at mga entry na materyales. Kung gusto mong gamitin ang kakayahan ng dynamic workflow nang hiwalay, gamitin ang prompt o sabihin lamang ang ultracode. Tandaan bago gamitin: ang pagkawala ng token ay halos nangungunang maraming beses kaysa karaniwan.

Tatlo: Anim na mga mode ng workflow na nakabuilt-in

Sa ilalim ng dynamic workflow ay ang anim na pangunahing scheduling pattern na isinumite ng opisyal, at dito nakabatay kung bakit ito ay mas malakas kaysa sa karaniwang pag-uusap/agent/skill.

Sa katotohanan, ang mga pattern na ito ay batay lamang sa dalawang pangunahing tanong: Paano i-decompose ang task? Paano i-combine ang resulta? Ang paghihiwalay sa anim ay pagsasama-samang iba’t ibang paraan ng dalawang ito.

3.1 Mode ng pagrute (Classify-And-Act)

Una ay isang agent ang magdedisyon kung ano ang uri ng gawain, pagkatapos ay ipinapadala ito sa pinakamahusay na espesyalisadong agent. Ang pangunahing lohika ay ang pagpili ng ruta, hindi ang pagpaparalelo o pag-uulit. Isang gawain lang ang naglalakbay sa isang path, at ang lahat ng iba pang path ay hindi pinapagana.

Halimbawa, maaari kong magkaroon ng tatlong pre-set na subagent roles: isang analysis agent na mahigpit na nag-verify ng data, isang output agent na mahusay sa pagsusulat, at isang challenge agent na espesyalista sa paghahanap ng mga bug. Ang routing layer ang magpapasya kung sino ang angkop na tanggapan ng kasalukuyang subtask, hindi isang agent na mag-iisa ang lahat.

Ang halaga ng pattern na ito ay: eksakto at maingat, ang bawat prompt ng agent ay maaaring malaya at hindi maapektuhan ng ibang layunin, na bumubuo ng malalim na pag-aaral sa pagsasakatuparan. Pinakamababang paggamit ng token, pinakamabilis na bilis ng pagtugon. Napakalinaw ng hangganan ng tungkulin.

Kasama rin ang mga malaking kahinaan, kabilang ang mahinang kakayahan sa pagtrato sa mga gawain na may malabo hangganan (tulad ng "parehong teknikal at account issue").

3.2 Paghihiwalay at Pagpapagsama (Fan-out & Merge)

Ito rin ang pinakakaraniwang mode ko, ang pangunahing lohika ay parallel + merge. Hinahati ang task sa N na magkakaibang sub-task na pinapagalaw nang sabay-sabay, at pagkatapos ay iineegrate ang lahat nang isang beses.

Ang mga benepisyo ay ang bilis at pagkakahiwalay. Ang kabuuang oras ay katumbas ng pinakamabagal na subtask, hindi ang kabuuan ng lahat ng subtasks. Mayroon bawat subtask ng sariling context, walang pagkakaugnay, at hindi ito nakakaapekto sa ibang subtasks dahil sa ingay mula sa isang subtask.

Ang kahinaan ay ang gastos ng token ay N beses na serial, at ang pagkakaisa ng layer (Synthesize) ay may sariling hamon—ang pagpagsasama ng N-path na output na may hindi magkakatugmang istruktura ay isang hamon sa disenyo. Ang mahinang paghahati ng subtask ay maaaring magdulot ng pagkakalimutan o paulit-ulit na pagkakapal.

3.3 Adversarial Verification

Ang pangunahang lohika ay ang pagsusuri, kung saan ang mga magkakaibang agent ay tinutukso ang isang parehong konklusyon mula sa pananaw ng pagtutol, at kailangang umabot sa karamihan ng boto upang maipasa.

Ang kahusayan ay dahil ang Verifier ay hindi nakakaalam ng pag-iisip ng Worker, kumikita lang ng resulta, na nagtatanggal ng sariling pagtataya sa pamamagitan ng istruktura kapag pinag-aaralan ng modelo ang sariling isinulat na code.

Ang modelo na ito ay naglutas ng isang matagal nang problema na aking kinakaharap: madalas naming gamitin ang pang-araw-araw na wika sa pag-uusap sa AI, ngunit ang AI ay may tendensya na sumunod sa inyong inaasahan sa pagtugon, kaya madaling magkaroon ng "confirmation bias." Sa pamamagitan ng pagpapakilala ng pagsubok, pinipilit ng AI na hanapin ang mga kontrabahagi, at patunayan batay sa datos at eksperimento, hindi lamang pagpapakita ng inyong mga ideya.

Ngunit, upang patunayan ang bagay na ito, kung ibinibigay niya ang maling pagtataya, maaari niyang masira ang Worker at pilitin itong sumasang-ayon sa Verifier. Kaya, mas mainam na batay sa mga maaaring maulit na katotohanan, hindi sa mga opinyon.

Joke lang, kung papayagan mo ang AI na hanapin ang mga problema, walang katapusan ang mga problema na makikita niya, kaya kailangan mong limitahan ang saklaw ng paghahanap ng problema nito.

3.4 Pagbuo at Paghuhusay (Generate & Filter)

Ang pangunahang lohika ay pagpapalawak at pagpapalapit. Una, gumawa ng sobrang dami ng mga kandidato, pagkatapos ay tanggalin gamit ang rubric upang manatili lamang sa mga pinakamahusay, at i-output ang mga resultang may mataas na antas ng kumpiyansa.

Mas mabuti na gawin ng isang agent ang pagbuo ng sampung sagot, kaysa magbigay ng isang "sapat" na sagot, at pagkatapos ay i-filter gamit ang isang verification layer. Kaya ang pangunahing kahusayan ay ang diversity. Maaaring gamitin ng mga iba’t ibang Generator ang iba’t ibang estratehiya at prompt upang makalikha ng mga solusyon na mahirap ipaghambing ng tao, at ang proseso ng pag-filter ay nagpapataas ng kalidad ng final output.

Ang kahinaan ay ang kalidad ng rubric ng Filter ang diretso na nagdedetermine sa final na epekto; ang maling pagdisenyo ng rubric ay katumbas ng pagkabigo ng buong proseso

Angkop na sitwasyon ay kung hindi alam ang tamang sagot sa una, kailangan pumili sa pagitan ng maraming posibilidad, at may malinaw na pangangailangan para sa diversidad.

Kasalungat lamang ng Fanout-And-Synthesize: parehong "maraming paralelo → iisang output", pinakamadaling maliitin.

Ang pangunahing pagkakaiba ay ang intensyon: ang bawat path ng Fanout ay nagtratrabaho sa iba't ibang bahagi ng task, at ang mga resulta ay komplementario—kapag pinagsama, lahat ng paths ay may kontribusyon; samantala, ang bawat path ng Generate-And-Filter ay nagtratrabaho sa parehong task, at ang mga resulta ay kompetitibo—kapag pinagsama, ang karamihan ay tatanggalin. Ang unang isa ay "puzzle," habang ang ikalawa ay "beauty pageant."

3.5 Tournament Mode

Ang pangunahang lohika ay ang kompetisyon at pag-alis. Ang N na agent ay nagtatrabaho nang hiwalay sa parehong gawain, at sa bawat yugto ay tinatanggal ang mga ito sa pamamagitan ng pairwise na paghahambing, hanggang sa makakuha ng pinakamahusay na solusyon.

Ginawa ko na ito nang manual dati—parehong pagbabago sa code, tatlo o dalawang bersyon, tapos pinag-iisipan ng AI kung alin ang mas mabuti. Ngayon, maaari na itong i-embed sa workflow.

Ang kahusayan ay nasa pagtataya ng katatagan. Ang paghahambing sa pares ("Alin sa A at B ang mas mabuti?") ay mas matatag kaysa sa pagsukat na absoluto ("Ibigay ang marka para sa A"), dahil tinatanggal ang problema ng pagbabago sa pamantayan ng pagmamarka. Ang mga resulta ay sumalamin sa maraming bilang ng kompetisyon, at ang tiwala sa tagumpay ay mataas.

Kasalungat din sa Generate-And-Filter: parehong nagpipili ng pinakamahusay mula sa maraming kandidato. Ang pangunahing pagkakaiba ay sa mekanismo ng pagpili: ang Tournament ay gumagamit ng pairwise judge para sa pagkukumpara ng dalawa, isang "pagpapagaling ng mga kandidato sa isa't isa." Mas maaasahan ito kapag ang rubric ay mahirap masukat at ang pagpapasya ay likas na relatibo.

3.6 Loop Mode

Ang pangunahang lohika ay ang adaptive iteration, patuloy na pagsubok, pagkolekta ng mga error message kapag may resistance, pagdaragdag ng konteksto, at pag-uulit ng pagsubok hanggang sa matugunan ang mga kondisyon ng pagtatanggap.

Sa kanyang core, ito ay pagtutol sa randomisasyon ng AI: subukan muli at muli, at sa wakas ay makakakita ka ng mas magandang resulta. Ngunit ang mas matatag na paraan ay ang pagkombina sa pagsubok ng pagtutol, upang bawat siklo ay magdala ng higit pang impormasyon habang nagpapatupad, hindi lamang batay sa random.

Ang pangunahing kahusayan ay ang kakayahang tratuhin ang mga gawain na ang dami ay hindi alam. Ang limang iba pang mode ay nagtatanggol na ang mga hangganan ng gawain ay tiyak, at ang Loop Until Done ay ang tanging mode na kayang tratuhin ang "hindi alam kung ilang beses ang gagawin".

Ang kahinaan ay ang potensyal na panganib ng pagkawala ng kontrol—ang di-maayos na pagdisenyo ng kondisyon para sa paghinto ay maaaring magdulot ng walang hanggang loop. Ang bawat round ng agent ay isang bagong konteksto at hindi makakapag-imbak ng estado sa pagitan ng mga round (kundi ipinapasa nang eksplisito sa file).

apat, ang aking sariling skill at ang battle ng opisyal na workflow

Bago lumabas ang dynamic workflow, nagdisenyo ako ng aking sariling deep-research. Ang lohika ng aking set ng skill ay ganito:

Isang simpleng impormasyon lamang (tulad ng isang proyekto ay naglagay ng isang bagong tampok)
I-search ng AI ang lahat ng kaugnay na impormasyon: opisyal na dokumentasyon, source code, at mga opinyon sa merkado
I-compress ang impormasyon sa isang may kahulugang buod
Mga maraming agent role para sa pagkukumpara at pagbuo ng ulat
Automatic deduplication due to high content repetition among multiple agents

Nagamit ko na ito ng ilang panahon, at naniniwala akong mabuting gamit. Ngunit mayroon itong isang pangunahing kakulangan: kulang sa pagkakasundo na may layunin.

At maraming beses, kahit may fifth step ng deduplication, madalas niyang tanggalin ang may halagang impormasyon; kung hindi mo gagawin ang deduplication, madaling ibibigay sa iyo ng skill isang libo-libong salitang artikulo na may kompletong impormasyon, ngunit hindi direktang sinasabi sa iyo kung "ano ang ugnayan nito sa iyo, at ano ang dapat gawin mo".

Gayunpaman, ang pananaliksik ay para sa “paggawa ng desisyon,” kaya maraming kasanayan ay nagtatapos lamang sa pananaliksik mismo, may 80 puntos, ngunit kulang sa pinakamahalagang 20 puntos.

Kaya pagkatapos ng unang pagkumpleto ng pag-aaral, kailangan pa ng sampung pag-iisip at pag-uusap upang makamit ang isang sapat at kompletong konklusyon.

Ano pa ang ginawa ng official workflow?

Sa pamamagitan ng mga eksperimento sa ilang komplikadong pag-aaral sa loob ng linggong ito, natuklasan kong ang built-in na deep research workflow ng Claude Code (tandaan, hindi lang skill, kundi isang module na nakakabit sa loob ng cc), may ilang mahahalagang hakbang na higit sa aking sariling skill:

Layer ng Pagdecompose ng Tanong: Hindi ito diretso nag-uumpisa sa paghahanap, kundi una nagtatanong ng mga tanong, hinahati ang aking tanong sa mga sub-question: Ano nga ba ang talagang nais mong maunawaan? Ano ang ugnayan nito sa iyo? Anong mga aspeto ang dapat pag-aralan nang mas malalim? Ang hakbang na ito ay pinaglalaan ko dati.
Evaluation ng kapanatagan: Isasagawa ang pagtataya sa bawat impormasyon batay sa pagkakaroon ng pagkakamali, katulad ng pagkakascore ng awtoridad sa tradisyonal na SEO—kakayahan ba ng pinagkukunan? Gaano karami ang mga pagbanggit? Ito ay isang bahagi na hindi ko naalala na idagdag dati.
Cross-delete instead of average merging: Previously, I averaged all conclusions, resulting in a large document. The dynamic workflow performs multi-agent voting on each conclusion and deletes those that don’t receive enough votes, rather than simply merging them.
Ang target-oriented output: Ang huling ulat ay hindi isang pagkakalap ng impormasyon, kundi isang paghuhusga at mga mungkahi na nakabatay sa iyong orihinal na layunin. Ang susi sa pagkamit nito ay ang paggamit ng mga nakapaghanda na kakayahan ng maraming sub-agent. Dahil dito, sa nakaraan, madalas kong nawawala ang target-oriented na layunin sa mga skill dahil sa pagkabawas ng timbang ng utos pagkatapos ng malaking dami ng impormasyon.

Ano ang mga problema na nalulutas ng mga mekanismo na ito?

Tinutukoy ang ilang karaniwang problema sa paggawa ng mahabang gawain ng AI:

Target drift: Mabuting estado sa simula ng task, ngunit sa gitna ay hindi na alam kung ano ang ginagawa, at sa dulo ay bumabalik muli sa ritmo—parang nagkakaroon ng pagkakalimot sa klase. Mas malinaw ito habang mas mahaba ang task.

Premature termination: Habang tumatakbo, nakakaroon ng mga problema, ang AI ay naniniwala na "natapos" na ito at tumigil, ngunit ang mga pamantayan sa pagsusuri ay hindi pa nabigyan.

Context pollution: Ang paggawa ng isang mag-isa ng komplikadong gawain ay nagpapaliit sa espasyo para sa susunod na pagpapatupad dahil sa malaking dami ng prompt. Mas mabuting i-limit ang mga prompt sa simula sa ilang k, at gamitin ang maraming agent upang ibahagi ang context.

Ang output ay biased: ang AI ay mas nakakasagot ayon sa inaasahan mo, mas madaling ma-trigger ang problema sa pamamagitan ng pangungusap na pagsasalita.

Ang dinamikong workflow ay naglutas ng apat na problema sa isang structured paraan: awtomatikong pagdaragdag ng mga indikador ng pagpapatibay upang maiwasan ang sobrang paghinto; pagpaparalelo at pag-isolate ng konteksto; pagtutol sa pagkakasalungat ng pagpapatibay upang labanan ang bias sa output; at paghahati-hati ng problema sa mga antas na naglalayong limitahan ang AI na maunawaan muna ang layunin bago mag-act.

Limang, Kabuuan

Sa huli, bilang isang matagal nang mananaliksik, napakaganda ng bagong mekanismo ng CC nito—ang anim na mode nito—paggawa ng ruta, paghahati at pagpagsasama, pagpapatotoo ng pagtutol, pagbuo at pagpapaliwanag, paligsahan sa tournament, at Loop loop—ay sumasakop sa karamihan sa mga kumplikadong pangangailangan sa pagpaplano ng pananaliksik.

Hindi na kailangan kong manual na disenyo ang agent scheduling, at hindi na kailangan kong gawin ang deduplication at cross-validation nang sarili ko—ang lahat ay naisama na sa workflow mismo.

At siya ay partikular na angkop para sa pag-iisip sa mga kawalan ng impormasyon at pag-aaral ng mga bukas na tanong, dahil sa natural na multi-agent scheduling + paghihiwalay ng mga layunin sa gawain, na nagpapataas pa ng kanyang pangkalahatang kakayahang. Sa katotohanan, noong tatlong taon na ang nakalipas, ang AI ay nagsisikap nang mabuti sa paglutas ng napakaliit at malinaw na mga problema sa ilalim ng maraming pagtatakda, ngunit ang totoong pagbabago sa AI ay nasa kanyang pangkalahatang kakayahang—ito ang nagpapagkakaiba sa kanya sa kanyang mga kalaban, mula sa simpleng code hanggang sa tunay na pagiging Agent, mula sa paglutas ng isang nakapirming problema hanggang sa pag-adapt sa anumang problema.

Kaya ang Dynamic Workflows ay hindi "mas matalinong isang sesyon ng usapan", kundi ang pag-ayos ng proseso ng pag-aaral mismo.

Nakakapagpapaliit ng sampu’t isang independiyenteng talakayan sa pag-aaral sa 3-4 lamang. Bagaman ang kaugnay na pagkawala ng Token ay tumataas ng maraming beses.

Bakit kailangan pa ng 3-4 na beses? Sa tingin ko, ang ugat ng problema ay ang pagkakaiba ng mga pangangailangan na ito.

Ang unang bagay ay ang kahigpit ng mekanismo ng pag-verify; pangunahin kong pinag-aaralan ang mga bagong teknolohiya sa blockchain, at sa maraming bagay, ang opisyal na dokumentasyon ay nakalipas na, at mayroong mas mahalagang mga open-source code, on-chain transaction, at iba pang data na maaaring gamitin bilang talaan, ngunit kasalukuyan, ang AI ay nananatiling nakabatay sa opisyal na dokumentasyon kaysa sa pag-verify batay sa katotohanan.

Ikalawa ay ang malalim na pag-iisip na lubos na nanggagaling sa iba’t ibang larangan; kahit na maaaring masolusyunan ang ilang aspeto sa pamamagitan ng mga pre-set na workflow (pagtukoy ng iba’t ibang dimensyon ng subAgent) upang isipin ang parehong problema, mas mahusay pa rin ng AI ang paggamit ng pangunahing modelo ng pag-iisip, at kung gayon ay medyo kulang sa pagharap sa napakabagong, napakalalim, at kulang sa datos na mga isyu.

Ikatlo ay ang disenyo at pagpapatotoo ng solusyon; ang kahalagahan ng solusyon ay hindi nasa pagpapakilala kundi sa pagpapatotoo at pagpapalakas nito, na batay sa pagsusuri sa umiiral na mekanismo, pagsisikap, at gastos. Kung maayos na itinuturo ang AI, mas mabuting resulta ang maaaring makamit, ngunit ito ay lumalabag sa pangkalahatang pagkakaroon nito.

Huling kahulugan ay ang pinakamalalim na pagpapadali ng impormasyon, na nangangailangan ng pag-unawa sa antas ng kaalaman ng tagapakinig—mayroong ilan na walang anumang panganib na kaalaman at nangangailangan ng paglalarawan na may tao, habang mayroong iba na kailangan mo lang ng isang pangungusap upang makaepekto sa kanila~.