วิธีใช้ Dynamic Workflows ของ Claude สำหรับการวิจัยเชิงลึก

ในสามปีที่ผ่านมา ฉันไม่สามารถขาดการใช้ AI ช่วยในการวิจัยอุตสาหกรรมได้แล้ว จึงได้สร้างระบบและทักษะหลายชุดขึ้นมาเพื่อแก้ไขปัญหาการกรอง สรุป เชื่อมโยง ตรวจสอบ และเก็บสะสมข้อมูล

จนกระทั่งได้สัมผัสอย่างลึกซึ้งกับ workflow แบบไดนามิกของ Claude Code ในสัปดาห์นี้ จึงเข้าใจความหมายที่แท้จริงของคำว่า "มนุษย์อย่าต่อต้านยุคสมัยใหญ่"

พิจารณาใหม่อีกครั้ง: ในยุคของ AI มนุษย์ควรทำการวิจัยเชิงลึกในเรื่องใด และจะสร้างความสัมพันธ์ร่วมมือและเสริมกันกับ AI ได้อย่างไร

หนึ่ง เริ่มต้นจากกับดักการสำรวจ

การทำการวิจัยทางเทคนิคจริงๆ แล้วเป็นสิ่งที่เต็มไปด้วยกับดัก (ไม่ว่าจะสำหรับมนุษย์หรือ AI) เนื่องจากตั้งแต่เริ่มต้นการวิจัย จะได้รับข้อมูลจำนวนมาก ความเห็นและข้อมูลยิ่งเพิ่มขึ้น ข้อสรุปก็ยิ่งคลุมเครือ ดังนั้นจึงต้องรู้จักกลับมาที่เป้าหมายเดิมอยู่เสมอ

นี่คือจุดที่ AI ยังไม่ยอดเยี่ยมมาโดยตลอด เพราะจากมุมมองของความสนใจและการเชื่อมโยง มันจะติดอยู่กับปริมาณข้อมูลปัจจุบันมากกว่ามนุษย์ และมีความสามารถในการเชื่อมโยงข้ามสาขาที่มีคุณค่าอย่างแท้จริงค่อนข้างอ่อนแอ

จุดแข็งของ AI คือความสามารถในการดำเนินการ โดยจะค้นหา จัดกลุ่ม และสรุปแบบเป็นขั้นตอนผ่านตัวแทน ซึ่งสามารถหลีกเลี่ยงการสูญเสียรายละเอียดได้อย่างสมบูรณ์

แม้ว่าฉันจะไม่ได้โพสต์บนเว็บเพจสาธารณะเลยในช่วงหกเดือนที่ผ่านมา แต่ฉันติดตามและศึกษาอย่างละเอียดเกี่ยวกับสนามหลักทั้งหมดในอุตสาหกรรม และสิ่งที่สนับสนุนการรับและส่งข้อมูลนี้คือระบบ deep-research ของตัวฉันเอง

ในขณะที่เมื่อสัปดาห์ที่แล้ว Claude Code เปิดใช้งานฟีเจอร์ Dynamic Workflows ฉันจึงอยากลองแข่งขันกันดูว่า ความสามารถเริ่มต้นของเขาจะสามารถเอาชนะฉันได้ทั้งหมดหรือไม่

สอง、Dynamic Workflows คืออะไร

Dynamic Workflows (动态工作流) แก่นหลักของมันคือ: ก่อนดำเนินการงาน ให้ AI ออกแบบอัตโนมัติว่าควรใช้ workflow ใดในการทำภารกิจนี้ ก่อนที่จะเริ่มดำเนินการ

สิ่งนี้แตกต่างจาก “โหมดแผน” และ “ทักษะ” ที่เราเคยใช้มาอย่างสิ้นเชิง โหมดแผนคือการแบ่งงานให้ละเอียดขึ้น แต่ไม่จำเป็นต้องสอดคล้องกับกระบวนการทำงานที่สมเหตุสมผลใดๆ คุณจึงอาจเพิ่มตัวชี้วัดการรับรองเท่านั้น เมื่อจัดเรียงคำแนะนำของคุณ (ซึ่งมีความสำคัญอย่างยิ่งต่อการวิจัย) ในทำนองเดียวกัน คุณก็จะสามารถตั้งค่ากฎ harness บางอย่างล่วงหน้าได้ดีขึ้น ก็ต่อเมื่อคุณมีคำแนะนำเท่านั้น

แต่ระบบงานแบบไดนามิกจะรวมเอาตรรกะการรับรอง ผลลัพธ์ที่รวมกัน และการตรวจสอบแบบต่อต้านเข้าด้วยกันโดยอัตโนมัติ

วิธีการกระตุ้นนั้นง่ายมาก แค่ใช้ /deep-research ใน cc แล้วให้เทมเพลตการวิจัยและข้อมูลเริ่มต้นเท่านั้น หากต้องการใช้ความสามารถของงานไหลเวียนแบบไดนามิกเพียงอย่างเดียว ให้ใช้คำสั่งหรือพูดว่า ultracode โปรดสังเกตก่อนใช้งานว่า การใช้โทเค็นจะมากกว่าปกติประมาณหลายสิบเท่า

สาม、รูปแบบงานที่มีอยู่ภายในหกแบบ

พื้นฐานของ workflow แบบไดนามิกคือรูปแบบการจัดสรรหกแบบหลักที่ทางทีมอย่างเป็นทางการสรุปไว้ นี่คือเหตุผลที่มันแข็งแรงกว่าการสนทนา/เอเจนต์/สกิลทั่วไป

ที่จริงแล้ว รูปแบบทั้งหกนี้มีปัญหาหลักเพียงสองข้อเท่านั้น: วิธีแบ่งงานออกเป็นส่วนย่อย? และวิธีรวมผลลัพธ์? การแยกออกเป็นหกแบบคือการจัดเรียงและการรวมกันของสองประเด็นนี้

3.1 โหมดการจัดเส้นทาง (Classify-And-Act)

ก่อนอื่นให้ตัวแทนหนึ่งระบุประเภทของงาน แล้วส่งงานไปยังตัวแทนเฉพาะทางที่เหมาะสมที่สุดในการดำเนินการ ตรรกะหลักคือตรรกะการเลือกเส้นทาง ไม่ใช่การดำเนินการแบบขนานหรือแบบวนซ้ำ งานหนึ่งงานจะเดินทางตามเส้นทางเดียวเท่านั้น เส้นทางอื่นๆ จะไม่ถูกดำเนินการเลย

รูปภาพ

ตัวอย่างเช่น ฉันสามารถเริ่มต้นด้วยบทบาท subagent สามแบบที่กำหนดไว้ล่วงหน้า: agent วิเคราะห์ที่ตรวจสอบข้อมูลอย่างเข้มงวด, agent สร้างเนื้อหาที่เชี่ยวชาญด้านการเขียน, และ agent ค้นหาช่องโหว่ที่เชี่ยวชาญเฉพาะด้าน ให้ชั้นการจัดเส้นทางตัดสินว่าภารกิจย่อยปัจจุบันเหมาะกับใคร แทนที่จะให้ agent หนึ่งคนรับผิดชอบทั้งหมด

คุณค่าของรูปแบบนี้อยู่ที่ความแม่นยำและการใช้ทรัพยากรอย่างประหยัด คำสั่งสำหรับแต่ละ agent สามารถแยกจากกันได้อย่างชัดเจน ไม่ถูกรบกวนจากเป้าหมายอื่น สร้างการสำรวจที่มีความลึกเฉพาะทาง การใช้ token ต่ำที่สุด และความเร็วในการตอบสนองเร็วที่สุด ขอบเขตหน้าที่ชัดเจนมาก

ข้อเสียก็ชัดเจนเช่นกัน คือความสามารถในการจัดการงานที่มีขอบเขตไม่ชัดเจน (เช่น “ทั้งเป็นปัญหาด้านเทคนิคและปัญหาบัญชี”) ต่ำ

3.2 การแยกและรวม (Fan-out & Merge)

เป็นรูปแบบที่ฉันใช้บ่อยที่สุด ตรรกะหลักคือแบบขนาน + รวมผลลัพธ์ แบ่งงานออกเป็น N งานย่อยที่แยกจากกันและรันพร้อมกัน แล้วรวมผลลัพธ์ทั้งหมดเมื่อเสร็จสิ้น

รูปภาพ

ข้อได้เปรียบอยู่ที่ความเร็วและการแยกกัน โดยเวลาทั้งหมดเท่ากับเวลาของงานย่อยที่ช้าที่สุด ไม่ใช่ผลรวมของเวลาทั้งหมดของงานย่อยแต่ละงาน แต่ละงานย่อยมี context แยกกัน ไม่รบกวนกัน และไม่ได้รับผลกระทบจากสัญญาณรบกวนของงานย่อยอื่น

จุดอ่อนคือต้นทุนของโทเค็นเป็น N เท่าแบบอนุกรม และการรวมชั้น (Synthesize) ก็มีความซับซ้อนเอง — การรวมเอาเอาต์พุตที่มีโครงสร้างไม่สอดคล้องกัน N ทางเป็นความท้าทายด้านการออกแบบ การแบ่งงานย่อยไม่ดีอาจทำให้ขาดหายหรือซ้ำซ้อน

3.3 การตรวจสอบแบบต่อต้าน (Adversarial Verification)

แกนหลักคือการตรวจสอบ โดยให้ตัวแทนหลายตัวท้าทายข้อสรุปเดียวกันจากมุมมองของการโต้แย้ง และต้องได้รับคะแนนเสียงเกินครึ่งจึงจะผ่าน

รูปภาพ

ข้อได้เปรียบคือ เนื่องจาก Verifier ไม่รู้แนวคิดของ Worker แต่พิจารณาเฉพาะผลลัพธ์ จึงช่วยขจัดอคติในการประเมินตนเองที่เกิดขึ้นเมื่อให้โมเดลตรวจสอบโค้ดที่ตัวเองเขียน

รูปแบบนี้ช่วยแก้ปัญหาที่ฉันเคยกังวลมานาน: เรามักพูดกับ AI ด้วยภาษาพูดทั่วไป แต่ AI มักตอบตามความคาดหวังของคุณ ทำให้เกิด "อคติยืนยัน" การตรวจสอบแบบขัดแย้งบังคับให้ AI ค้นหาตัวอย่างที่ขัดแย้ง และตรวจสอบตามข้อมูลและการทดลอง แทนที่จะปรับตามความคิดของคุณ

แต่การตรวจสอบเรื่องนี้ หากผู้ตรวจสอบให้การตัดสินที่ผิดพลาด จะทำให้ผู้ปฏิบัติงานเอนเอียงไปตามผู้ตรวจสอบ ดังนั้นจึงควรเลือกอิงตามข้อเท็จจริงที่สามารถทำซ้ำได้ แทนการพึ่งพาความเห็น

พูดเล่นๆ นะ ถ้าคุณให้ AI หาปัญหา มันจะสามารถหาปัญหาได้ไม่สิ้นสุด ดังนั้นคุณต้องจำกัดขอบเขตการหาปัญหาของมัน

3.4 การสร้างและกรอง (Generate & Filter)

แกนหลักคือการกระจายแล้วค่อยรวมกลับ สร้างตัวเลือกจำนวนมากอย่างตั้งใจก่อน แล้วกรองด้วยเกณฑ์เพื่อเหลือเฉพาะสิ่งที่ดีที่สุด โดยรักษาเฉพาะผลลัพธ์ที่มีความมั่นใจสูงไว้เท่านั้น

รูปภาพ

แทนที่จะให้ตัวแทนส่งคำตอบที่ “ใช้ได้” หนึ่งคำตอบ ควรให้มันสร้างสิบคำตอบ แล้วใช้ชั้นการตรวจสอบกรองออก ดังนั้นข้อได้เปรียบอยู่ที่ความหลากหลาย ตัวสร้างหลายตัวสามารถใช้กลยุทธ์และคำสั่งต่างกัน เพื่อสร้างวิธีแก้ปัญหาที่มนุษย์ยากจะคาดเดาได้ ขั้นตอนการกรองช่วยให้คุณภาพของผลลัพธ์สุดท้ายมีความแม่นยำสูง

จุดอ่อนคือ คุณภาพของ rubric ของ Filter จะกำหนดผลลัพธ์สุดท้ายโดยตรง การออกแบบ rubric ที่ผิดพลาดเท่ากับว่ากระบวนการทั้งหมดล้มเหลว

เหมาะกับสถานการณ์ที่ไม่รู้คำตอบที่ถูกต้องล่วงหน้า ต้องเลือกจากตัวเลือกหลายอย่าง และมีความต้องการชัดเจนต่อความหลากหลาย

คล้ายกับ Fanout-And-Synthesize เพียงผิวเผิน: ทั้งสองเป็นรูปแบบ "หลายทางแบบขนาน → ผลลัพธ์เดียว" ซึ่งง่ายที่สุดที่จะสับสน

ความแตกต่างหลักอยู่ที่เจตนา: แต่ละเส้นทางของ Fanout จะจัดการกับส่วนต่างๆ ของงาน ผลลัพธ์จึงเสริมกัน และเมื่อรวมกันทุกเส้นทางจะมีส่วนร่วม; ในขณะที่แต่ละเส้นทางของ Generate-And-Filter จะจัดการกับงานเดียวกัน ผลลัพธ์จึงแข่งขันกัน และเมื่อรวมกันส่วนใหญ่จะถูกทิ้งไป วิธีแรกเป็นแบบ "ปริศนาภาพ" ส่วนวิธีหลังเป็นแบบ "ประกวดความงาม"

3.5 โหมดการแข่งขัน (Tournament)

ตรรกะหลักคือการแข่งขันและคัดออก ตัวแทน N ตัวทำงานแยกกันในสิ่งเดียวกัน โดยเปรียบเทียบแบบคู่ต่อคู่เพื่อคัดออกทีละรอบ จนเหลือคำตอบที่ดีที่สุด

รูปภาพ

ฉันเคยทำสิ่งนี้ด้วยตัวเองมาก่อน — รันการเปลี่ยนแปลงโค้ดเดียวกันสองสามเวอร์ชัน แล้วให้ AI เปรียบเทียบว่าเวอร์ชันไหนดีกว่า ตอนนี้สามารถจัดเรียงเข้าไปในกระบวนการทำงานได้โดยตรง

ข้อได้เปรียบอยู่ที่ความเสถียรในการประเมิน การเปรียบเทียบแบบคู่ (“A กับ B อันไหนดีกว่า?”) มีความเสถียรมากกว่าการให้คะแนนแบบสัมบูรณ์ (“ให้คะแนน A”) เพราะหลีกเลี่ยงปัญหาการเลื่อนของเกณฑ์การให้คะแนน ผลลัพธ์ผ่านการแข่งขันหลายรอบ ผู้ชนะสุดท้ายจึงมีความน่าเชื่อถือสูง

เช่นเดียวกับ Generate-And-Filter ที่ดูเหมือนกันในระดับพื้นผิว: ทั้งสองวิธีเลือกตัวเลือกที่ดีที่สุดจากหลายตัวเลือก ความแตกต่างสำคัญอยู่ที่กลไกการเลือก: Tournament ใช้การเปรียบเทียบแบบคู่เพื่อจัดอันดับ ซึ่งเป็นการ "ให้ตัวเลือกแข่งขันกันเอง" เมื่อเกณฑ์การประเมินยากที่จะวัดค่าได้อย่างเป็นรูปธรรม และการตัดสินมีลักษณะเชิงสัมพัทธ์ จะมีความน่าเชื่อถือมากกว่า

3.6 โหมดวนซ้ำ (Loop)

แกนหลักคือการวนซ้ำแบบปรับตัว ทดลองอย่างต่อเนื่อง เมื่อเจออุปสรรคให้รวบรวมข้อมูลข้อผิดพลาด เสริมบริบท และลองใหม่ จนกว่าจะบรรลุเงื่อนไขการยอมรับ

รูปภาพ

แก้ไขพื้นฐานคือการต่อสู้กับความสุ่มของ AI: ลองหลายครั้ง คุณจะได้ผลลัพธ์ที่ดีกว่าอย่างแน่นอน แต่วิธีที่สุกงอมกว่าคือการรวมการตรวจสอบแบบต่อต้าน เพื่อให้แต่ละรอบมีข้อมูลเพิ่มเติมในการดำเนินการ แทนที่จะพึ่งแค่ความสุ่ม

ข้อได้เปรียบอยู่ที่ความสามารถในการจัดการกับงานที่ไม่ทราบปริมาณงานที่แน่นอน โหมดอื่นๆ อีกห้าโหมดถือว่าขอบเขตของงานนั้นชัดเจน ขณะที่ Loop Until Done เป็นโหมดเดียวที่สามารถจัดการกับสถานการณ์ที่ไม่รู้ว่าต้องทำกี่รอบ

จุดอ่อนคือความเสี่ยงที่อาจสูญการควบคุม—หากออกแบบเงื่อนไขการหยุดไม่ดี จะเกิดวัฏจักรไม่สิ้นสุด ตัวแทนในแต่ละรอบเป็น context ใหม่ทั้งหมด ไม่สามารถสะสมสถานะข้ามรอบได้ (เว้นแต่จะเขียนลงไฟล์อย่างชัดเจน)

สี่ การแข่งขันระหว่างทักษะของฉันกับกระบวนการทำงานอย่างเป็นทางการ

ก่อนที่จะมีงาน流แบบไดนามิกออกมา ฉันเคยออกแบบ deep-research ของตัวเองขึ้นมาชุดหนึ่ง ตรรกะของทักษะชุดนั้นของฉันคือ:

เพียงให้ข้อมูลง่ายๆ (เช่น โครงการหนึ่งได้เปิดใช้งานฟีเจอร์ใหม่)
ให้ AI ค้นหาข้อมูลที่เกี่ยวข้องทั้งหมด: เอกสารอย่างเป็นทางการ รหัสต้นทาง และความเห็นจากตลาด
บีบอัดข้อมูลเป็นสรุปที่มีความหมาย
การวิเคราะห์การต่อต้านโดยใช้หลายบทบาทเอเจนต์ สร้างรายงาน
การลบข้อมูลซ้ำอัตโนมัติ เนื่องจากเนื้อหาจากตัวแทนหลายตัวมีอัตราการซ้ำสูง

ใช้งานไปสักพัก ฉันรู้สึกว่าใช้งานได้ดี แต่มันมีข้อบกพร่องพื้นฐาน: ขาดการรวมตัวที่มุ่งเป้าหมาย

และในหลายกรณี แม้จะมีขั้นตอนที่ห้าในการลบข้อมูลซ้ำ แต่ในเวลานั้น มักจะลบข้อมูลที่มีคุณค่าออกไป หากไม่ลบข้อมูลซ้ำ ก็จะง่ายมากที่จะได้บทความยาวหมื่นคำที่มีข้อมูลครบถ้วน แต่ไม่ได้บอกคุณโดยตรงว่า “เรื่องนี้เกี่ยวข้องกับคุณอย่างไร คุณควรทำอะไร”

อย่างไรก็ตาม การวิจัยนั้นมีจุดมุ่งหมายเพื่อสนับสนุนการตัดสินใจ ซึ่งเป็นเหตุผลที่ทักษะหลายอย่างหยุดอยู่แค่การวิจัยเท่านั้น ได้ 80 คะแนน แต่ขาด 20 คะแนนที่สำคัญที่สุด

จนถึงขั้นที่ AI หลังจากเสร็จสิ้นการวิจัยเบื้องต้น ยังต้องดำเนินการคิดและพูดคุยอีกสิบครั้ง เพื่อให้ได้ข้อสรุปที่สมบูรณ์และน่าพึงพอใจ

Official Dynamic Workflow เพิ่มอะไรอีก

ผ่านการทดลองภารกิจการวิจัยที่ซับซ้อนหลายครั้งในสัปดาห์นี้ ฉันพบว่า กระบวนการทำงาน deep research ที่ฝังตัวอยู่ใน Claude Code (โปรดสังเกตว่าไม่ใช่เพียงทักษะ แต่เป็นโมดูลที่ถูกรวมเข้าไว้ใน cc) มีขั้นตอนสำคัญเพิ่มเติมบางประการเมื่อเทียบกับฐานทักษะของฉันเอง:

ระดับการวิเคราะห์คำถาม: มันจะไม่เริ่มค้นหาทันที แต่จะเริ่มด้วยการตั้งคำถามก่อน เพื่อแยกคำถามของฉันออกเป็นคำถามย่อยหลายข้อ: ฉันต้องการเข้าใจสิ่งใดอย่างแท้จริง? เรื่องนี้เกี่ยวข้องกับฉันอย่างไร? มิติใดบ้างที่ควรศึกษาอย่างลึกซึ้ง? ขั้นตอนนี้ฉันเคยข้ามไปก่อน
การประเมินความน่าเชื่อถือ: ประเมินความสามารถในการพิสูจน์ได้ของแต่ละข้อมูล คล้ายกับคะแนนความน่าเชื่อถือใน SEO แบบดั้งเดิม—แหล่งที่มาเชื่อถือได้หรือไม่? มีการอ้างอิงกี่ครั้ง? นี่คือขั้นตอนที่ฉันไม่เคยคิดว่าต้องเพิ่มมาก่อน
การลบแบบข้ามแทนการรวมแบบเฉลี่ย: วิธีเดิมของฉันคือการเลือกเฉลี่ยจากข้อสรุปทั้งหมด จึงทำให้เอกสารมีขนาดใหญ่ แต่ระบบงานแบบไดนามิกจะใช้การลงคะแนนเสียงจากตัวแทนหลายตัวสำหรับแต่ละข้อสรุป และลบข้อสรุปที่ได้รับคะแนนไม่เพียงพอ ไม่ใช่การรวมแบบง่าย
ผลลัพธ์ที่มุ่งเป้าหมาย: รายงานสุดท้ายไม่ใช่การสะสมข้อมูล แต่เป็นการให้คำตัดสินและข้อเสนอแนะตามเป้าหมายเริ่มต้นของคุณ การบรรลุจุดนี้ขึ้นอยู่กับการใช้ความสามารถที่ตั้งไว้ล่วงหน้าของตัวแทนย่อยหลายตัว สาเหตุที่ก่อนหน้านี้ทักษะของฉันมักขาดการมุ่งเน้นไปที่เป้าหมายสุดท้าย ก็เพราะน้ำหนักของคำสั่งลดลงหลังจากรับข้อมูลจำนวนมาก

These mechanisms solve what problems?

เป็นการเจาะจงปัญหาทั่วไปที่ AI เผชิญเมื่อทำงานระยะยาว:

การเลื่อนเป้าหมาย: เมื่อเริ่มต้นงาน สถานะดี แต่ระหว่างทางกลับไม่รู้ว่ากำลังทำอะไรอยู่ และเมื่อใกล้จบจึงกลับมาหาจังหวะอีกครั้ง — คล้ายกับมนุษย์ที่หลับในระหว่างเรียน ยิ่งงานยาวเท่าไร ปรากฏการณ์นี้ยิ่งชัดเจนขึ้น

หยุดเร็วเกินไป: ขณะวิ่งไปเรื่อยๆ พบปัญหา AI คิดว่าตัวเอง "เสร็จสิ้น" จึงหยุดลง แต่จริงๆ แล้วยังไม่ผ่านเกณฑ์การรับรอง

การปนเปื้อนของบริบท: เมื่อเอเจนต์หนึ่งตัวรับผิดชอบงานที่ซับซ้อน คำสั่งเบื้องต้นจำนวนมากจะลดพื้นที่สำหรับการดำเนินการถัดไป วิธีที่ดีกว่าคือจำกัดคำสั่งเบื้องต้นให้อยู่ในระดับไม่เกินหลายกิโลไบต์ และใช้เอเจนต์หลายตัวเพื่อแบ่งเบาภาระบริบท

การตอบสนองมีแนวโน้มที่จะสอดคล้องกับความคาดหวังของคุณ การตั้งคำถามแบบพูดคุยทั่วไปจะกระตุ้นปัญหานี้ได้ง่ายกว่า

งานแบบไดนามิกช่วยแก้ไขปัญหาทั้งสี่ข้อนี้ด้วยวิธีที่มีโครงสร้าง: ระบุตัวชี้วัดการรับรองอัตโนมัติเพื่อป้องกันการหยุดก่อนเวลาอันควร; แยกบริบทแบบขนาน; ต่อต้านการลดทอนการตรวจสอบที่ทำให้ผลลัพธ์เบี่ยงเบน; แบ่งปัญหาออกเป็นขั้นตอนเพื่อจำกัด AI ให้เข้าใจเป้าหมายก่อนดำเนินการ

ห้า สรุป

สุดท้ายนี้ ผู้เขียนซึ่งเป็นนักวิจัยที่มีประสบการณ์ยาวนาน รู้สึกประทับใจอย่างยิ่งกับกลไกใหม่ของ CC ซึ่งมีหกโหมดที่ฝังตัวอยู่—การเลือกเส้นทาง การแยกและรวม การตรวจสอบแบบต่อต้าน การกรองแบบสร้างสรรค์ การแข่งขันแบบถ้วยรางวัล และวงจร Loop—ครอบคลุมความต้องการในการจัดตารางงานวิจัยที่ซับซ้อนส่วนใหญ่

ทำให้ฉันไม่ต้องออกแบบการจัดตาราง agent ด้วยตัวเอง อีกทั้งไม่ต้องจัดการการลบข้อมูลซ้ำและการตรวจสอบข้ามอีกต่อไป เพราะทั้งหมดนี้ถูกผนวกเข้าไปในงานไหลแล้ว

และเขาเหมาะอย่างยิ่งสำหรับการคิดในบริบทที่ข้อมูลขาดหายหรือการสำรวจคำถามที่เปิดกว้าง เนื่องจากการจัดการแบบหลายเอเจนต์ตามธรรมชาติและการแบ่งแยกเป้าหมายงาน ทำให้ความสามารถทั่วไปของเขาเพิ่มขึ้นอีกครั้ง ที่จริงแล้วตั้งแต่สามปีก่อน AI ได้ทำได้ดีมากในการแก้ปัญหาเล็กๆ ที่ชัดเจนภายใต้ข้อจำกัดที่ซับซ้อนหลายชั้น แต่การเปลี่ยนแปลงครั้งสำคัญของ AI จริงๆ อยู่ที่ความสามารถทั่วไป ซึ่งเป็นจุดที่ทำให้คู่แข่งของเขาเปลี่ยนจากโค้ดที่เรียบง่ายให้กลายเป็นเอเจนต์ที่แท้จริง ตั้งแต่การแก้ปัญหาแบบคงที่ไปสู่การปรับตัวให้เข้ากับปัญหาใดๆ ก็ได้

ดังนั้น Dynamic Workflows ไม่ใช่ "การสนทนาแบบครั้งเดียวที่ฉลาดกว่า" แต่เป็นการจัดโครงสร้างกระบวนการวิจัยเอง

เดิมทีฉันต้องเริ่มการสำรวจผ่านการสนทนาอิสระหลายสิบครั้ง ตอนนี้ลดลงเหลือ 3-4 ครั้ง แม้ว่าการใช้โทเค็นที่เกี่ยวข้องจะเพิ่มขึ้นเป็นหลายสิบเท่า

แล้วทำไมต้องใช้อีก 3-4 ครั้งล่ะ? ฉันคิดว่าสาเหตุหลักอยู่ที่ความแตกต่างของความต้องการเหล่านี้

ประการแรกคือระดับความเข้มงวดของกลไกการยืนยัน ฉันมุ่งเน้นการวิจัยเทคโนโลยีใหม่ๆ บนบล็อกเชน ซึ่งในหลายเรื่อง เอกสารอย่างเป็นทางการมักล้าหลัง และมีโค้ดโอเพนซอร์ส ข้อมูลการทำธุรกรรมบนโซ่ และอื่นๆ ที่น่าเชื่อถือมากกว่า แต่ปัจจุบัน AI ยังคงยึดถือเอกสารอย่างเป็นทางการเป็นหลัก แทนที่จะยึดตามการยืนยันจากข้อเท็จจริง

ข้อที่สองคือการคิดอย่างลึกซึ้งข้ามขอบเขต แม้ว่าจุดนี้จะสามารถแก้ไขบางส่วนได้ผ่านการตั้งค่าล่วงหน้าของกระบวนการทำงาน (การกำหนดล่วงหน้า subAgent หลายมิติ) เพื่อพิจารณาปัญหาเดียวกัน แต่ AI ยังคงเชี่ยวชาญในแบบจำลองการคิดแบบทั่วไป สำหรับประเด็นที่ใหม่มาก ลึกซึ้งมาก และขาดข้อมูลสนับสนุน ยังคงมีข้อจำกัดอยู่บ้าง

ข้อที่สามคือการออกแบบและยืนยันแนวทางแก้ไข ความหมายของแนวทางแก้ไขไม่ได้อยู่ที่การเสนอแนะ แต่อยู่ที่การยืนยันและการสนับสนุน มันอิงจากการวัดกลไก ทรัพยากรที่ลงทุน และต้นทุนที่มีอยู่ หากสามารถปรับแต่ง AI ได้อย่างเหมาะสม ก็สามารถทำได้ดีกว่า แต่นั่นขัดกับความเป็นสากล

สุดท้ายคือการบีบอัดข้อมูลอย่างสุดขีด ซึ่งต้องกลับไปพิจารณาความเข้าใจของผู้รับสาร: บางคนไม่มีพื้นฐานเลย ต้องการให้คุณอธิบายด้วยรูปแบบที่เป็นกันเอง แต่บางคนต้องการเพียงประโยคเดียวที่จะปลุกเร้าใจพวกเขา~