นักวิจัยจากเมตาปรับปรุงตัวแทนการเขียนโปรแกรมผ่านการใช้ซ้ำสรุป

นี่คือปัญหาที่ใครก็ตามที่เคยดีบักโค้ดสามารถเข้าใจได้: คุณลองสิ่งหนึ่ง มันล้มเหลว คุณลองอีกครั้ง มันล้มเหลวในรูปแบบที่ต่างออกไป และเมื่อถึงความพยายามครั้งที่เจ็ด คุณก็ลืมไปแล้วว่าคุณตัดออกอะไรไปแล้วบ้าง ตอนนี้ลองจินตนาการว่าวัฏจักรนี้เกิดขึ้นภายในตัวแทน AI โดยแทนที่จะลืม ตัวแทนกลับจมอยู่กับหลายพันโทเค็นของบันทึกการดำเนินการที่ยาวเหยียดจากทุกความพยายามก่อนหน้า

นักวิจัยจากเมตาค้นพบวิธีแก้ไขที่เรียบง่ายอย่างน่าประหลาดใจ แทนที่จะให้ตัวแทนการเขียนโค้ดเข้าถึงประวัติแบบดิบเต็มรูปแบบ พวกเขาแสดงให้เห็นว่าการสรุปแบบกระชับและมีโครงสร้างของความพยายามในอดีตสามารถชี้นำความพยายามในอนาคตได้อย่างมีประสิทธิภาพมากกว่า

น้อยกว่าคือมากกว่าจริงๆ

ผลลัพธ์หลักแทบจะขัดกับความเข้าใจทั่วไปในยุคที่ “ข้อมูลมากขึ้น” มักเป็นคำตอบเริ่มต้น สรุปสั้นๆ สองบรรทัดเกี่ยวกับสิ่งที่ตัวแทนการเขียนโค้ดพยายามทำและทำไมมันล้มเหลว สามารถทำผลงานได้ดีกว่าทรัพยากรบันทึกการดำเนินการนับพันโทเค็น เมื่อใช้ในการกำหนดการกระทำถัดไปของตัวแทน

กลไกนี้ทำงานบนสองด้าน แรกคือ ลดเสียงรบกวนจากบริบท ซึ่งเป็นสิ่งที่เทียบเท่ากับการเสื่อมสภาพของอัตราส่วนสัญญาณต่อสัญญาณรบกวนในระบบปัญญาประดิษฐ์ เมื่อหน้าต่างบริบทของเอเจนต์ถูกเติมเต็มด้วยข้อมูลบันทึกที่ยาวเหยียดและซ้ำซาก ข้อมูลที่มีประโยชน์จะถูกกลบอยู่ข้างใต้ การบีบอัดผ่านการสรุปจะตัดเสียงรบกวนออกและรักษาสิ่งที่สำคัญจริงๆ ไว้

โฆษณา

ที่สอง และอาจสำคัญยิ่งกว่านั้น คือมันช่วยป้องกันไม่ให้เกิดข้อผิดพลาดซ้ำซาก โดยไม่มีบันทึกที่ชัดเจนเกี่ยวกับสิ่งที่ผิดพลาด ตัวแทนมักจะทำผิดพลาดเดิมซ้ำแล้วซ้ำเล่า สรุปแบบมีโครงสร้างทำหน้าที่เหมือนรายการตรวจสอบว่า “อย่าทำแบบนี้อีก” ซึ่งกลับกลายเป็นสิ่งมีค่าอย่างยิ่งสำหรับการแก้ปัญหาแบบวนซ้ำ

วิธีการนี้แสดงถึงการเปลี่ยนแปลงเชิงปรัชญาในการคิดเกี่ยวกับการปรับปรุงตัวแทน แทนที่จะเพิ่มจำนวนการลองใหม่หรือใช้ทรัพยากรการคำนวณมากขึ้น จุดเน้นจึงเปลี่ยนไปที่การบีบอัดหน่วยความจำและการใช้ซ้ำประสบการณ์

ตำแหน่งที่สิ่งนี้อยู่ในงานวิจัยตัวแทนของเมตาอย่างกว้างขวาง

งานนี้ไม่ได้เกิดขึ้นในสภาวะแยกจากกัน มันเป็นส่วนหนึ่งของความพยายามอย่างต่อเนื่องของเมตาในการพัฒนาระบบตัวแทนที่สามารถพัฒนาตนเองได้ ซึ่งเป็นหัวข้อการวิจัยที่เคยสร้างกรอบงานอย่าง HyperAgents และ Meta-Harness เมื่อต้นปี 2026

กรอบงานก่อนหน้านี้ได้สร้างรากฐานสำหรับระบบปัญญาประดิษฐ์อัตโนมัติที่สามารถปรับปรุงตรรกะการดำเนินงานของตนเองตามเวลา ความท้าทายที่พวกเขาพบบ่อยคือภาระทางปัญญา โดยเฉพาะอย่างยิ่งวิธีการป้องกันไม่ให้ตัวแทนรู้สึกท่วมท้นด้วยข้อมูลในอดีตของตนเองขณะที่สะสมประสบการณ์

วิธีการสรุปนี้ช่วยแก้ไขจุดคอขวดนั้นโดยตรง ตัวแทนยังคงสะสมประสบการณ์อยู่ แต่ตอนนี้มันประมวลผลประสบการณ์นั้นให้กลายเป็นสิ่งที่กระชับและสามารถดำเนินการได้ ก่อนที่จะส่งกลับไปใช้ในการตัดสินใจในอนาคต

สิ่งนี้หมายถึงอะไรสำหรับนักลงทุนและภูมิทัศน์ของปัญญาประดิษฐ์

ในขณะนี้ บริษัทต่างๆ ที่พัฒนาตัวแทนการเขียนโค้ดมักปรับปรุงผลิตภัณฑ์ของตนโดยการขยายขนาด การเพิ่มทรัพยากรการประมวลผล การลองใหม่หลายครั้ง และการขยายช่วงบริบทที่ยาวขึ้น ทั้งหมดนี้มีค่าใช้จ่ายสูง หากแนวทางของ Meta ยังคงได้ผลในแอปพลิเคชันที่กว้างขึ้น แสดงว่ามีทางเลือกสำหรับการเพิ่มประสิทธิภาพโดยไม่ต้องเพิ่มค่าใช้จ่ายแบบเชิงเส้น

ความเสี่ยง ตามที่มักเกิดขึ้นกับเอกสารวิจัย คือผลลัพธ์ที่ควบคุมได้ไม่ได้แปลงผลลัพธ์ไปสู่สภาพแวดล้อมการผลิตเสมอไป การทดสอบประสิทธิภาพการเขียนโค้ดมีความเรียบร้อยกว่าการวิศวกรรมซอฟต์แวร์ในโลกจริง และคุณภาพของสรุปสองบรรทัดเหล่านี้มีความสำคัญอย่างยิ่ง สรุปที่ไม่ดีอาจแย่กว่าการไม่มีสรุปเลย เพราะอาจนำสัญญาณที่ผิดพลาดมาแทนที่สัญญาณที่มีประโยชน์