ตั้งแต่ปี 2025 ผู้คนจำนวนมากอาจค่อยๆ คุ้นเคยกับวิธีการโต้ตอบแบบใหม่: พูดกับ GPT หรือ Gemini ว่า “ช่วยวางแผนทริปไปฮ่องกงสัปดาห์หน้า และแนะนำตั๋วเครื่องบินและโรงแรมที่เหมาะสม” มันจะดำเนินการค้นหาข้อมูล คัดกรองเงื่อนไข เลือกเส้นทาง เปรียบเทียบราคา ฯลฯ ทั้งหมดในพื้นหลัง แล้วส่งผลลัพธ์มาให้คุณยืนยันเท่านั้น
แต่เมื่อนำความคาดหวังเดียวกันนี้ไปใช้กับบล็อกเชน เรื่องราวกลับเปลี่ยนไปอย่างสิ้นเชิง
ตัวอย่างเช่น คุณสั่ง DeFi Agent ว่า: “แลก ETH ในกระเป๋าเงินเป็น USDC โอนข้ามไปยังโซ่ Base แล้วนำเข้าฝากทั้งหมดลงใน Aave” ในเชิงวัตถุประสงค์ จากมุมมองของการ “เข้าใจความต้องการ” และ “วางแผนเส้นทาง” Agent ในปัจจุบันอาจทำได้ไม่ยาก แต่จุดแตกต่างที่แท้จริงเกิดขึ้นที่ขั้นตอนการดำเนินการ:
คุณยังคงต้องดำเนินการทีละขั้นตอน เช่น การลงชื่อ การอนุญาต การแลกเปลี่ยน การข้ามโซ่ และการฝากเงิน และแต่ละขั้นตอนล้วนเสี่ยงต่อการเปลี่ยนแปลงของสไลด์ ความผันผวนของ Gas ความล่าช้าในการเชื่อมต่อ และการเปลี่ยนแปลงสถานะบนโซ่ ซึ่งหมายความว่า หากขั้นตอนใดขั้นตอนหนึ่งคลาดเคลื่อนจากที่คาดไว้ การกระทำก่อนหน้าอาจไม่สามารถยกเลิกได้ และการกระทำถัดไปอาจไม่สามารถดำเนินต่อได้ สุดท้ายสิ่งที่เหลืออยู่บนโซ่ มักจะเป็นกระบวนการที่ยังไม่เสร็จสมบูรณ์
ปัญหาไม่ได้อยู่ที่ AI ไม่ฉลาดพอ แต่อยู่ที่ชั้นการดำเนินการบนโซ่ยังขาดวิธีการแสดงผลที่เหมาะกับ Agent อย่างแท้จริง
ด้วยเหตุนี้ ในต้นเดือนเมษายน 2026 Biconomy ร่วมกับ Ethereum Foundation ได้เปิดตัว ERC-8211 เพื่อแก้ไขปัญหา “ข้อจำกัดแบบคงที่” ในการดำเนินการสัญญาอัจฉริยะปัจจุบัน ให้เอเจนต์ AI และกระบวนการทำงาน DeFi ที่ซับซ้อนมีชั้นการดำเนินการที่มีความสามารถมากขึ้น โดยพยายามเติมเต็มชิ้นส่วนที่ขาดหายไปนี้

หนึ่ง: การเชื่อมต่อ AI Agent กับบล็อกเชน — “รอยแตกสุดท้าย”
ในช่วงหนึ่งถึงสองปีที่ผ่านมา จุดสนใจของอุตสาหกรรมสกุลเงินดิจิทัลกำลังเปลี่ยนจากประเด็นการขยายขนาด L2 และสภาพคล่อง RWA ไปสู่หัวข้อที่มีความเปลี่ยนแปลงอย่างมาก นั่นคือ AI Agent จะเข้ามาควบคุมการดำเนินการบนโซ่ได้อย่างแท้จริงได้อย่างไร
ในเชิงวัตถุประสงค์ ช่วงนี้เราได้เห็นการประยุกต์ใช้งานมากมายตั้งแต่ “การสั่งงานกลยุทธ์ DeFi หลายขั้นตอนด้วยภาษาธรรมชาติ” ไปจนถึง “การให้เอเจนต์อิสระดูแลพอร์ตการลงทุนข้ามเชนทั้งหมด” โดยแนวคิดส่วนใหญ่ได้พัฒนาจนมีความสมบูรณ์ในระดับดีโม ไม่ว่าจะเป็นการสร้างกลยุทธ์ DeFi หลายขั้นตอนด้วยภาษาธรรมชาติ การดำเนินการปรับสมดุลเองอัตโนมัติ การย้ายผลตอบแทนอัตโนมัติ การปรับตำแหน่งข้ามเชน หรือแม้แต่การจัดการพอร์ตที่ซับซ้อนยิ่งขึ้น
จากมุมมองของการให้เหตุผลและการจัดเรียง ความสามารถของ AI วิ่งเร็วมากแล้ว แต่เมื่อนำไปใช้งานจริงในสภาพแวดล้อมการผลิต ข้อจำกัดในระดับการดำเนินการกลับชัดเจนขึ้นเรื่อยๆ
เมื่อลงมือใช้งานจริง จุดอ่อนนี้สามารถสรุปได้เป็นประโยคเดียว: DeFi เป็นสิ่งที่เปลี่ยนแปลงได้ แต่ batch (การประมวลผลเป็นชุด) ส่วนใหญ่ในปัจจุบันยังคงเป็นแบบคงที่
เว็บไซต์ทางการและโพสต์อภิปรายของ ERC-8211 อธิบายปัญหานี้อย่างชัดเจน นั่นคือ ERC-4337 และ EIP-5792 ที่มีอยู่แล้ว ได้ผลักดันรูปแบบเก่าที่ว่า “ลายเซ็นหนึ่งครั้งต่อหนึ่งการเรียกใช้งาน” ไปสู่ระยะใหม่ที่ว่า “ลายเซ็นหนึ่งครั้งสามารถแพ็กเกจการเรียกใช้งานหลายครั้งได้” แต่พารามิเตอร์ในการเรียกใช้งานเหล่านี้โดยพื้นฐานยังคงถูกตรึงไว้ในขณะที่ลงลายเซ็น
กล่าวคือ จำนวนเงิน ค่าเป้าหมาย และผลลัพธ์ที่คาดหวังที่ผู้ใช้ป้อนไว้ขณะลงลายเซ็น จะไม่ถูกปรับอัตโนมัติเมื่อถึงเวลาดำเนินการจริง เนื่องจากสถานะบนบล็อกเชนเปลี่ยนไป

แต่ DeFi เองกลับเต็มไปด้วยความไม่แน่นอน การส่งออกจริงของการแลกเปลี่ยนขึ้นอยู่กับสไลด์และสภาพคล่องในบล็อกที่ดำเนินการ; เวลาและจำนวนเงินสุดท้ายที่ได้รับจากการเชื่อมต่อขึ้นอยู่กับกลไกและค่าธรรมเนียมของสะพานเอง; อัตราส่วน share-to-asset ของโปรโตคอลการกู้ยืมหรือ Vault ก็จะเปลี่ยนแปลงอยู่ตลอดเวลา
ในที่สุด ค่าที่ผู้ใช้หรือเอเจนต์เห็นขณะลงนาม มักเป็นเพียงการประมาณการในขณะนั้น ไม่ใช่ผลลัพธ์ที่แท้จริงเมื่อดำเนินการ
เพื่อเข้าใจว่า ERC-8211 แก้ปัญหาอะไร ให้ดูตัวอย่างที่พบบ่อยที่สุด: สมมติว่า Agent ต้องการทำสิ่งที่ดูเหมือนเรื่องธรรมดาๆ — แลก ETH ในบัญชีเป็น USDC แล้วนำเข้าไปฝากเต็มจำนวนที่ Spark เพื่อรับดอกเบี้ย
ภายใต้แบบจำลองการประมวลผลแบบ batch แบบคงที่ ตัวแทนต้องคาดการณ์ล่วงหน้าว่าหลังจาก Swap จะได้รับ USDC เท่าใด ซึ่งมักบังคับให้คุณตั้งค่าจำนวนเงินขาเข้าขั้นที่สองล่วงหน้าอย่างตายตัวในการลงนาม หากคาดการณ์สูงเกินไป จำนวนเงินที่เข้าจริงจะไม่เพียงพอ และทั้ง batch จะถูกยกเลิกทันที หากคาดการณ์ต่ำเกินไป เงินบางส่วนจะถูกค้างไว้ในกระเป๋าเงินโดยไม่ได้ใช้งาน
กล่าวอีกนัยหนึ่ง ก็คือติดอยู่ในสถานการณ์ที่ต้องเลือกระหว่างความเสี่ยงที่จะล้มเหลว หรือต้นทุนของโอกาสที่พลาดไป นี่จึงเป็นเหตุผลที่กระบวนการบนบล็อกเชนที่ดูเหมือนไม่ซับซ้อน เมื่อเพิ่มขั้นตอนเป็น 5 ขั้นตอน 8 ขั้นตอน หรือข้ามสองเครือข่าย กลับกลายเป็นอ่อนแออย่างรวดเร็ว ไม่ใช่เพราะกลยุทธ์เองซับซ้อนจนอธิบายไม่ได้ แต่เพราะรูปแบบการดำเนินการปัจจุบันพึ่งพาพารามิเตอร์ที่ถูกกำหนดไว้ล่วงหน้าอย่างมาก
โดยสรุป ขีดจำกัดของความสามารถของ batch แบบนิ่ง แท้จริงแล้วกำหนดขีดจำกัดของกลยุทธ์ที่ Agent สามารถดำเนินการได้อย่างปลอดภัย
ในมุมมองนี้ ERC-8211 ต้องการแก้ปัญหาที่ไม่ใช่การที่ AI Agent ตัดสินใจอย่างไร แต่คือเมื่อ Agent ตัดสินใจแล้ว บนโซ่จะมีวิธีการดำเนินการที่เป็นธรรมชาติ คงที่ และปลอดภัยยิ่งขึ้นได้อย่างไร เพื่อให้การดำเนินการบนโซ่ได้รับรูปแบบการแสดงผลที่ออกแบบมาเพื่อ AI Agent โดยตรงเป็นครั้งแรก
สอง、ERC-8211 เปลี่ยนอะไรบ้าง?
การพัฒนาที่สำคัญของ ERC-8211 ไม่ได้อยู่ที่การเพิ่มขั้นตอนมากขึ้นลงในลายเซ็นหนึ่งครั้ง แต่อยู่ที่การยกระดับการประมวลผลแบบ batch จากลำดับธุรกรรมที่พารามิเตอร์ถูกเขียนตาย ให้กลายเป็นโปรแกรมที่ “พารามิเตอร์ถูกประเมินแบบไดนามิกในขณะดำเนินการ”
ฟังดูอาจดูนามธรรมจริง แต่ไม่ได้ยากที่จะเข้าใจ ทางทีมงานได้อธิบายไว้ด้วยประโยคเดียวว่า: From transactions to programs
หมายความว่า ERC-8211 ไม่ได้พิจารณา batch เป็นรายการคำสั่งที่ดำเนินการตามลำดับอีกต่อไป แต่กลับมองว่าเป็นโปรแกรมที่ประเมินค่าในระหว่างการดำเนินการพร้อมเงื่อนไขความปลอดภัย โดยสามารถแยกแยะได้เป็นสามองค์ประกอบพื้นฐานที่สามารถรวมกันได้:
- Fetcher: กำหนดว่าพารามิเตอร์นี้ดึงค่าจากที่ใด สามารถเป็นการสอบถามยอดคงเหลือปัจจุบันของที่อยู่หนึ่งๆ ทำให้พารามิเตอร์ไม่ใช่แค่ภาพถ่ายขณะลงลายเซ็น แต่เป็นการอ่านค่าแบบเรียลไทม์ที่ดึงมาจากสถานะบนบล็อกเชนในขณะดำเนินการ;
- Constraints: หลังจากแยกพารามิเตอร์แล้ว ต้องผ่านการตรวจสอบข้อจำกัดแบบอินไลน์ — เช่น “USDC ที่ได้รับต้อง ≥ 2500” หรือ “การเลื่อนราคาต้องไม่เกิน 0.5%” การตรวจสอบข้อจำกัดเหล่านี้จะดำเนินการก่อนส่งค่าไปยังการเรียกถัดไป หากข้อใดข้อหนึ่งไม่ผ่าน ทั้งชุดจะถูกยกเลิกทันที;
- เงื่อนไขการกระตุ้น (Predicates): สามารถเข้าใจได้ว่าเป็นผู้ควบคุมระหว่างขั้นตอน ไม่ได้มีหน้าที่สร้างค่า แต่ทำหน้าที่ตัดสินว่าจะดำเนินการต่อหรือไม่ เช่น ในสถานการณ์ข้ามโซ่ บัตช์ด้านอีเธอเรียมสามารถใช้ predicate เพื่อรอเงื่อนไขว่า “WETH ที่มาจากการข้ามโซ่ได้รับแล้ว” และจะไม่ส่งคำสั่งจนกว่าจะได้รับ
ในชุดการออกแบบนี้ พารามิเตอร์แต่ละตัวต้องตอบคำถามสองข้อ: แรก ค่าดังกล่าวควรมาจากที่ใดเมื่อถูกดำเนินการ; สอง ต้องมีเงื่อนไขใดบ้างที่ต้องเป็นไปตามก่อนจะนำไปใช้จริงในการเรียกใช้งาน เพื่อให้เมื่อรวมกันทั้งสามอย่าง ชุดหนึ่งๆ ไม่ใช่เพียงลำดับการซื้อขาย แต่เป็นโปรแกรมที่มีการตรวจสอบความปลอดภัยฝังอยู่
ในที่สุดแล้ว แบบจำลองทางจิตใจของการประมวลผลแบบ batch แบบคงที่คือรายการตรวจสอบ—ดำเนินการขั้นตอน A, B, C ตามลำดับ; ในขณะที่แบบจำลองทางจิตใจของ ERC-8211 คือโปรแกรมที่มีเงื่อนไข—หลังจาก A ดำเนินการแล้ว ใช้ผลลัพธ์ที่แท้จริงของ A เป็นอินพุตของ B; B ต้องผ่านข้อจำกัดจึงจะเข้าสู่ C; หากขั้นตอนใดขั้นตอนหนึ่งไม่เป็นไปตามที่คาดไว้ ทั้งชุดจะถูกย้อนกลับ
เราสามารถเข้าใจมันอย่างง่ายๆ ว่าเป็นกลไกการประมวลผลแบบอัจฉริยะที่ออกแบบมาโดยเฉพาะสำหรับ AI Agent และการดำเนินการ DeFi ที่ซับซ้อน เพราะในกระบวนการดำเนินการบนโซ่แบบดั้งเดิม การดำเนินกลยุทธ์ DeFi ที่ซับซ้อนมักต้องใช้ธุรกรรมหลายรายการแยกกัน: ดึงเงินทุนจากโปรโตคอลการกู้ยืม แลกเปลี่ยนโทเค็น และนำเข้าสู่โปรโตคอลอีกแห่งหนึ่ง (อ่านเพิ่มเติมใน ภาพรวมโปรโตคอล AI แบบเข้ารหัส: จากสนามรบหลักของ Ethereum จะสร้างระบบปฏิบัติการใหม่สำหรับ AI Agent ได้อย่างไร?)
แต่ละขั้นตอนต้องมีการลงนามและยืนยันแยกกัน ซึ่งสำหรับผู้ใช้งานทั่วไปอาจยุ่งยากอยู่แล้ว แต่สำหรับ AI Agent ที่ต้องการดำเนินการอัตโนมัติบ่อยครั้งกลับกลายเป็นข้อจำกัด โดยโซลูชันของ ERC-8211 คือการอนุญาตให้รวมการดำเนินการบนบล็อกเชนหลายรายการไว้ในธุรกรรมเดียว โดยแต่ละขั้นตอนจะแก้ค่าจริงแบบไดนามิกเมื่อดำเนินการ และต้องตอบสนองเงื่อนไขที่กำหนดไว้ล่วงหน้าก่อนจะสามารถดำเนินการขั้นตอนถัดไปได้
ตัวอย่างเช่น ตัวแทนสามารถดำเนินการในหนึ่งธุรกรรมที่ลงนามแล้ว: ดึงเงินจาก Aave → แลกเปลี่ยนจำนวนเงินที่ได้รับจริงบน Uniswap → ฝากผลลัพธ์การแลกเปลี่ยนลงใน Compound — ทั้งหมดดำเนินการแบบอะตอมิก โดยไม่ต้องเขียนสัญญาอัจฉริยะใหม่
สาม、ทำไมจึงกล่าวว่ามันเกี่ยวข้องกับกระเป๋าสตางค์ โดยเฉพาะกระเป๋าสตางค์อัจฉริยะมากกว่า
ERC-8211 น่าสนใจสำหรับอุตสาหกรรมกระเป๋าเงินไม่เพียงเพราะเหมาะกับ Agent แต่ยังเพราะจะเปลี่ยนบทบาทของกระเป๋าเงินในเส้นทางการโต้ตอบ
กระเป๋าเงินในอดีตมีลักษณะคล้ายเครื่องลงนามความปลอดภัย หน้าที่ของมันคือจัดเก็บกุญแจส่วนตัว แสดงธุรกรรม ให้ผู้ใช้ยืนยัน แล้วส่งการลงนามออกไป บทบาทนี้มีความสำคัญอย่างยิ่งในยุค EOA และยังคงใช้ได้ในยุคบัญชีแบบนามธรรม แต่หากในอนาคตการดำเนินการบนโซ่เพิ่มขึ้นเรื่อยๆ ถูกดำเนินการโดย Agent แทน บทบาทของกระเป๋าเงินจะยิ่งมีความสำคัญและเป็นศูนย์กลางมากขึ้น
เหตุผลก็คือ เมื่อผู้ใช้ไม่ได้ควบคุมการกระทำบนบล็อกเชนทีละขั้นตอนอีกต่อไป แต่เริ่มอนุญาตให้ Agent ดำเนินการชุดเป้าหมายทั้งชุด กระเป๋าเงินต้องมีความสามารถในการรองรับวัตถุประสงค์ระดับสูงกว่านี้ โดยไม่ได้แสดงเพียงที่อยู่สัญญาและข้อมูล calldata หนึ่งชุด แต่ต้องแสดงโปรแกรมการดำเนินการทั้งชุดที่ประกอบด้วย “เจตนา—ตรรกะการดึงค่า—การตรวจสอบเงื่อนไข—ผลลัพธ์สุดท้าย”
ดังนั้น กระเป๋าเงินในอนาคตไม่เพียงแต่ต้องเข้าใจการซื้อขาย แต่ยังต้องเข้าใจโปรแกรม ERC-8211 มอบเครื่องมือที่ชัดเจนยิ่งขึ้นสำหรับกระเป๋าเงินในระดับนี้ เพราะมันได้เขียนความหมายของการดำเนินการเหล่านี้ไว้อย่างชัดเจนในโครงสร้างการเขียนโค้ด รวมถึงพารามิเตอร์มาจากที่ไหน ต้องตอบสนองเงื่อนไขใดบ้าง เมื่อใดควรดำเนินการต่อ และเมื่อใดควรยกเลิก ทั้งหมดนี้ไม่ได้ถูกซ่อนอยู่ในตรรกะเบื้องหลังที่เป็นกล่องดำ แต่เป็นวัตถุที่กระเป๋าเงินสามารถตีความ จำลอง และแสดงผลได้
ในมุมมองของกระเป๋าเงิน กลไกทั้งชุดนี้สุดท้ายแล้วมุ่งไปที่สิ่งเดียวกัน นั่นคือผู้ใช้ไม่ได้ลงนามในชุดคำสั่งพื้นฐานที่ยากต่อการเข้าใจอย่างสมบูรณ์ แต่กำลังลงนามในโปรแกรมการดำเนินการที่มุ่งเน้นผลลัพธ์ มีขอบเขตชัดเจน และเงื่อนไขสามารถตรวจสอบได้:
- ตัวแทน AI สามารถรับผิดชอบในการเข้าใจเจตนาของผู้ใช้และสร้างเส้นทาง;
- กระเป๋าเงินจะแสดงเส้นทางนี้ให้ผู้ใช้ตรวจสอบในรูปแบบที่ชัดเจนยิ่งขึ้น;
- ส่วน relayer แค่รับผิดชอบในการส่งข้อมูลเมื่อเงื่อนไขเป็นจริง แต่ไม่มีสิทธิ์แก้ไขผลลัพธ์;
นี่คือเหตุผลที่การดำเนินการแบบไม่มีผู้ควบคุมถูกมองว่าเป็นเงื่อนไขพื้นฐานของ Agentic DeFi เพราะตัวแทนสามารถมีส่วนร่วมได้ แต่อำนาจอธิปไตย ข้อจำกัด และการปิดรายการสุดท้ายยังคงอยู่บนโซ่ ซึ่งเป็นจุดที่ ERC-8211 เข้ากันได้ดีกับกระเป๋าสตางค์อัจฉริยะ เพราะมันได้เขียนมาตรฐานระดับโปรโตคอลสำหรับ “การแสดงเจตนาที่ซับซ้อนอย่างปลอดภัย”
ควรสังเกตว่า ERC-8211 สามารถทำงานร่วมกับกรอบการจัดการบัญชีเช่น ERC-4337, EIP-7702 และ ERC-7579 ได้อย่างสมบูรณ์ โดยไม่ได้แทนที่การจัดการบัญชี แต่เพิ่มชั้นความหมายในการดำเนินการแบบโปรแกรมให้กับ Agent บนพื้นฐานของการจัดการบัญชี

หาก ERC-4337 แก้ปัญหา “ใครสามารถแทนฉันส่งธุรกรรมได้” และ EIP-7702 แก้ปัญหา “EOA จะมีความสามารถของสัญญาอัจฉริยะชั่วคราวได้อย่างไร” แล้ว ERC-8211 จะแก้ปัญหาว่า เมื่อ Agent เริ่มดำเนินการแทนฉัน มันสามารถดำเนินการทั้งห่วงโซ่การตัดสินใจภายในลายเซ็นเดียวได้หรือไม่
ย้อนกลับไปดูวิวัฒนาการของรูปแบบการโต้ตอบบนโซ่ของอีเธอเรียมในช่วง 10 ปีที่ผ่านมา:
- ขั้นตอนที่หนึ่ง: การลงนามหนึ่งครั้ง = การเรียกใช้งานฟังก์ชันหนึ่งครั้ง (ยุค EOA)
- ขั้นที่สอง: การลงนามหนึ่งครั้ง = การเรียกใช้งานแบบแพ็กเกจคงที่ชุดหนึ่ง (ยุค ERC-4337, EIP-5792)
- ขั้นที่สาม: การลงนามครั้งเดียว = โปรแกรมเจตนาที่ประเมินแบบไดนามิก (ยุค ERC-8211)
ทุกการกระโดดหมายถึงผู้ใช้ (หรือตัวแทนของผู้ใช้) สามารถแสดงเป้าหมายที่ซับซ้อนกว่าเดิมด้วยความยุ่งยากน้อยลง
แม้ว่า ERC-8211 ขณะนี้ยังอยู่ในระยะร่างและยังมีการอภิปรายทางเทคนิคอยู่ รวมถึงการเชื่อมต่อโปรโตคอลในระดับใหญ่ยังต้องใช้เวลา แต่ทิศทางที่มันชี้ไปนั้นชัดเจนพอแล้ว: เมื่อ AI Agent เริ่มตัดสินใจบนโซ่แทนมนุษย์จริงๆ โซ่จะต้องมีไวยากรณ์การดำเนินการแบบเนทีฟที่สอดคล้องกัน

