Từ năm 2025, nhiều người có thể dần làm quen với một cách tương tác mới: nói với GPT hoặc Gemini câu “Hãy giúp tôi lên kế hoạch lịch trình đi Hồng Kông tuần tới và đề xuất vé máy bay, khách sạn phù hợp”, và nó sẽ lặng lẽ thực hiện hàng loạt bước như tìm kiếm thông tin, lọc điều kiện, lựa chọn lộ trình, so sánh giá cả, sau đó chỉ gửi kết quả cho bạn xác nhận.
Tuy nhiên, khi mang cùng kỳ vọng đó lên chuỗi, câu chuyện lại hoàn toàn khác biệt.
Ví dụ bạn đưa lệnh cho một DeFi Agent: “Chuyển ETH trong ví thành USDC, chuyển sang chuỗi Base, sau đó gửi toàn bộ vào Aave”, về mặt khách quan, từ góc độ “hiểu nhu cầu” và “lập kế hoạch lộ trình”, các Agent ngày nay không nhất thiết không thể làm được, nhưng sự đột phá thực sự nằm ở khâu thực thi:
Bạn vẫn rất có khả năng phải thực hiện từng bước các thao tác như ký, cấp quyền, đổi, chuyển chuỗi và gửi tiền, và mỗi bước đều phải đối mặt với rủi ro biến động điểm trượt, biến động Gas, độ trễ cầu nối và thay đổi trạng thái trên chuỗi, điều này có nghĩa là chỉ cần một khâu nào đó lệch khỏi kỳ vọng, các thao tác trước đó có thể không thể hủy bỏ, trong khi các thao tác sau lại có thể không nối tiếp được, cuối cùng trên chuỗi chỉ còn lại một quy trình chưa hoàn tất.
Vấn đề không phải ở chỗ AI không đủ thông minh, mà là lớp thực thi trên chuỗi cho đến nay vẫn thiếu một cách biểu đạt thực sự phù hợp với Agent.
Chính vì vậy, đầu tháng 4 năm 2026, Biconomy cùng Quỹ Ethereum đã công bố ERC-8211 nhằm giải quyết vấn đề "hạn chế tĩnh" hiện tại trong thực thi hợp đồng thông minh, cung cấp một lớp thực thi linh hoạt hơn cho các đại lý AI và các luồng công việc DeFi phức tạp, nỗ lực lấp đầy mảnh ghép còn thiếu này.

Một, "khe nứt cuối cùng" trong việc tích hợp AI Agent vào chuỗi
Trong một đến hai năm qua, trọng tâm chú ý của ngành tiền mã hóa đang rõ ràng chuyển từ việc mở rộng L2 và thanh khoản RWA sang chủ đề đầy tính cách mạng: AI Agent sẽ thực sự接管 các thao tác trên chuỗi như thế nào.
Khách quan mà nói, từ việc “đưa ra các chiến lược DeFi đa bước bằng ngôn ngữ tự nhiên” đến “để các tác nhân tự chủ quản lý toàn bộ danh mục đầu tư liên chuỗi”, gần đây chúng ta cũng đã chứng kiến nhiều thực tiễn, và phần lớn các ý tưởng này đã trưởng thành ở cấp độ demo, bao gồm cả việc sinh chiến lược DeFi đa bước bằng ngôn ngữ tự nhiên, thực thi tự động cân bằng lại, di chuyển lợi nhuận tự động, điều chỉnh vị thế liên chuỗi, thậm chí là quản lý danh mục phức tạp hơn.
Từ góc độ suy luận và sắp xếp, khả năng của AI đã tiến rất nhanh, nhưng khi thực sự đưa nó vào môi trường sản xuất, những điểm yếu ở cấp độ thực thi ngày càng trở nên rõ ràng.
Khi thực sự áp dụng vào môi trường sản xuất, điểm yếu này có thể tóm gọn trong một câu: DeFi là động, nhưng hầu hết các batch (lô xử lý) ngày nay vẫn là tĩnh.
Trang web chính thức và bài thảo luận của ERC-8211 đã giải thích rõ vấn đề này, tức là ERC-4337 và EIP-5792 hiện tại đã thúc đẩy mô hình cũ “một chữ ký ứng với một lệnh gọi” sang giai đoạn mới “một chữ ký có thể đóng gói nhiều lệnh gọi”, nhưng các tham số trong những lệnh gọi này về bản chất vẫn chủ yếu bị đóng băng tại thời điểm ký.
Nói cách khác, số tiền, giá trị mục tiêu và đầu ra dự kiến mà người dùng nhập khi ký sẽ không tự động điều chỉnh khi thực sự thực thi do thay đổi trạng thái trên chuỗi.

Nhưng chính DeFi lại đầy rẫy sự không chắc chắn. Đầu ra thực tế của một giao dịch Swap phụ thuộc vào độ trượt giá và thanh khoản trong khối đang thực thi; thời gian và số tiền cuối cùng nhận được từ một Bridge phụ thuộc vào cơ chế và phí của chính cầu đó; tỷ lệ share-to-asset của các giao thức cho vay mượn hoặc Vault cũng liên tục thay đổi.
Sau tất cả, giá trị mà người dùng hoặc Agent nhìn thấy khi ký thường chỉ là ước tính tại thời điểm đó, chứ không phải kết quả thực tế khi thực hiện.
Để hiểu ERC-8211 giải quyết vấn đề gì, hãy xem một ví dụ điển hình nhất: giả sử Agent muốn thực hiện một việc trông rất bình thường — đổi ETH trong tài khoản lấy USDC, sau đó gửi toàn bộ số tiền vào Spark để kiếm lãi suất.
Dưới mô hình xử lý batch tĩnh hiện tại, Agent phải ước lượng trước số USDC sẽ nhận được sau khi Swap, thường buộc bạn phải cố định sẵn số tiền đầu vào cho bước thứ hai khi ký, nếu ước lượng quá cao thì số tiền thực tế nhận được không đủ, toàn bộ lô giao dịch sẽ bị hoàn lại; nếu ước lượng quá thấp thì một phần vốn sẽ bị đình trệ trong ví và không thể sử dụng.
Nói cách khác, về cơ bản đã rơi vào tình thế tiến thoái lưỡng nan: либо chấp nhận rủi ro thất bại, либо chấp nhận chi phí cơ hội. Đó là lý do tại sao nhiều quy trình trên chuỗi dù không hề phức tạp, nhưng khi số bước kéo dài đến 5, 8 bước, thậm chí xuyên qua hai chuỗi, sẽ nhanh chóng trở nên dễ bị tổn thương — không phải vì chiến lược本身 quá phức tạp đến mức không thể mô tả, mà vì mô hình thực thi hiện tại quá phụ thuộc vào các tham số được định sẵn trước.
Nói tóm lại, giới hạn khả năng của batch tĩnh thực tế xác định giới hạn chiến lược mà Agent có thể thực hiện một cách an toàn.
Từ góc độ này, ERC-8211 không nhằm giải quyết vấn đề AI Agent ra quyết định như thế nào, mà là sau khi Agent đã đưa ra quyết định, liệu có cách nào trên chuỗi để thực thi nó một cách tự nhiên, ổn định và an toàn hơn. Từ đó, việc thực thi trên chuỗi lần đầu tiên sở hữu một hình thức biểu đạt được thiết kế riêng cho AI Agent.
Hai, ERC-8211 đã thay đổi những gì?
Sự đột phá cốt lõi của ERC-8211 không nằm ở việc nhét thêm nhiều bước vào một lần ký, mà ở việc nâng cấp xử lý hàng loạt từ một chuỗi giao dịch có tham số được ghi cứng thành một “chương trình” có tham số được đánh giá động tại thời điểm thực thi.
Nghe có vẻ khá trừu tượng, nhưng không khó hiểu, phía chính thức đã dùng một câu để mô tả nó: From transactions to programs.
Điều này có nghĩa là ERC-8211 không còn coi batch là một danh sách các hành động được thực thi theo thứ tự, mà xem nó như một chương trình thực thi được đánh giá tại thời điểm chạy với các điều kiện bảo mật, cụ thể hơn, nó đạt được điều này thông qua ba nguyên tố có thể kết hợp:
- Fetchers (bộ lấy giá trị): Xác định nguồn lấy giá trị cho tham số này, có thể là một truy vấn về số dư hiện tại của một địa chỉ, giúp tham số không còn là ảnh chụp khi ký mà là số đọc thời gian thực được lấy từ trạng thái chuỗi tại thời điểm thực thi;
- Constraints: Sau khi các tham số được giải ra, chúng còn phải được kiểm tra qua các ràng buộc nội tuyến — ví dụ: “USDC nhận được phải ≥ 2500” hoặc “độ trượt không được vượt quá 0,5%”, các ràng buộc này được xác minh trước khi giá trị được chuyển đến lệnh gọi tiếp theo; bất kỳ ràng buộc nào không đạt yêu cầu sẽ khiến toàn bộ lô giao dịch bị hoàn lại ngay lập tức;
- Điều kiện kích hoạt: Có thể hiểu là người giữ cửa giữa các bước, không chịu trách nhiệm tạo ra giá trị, mà chỉ đảm nhiệm việc xác định liệu có nên tiếp tục thực hiện hay không; ví dụ trong bối cảnh chéo chuỗi, batch phía Ethereum có thể sử dụng predicate để chờ điều kiện “WETH được chuyển đến từ chuỗi khác đã được nhận”, và không gửi giao dịch cho đến khi điều kiện này được đáp ứng.
Trong thiết kế này, mỗi tham số phải trả lời hai câu hỏi: Thứ nhất, giá trị này khi thực thi phải lấy từ đâu; thứ hai, trước khi được sử dụng thực sự trong lời gọi, nó cần đáp ứng điều kiện gì, để khi ba yếu tố này kết hợp lại, một lô không còn là chuỗi giao dịch đơn thuần, mà là một chương trình nhúng kiểm tra bảo mật.
Cuối cùng, mô hình tư duy xử lý batch tĩnh là một danh sách kiểm tra — thực hiện tuần tự ba bước A, B, C; trong khi mô hình tư duy của ERC-8211 là một chương trình có điều kiện — sau khi A thực hiện, lấy đầu ra thực tế của A làm đầu vào cho B; B chỉ chuyển sang C nếu đáp ứng các ràng buộc; bất kỳ bước nào không đạt yêu cầu đều khiến toàn bộ lô bị hoàn tác.
Chúng ta có thể hiểu đơn giản nó như một cơ chế “xử lý hàng loạt thông minh” được thiết kế riêng cho AI Agent và các thao tác DeFi phức tạp, bởi trong các thao tác trên chuỗi truyền thống, việc thực hiện một chiến lược DeFi phức tạp thường đòi hỏi nhiều giao dịch độc lập: rút vốn từ các协议 cho vay, hoán đổi token, rồi gửi vào một protocol khác (đọc thêm《Khái quát về các giao thức AI mã hóa: Bắt đầu từ chiến trường chính của Ethereum, làm thế nào để xây dựng hệ điều hành mới cho AI Agent?》).
Mỗi bước đều cần được ký và xác nhận riêng lẻ, điều này đã phiền phức đối với người dùng con người và càng trở thành điểm nghẽn đối với các AI Agent cần thực hiện thao tác tự chủ tần suất cao, trong khi giải pháp của ERC-8211 cho phép kết hợp nhiều thao tác blockchain trong một giao dịch duy nhất, mỗi bước sẽ phân tích động giá trị thực tế khi thực thi và phải đáp ứng các điều kiện đã định trước mới có thể tiếp tục bước tiếp theo.
Ví dụ, một Agent có thể thực hiện trong một giao dịch ký tên: rút vốn từ Aave → đổi số tiền thực nhận trên Uniswap → gửi kết quả đổi sang Compound — tất cả được thực hiện nguyên tử, không cần viết hợp đồng thông minh mới.
Ba、Tại sao nói nó liên quan nhiều hơn đến ví, đặc biệt là ví thông minh
ERC-8211 đáng được ngành ví chú ý không chỉ vì nó phù hợp với Agent, mà còn vì nó sẽ tái định nghĩa vị trí của ví trong chuỗi tương tác.
Ví tiền trong quá khứ giống như một trình ký xác minh an toàn, nhiệm vụ của nó là lưu trữ khóa riêng, hiển thị giao dịch, cho phép người dùng xác nhận, sau đó gửi chữ ký ra ngoài. Vai trò này đã rất quan trọng trong thời đại EOA và vẫn tiếp tục đúng trong thời đại trừu tượng tài khoản. Tuy nhiên, nếu trong tương lai ngày càng nhiều thao tác trên chuỗi được Agent thực hiện thay, thì vai trò của ví sẽ trở nên trung gian và nặng nề hơn.
Lý do rất đơn giản: khi người dùng không còn thao tác từng bước các hành động trên chuỗi, mà bắt đầu ủy quyền cho một Agent để thực hiện một chuỗi mục tiêu, ví tiền phải có khả năng tiếp nhận đối tượng tương tác cấp cao hơn này — nó không còn chỉ hiển thị một địa chỉ hợp đồng và một đoạn calldata, mà là toàn bộ chương trình thực thi gồm “ý định — logic truy xuất giá trị — phán đoán điều kiện — kết quả cuối cùng”.
Do đó, ví trong tương lai không chỉ cần hiểu các giao dịch, mà còn cần hiểu các chương trình. ERC-8211 cung cấp một điểm tiếp cận rõ ràng hơn cho ví ở cấp độ này, vì nó explicitly ghi lại các ngữ nghĩa thực thi vào cấu trúc mã hóa, bao gồm việc các tham số đến từ đâu, phải đáp ứng những điều kiện gì, khi nào tiếp tục và khi nào rollback — tất cả đều không còn là những hộp đen ẩn trong logic phía sau, mà là những đối tượng có thể được ví giải thích, mô phỏng và hiển thị.
Từ góc nhìn ví, toàn bộ cơ chế này cuối cùng đều hướng đến một điều duy nhất, đó là người dùng không còn đang ký một chuỗi các lời gọi nền tảng mà họ khó có thể hiểu hoàn toàn, mà đang ký một chương trình thực thi có định hướng kết quả, ranh giới rõ ràng và điều kiện có thể xác minh:
- AI Agent có thể đảm nhiệm việc hiểu ý định người dùng và tạo ra lộ trình;
- Ví sẽ hiển thị đường dẫn này một cách rõ ràng hơn để người dùng xác minh;
- Và relayer chỉ chịu trách nhiệm gửi khi điều kiện được đáp ứng, không có quyền thay đổi kết quả;
Đây chính là lý do tại sao thực thi không quản lý được xem là điều kiện tiên quyết của Agentic DeFi, vì các tác nhân có thể tham gia, nhưng chủ quyền, ràng buộc và kết thúc cuối cùng vẫn được giữ trên chuỗi — đây cũng là điểm phù hợp thực sự giữa ERC-8211 và ví thông minh, khi nó đưa việc “biểu đạt an toàn các ý định phức tạp” vào tiêu chuẩn cấp giao thức.
Đáng chú ý là ERC-8211 hoàn toàn tương thích với các khung trừu tượng tài khoản như ERC-4337, EIP-7702, ERC-7579; nó không thay thế trừu tượng tài khoản, mà bổ sung một lớp ngữ nghĩa thực thi chương trình cho Agent trên nền tảng trừu tượng tài khoản.

Nếu ERC-4337 giải quyết vấn đề “ai có thể đại diện tôi khởi tạo giao dịch”, EIP-7702 giải quyết vấn đề “EOA làm thế nào để tạm thời sở hữu khả năng hợp đồng thông minh”, thì ERC-8211 giải quyết vấn đề: một khi Agent bắt đầu thay tôi thực hiện thao tác, liệu nó có thể hoàn thành toàn bộ chuỗi quyết định trong một lần ký không.
Xem lại sự phát triển của các mô hình tương tác trên chuỗi của Ethereum trong 10 năm qua:
- Giai đoạn một: Một chữ ký = Một lần gọi hàm (thời kỳ EOA)
- Giai đoạn hai: Một chữ ký = Một bộ gọi đóng gói tĩnh (thời kỳ ERC-4337, EIP-5792)
- Giai đoạn thứ ba: Một chữ ký = Một chương trình ý định được đánh giá động (thời đại ERC-8211)
Mỗi lần chuyển đổi đều có nghĩa là người dùng (hoặc đại diện của người dùng là Agent) có thể thể hiện những mục tiêu phức tạp hơn với ít sự cản trở hơn.
Mặc dù ERC-8211 hiện vẫn đang ở giai đoạn bản thảo, các cuộc thảo luận kỹ thuật vẫn đang diễn ra và việc tích hợp rộng rãi giao thức này cần thêm thời gian, nhưng hướng đi mà nó chỉ ra đã đủ rõ ràng: khi AI Agent thực sự bắt đầu đưa ra quyết định trên chuỗi thay cho con người, trên chuỗi sẽ cần một cú pháp thực thi bản địa tương thích với nó.

