Nếu thay vì chọn người thông minh nhất trong phòng, bạn có thể hỏi năm người và tổng hợp câu trả lời tốt nhất thì sao? Đó chính là điều OpenRouter đang kỳ vọng vào Fusion, một tính năng API mới kết hợp đầu ra từ nhiều mô hình AI song song để tạo ra các phản hồi chất lượng cao hơn.
Fusion, lần đầu tiên được ra mắt công khai như một thí nghiệm vào ngày 31 tháng 3 năm 2026, hiện đã được tích hợp đầy đủ vào API của OpenRouter. Mục tiêu rất đơn giản: chuyển một prompt duy nhất qua nhiều mô hình hàng đầu, phân tích các đầu ra để tìm sự đồng thuận, và cung cấp kết quả tổng hợp tốt hơn bất kỳ mô hình nào có thể tạo ra riêng lẻ.
Fusion hoạt động như thế nào
Hệ thống mặc định chạy các lệnh thông qua 3 đến 5 mô hình cùng lúc. Người dùng có thể tùy chỉnh thông qua các preset Chất lượng hoặc Ngân sách, và cũng có thể chỉ định các “mô hình đánh giá” để đánh giá và tổng hợp các đầu ra cạnh tranh.
Fusion có thể truy cập thông qua alias mô hình openrouter/fusion và hoạt động như một plugin cũng như công cụ máy chủ cho người dùng API tiêu chuẩn. Điều đó có nghĩa là các nhà phát triển đang sử dụng hạ tầng OpenRouter có thể tích hợp nó mà không cần thay đổi toàn bộ thiết lập hiện tại.
Mô hình định giá đáng chú ý vì đây không phải là gói đăng ký cố định. Thay vào đó, người dùng trả chi phí tích lũy của các kết quả hoàn thành cơ sở. Nếu bạn chạy một prompt qua bốn mô hình, bạn sẽ trả phí cho bốn kết quả hoàn thành. Lập luận của OpenRouter là ngay cả với cấu trúc chi phí chồng chéo này, cấu hình Bảng ngân sách của Fusion vẫn mang lại trí tuệ tương đương với Claude Fable 5, nhưng với giá khoảng một nửa so với các lựa chọn mô hình đơn lẻ cao cấp.
Fusion cũng tận dụng khả năng tìm kiếm web để làm phong phú thêm các phản hồi, mang lại một lớp nền tảng bổ sung cho các đầu ra của nó.
Những tuyên bố về hiệu suất có ý nghĩa
Theo dữ liệu từ ngày 12 tháng 6 năm 2026, Fusion đã thể hiện hiệu suất vượt trội so với GPT-5.5 và Claude Opus 4.8 trên một bộ gồm 100 nhiệm vụ nghiên cứu. Những nhiệm vụ này không phải là các bài kiểm tra câu hỏi và trả lời đơn giản. Chúng là các truy vấn phức tạp được thiết kế để kiểm tra độ sâu của lập luận.
Cấu hình bảng ngân sách được kiểm tra có chất lượng đầu ra tương đương với Claude Fable 5.
Nền tảng rộng lớn hơn của OpenRouter hiện đã hỗ trợ định tuyến qua hơn 60 nhà cung cấp và hơn 400 mô hình. Fusion không thay thế cơ sở hạ tầng này. Nó được tích hợp lên trên, cung cấp cho người dùng cách khai thác thêm giá trị từ các mô hình mà họ đang truy cập thông qua nền tảng.
