Aliyun PAI mở nguồn mô hình nhỏ AgenticQwen với đào tạo kép dữ liệu Flywheel

KuCoinFlash

Thời gian phát hành: 06:51:58 27/04/2026

Chia sẻ

Tóm tắt

Tin tức trên chuỗi được công bố vào ngày 27 tháng 4 (UTC+8), khi đội PAI của Alibaba mở nguồn AgenticQwen, một mô hình nhỏ dành cho việc gọi công cụ công nghiệp. Được xây dựng trên MetaEra, các phiên bản 8B và 30B-A3B sử dụng khung dây chuyền dữ liệu kép để giảm chi phí suy luận. AgenticQwen-8B đạt 47.4 điểm trên TAU-2 và BFCL-V4, vượt trội so với Qwen3-8B (23.8) và gần bằng Qwen3-235B (52.0). AgenticQwen-30B-A3B (3B tham số hoạt động) đạt 50.2 điểm. Mô hình hiện đã được triển khai trong các hệ thống sản xuất, đạt tốc độ suy luận tương đương các mô hình 235B. Việc theo dõi dữ liệu lạm phát và các tác vụ thực tế khác hiện nay hiệu quả hơn nhờ bản phát hành này.

Tin tức từ AIMPACT, ngày 27 tháng 4 (UTC+8), theo giám sát của Beating, nhóm PAI của Alibaba đã phát hành và mở nguồn mô hình ngôn ngữ tác nhân nhỏ được thiết kế đặc biệt cho việc gọi công cụ công nghiệp – AgenticQwen (bao gồm hai phiên bản 8B và 30B-A3B). Chuỗi mô hình này được huấn luyện thông qua khung học tăng cường sáng tạo “vòng lặp dữ liệu kép”, giúp giảm đáng kể chi phí suy luận đồng thời đạt được khả năng tác nhân (Agent) gần với các mô hình quy mô hàng tỷ tham số. Cơ chế cốt lõi nằm ở phương pháp huấn luyện “vòng lặp dữ liệu kép”. Dữ liệu tổng hợp truyền thống dễ bị đồng nhất, khiến hiệu suất mô hình đạt ngưỡng giới hạn; AgenticQwen giới thiệu hai vòng lặp: vòng lặp suy luận tự động tạo ra các biến thể khó hơn từ các lỗi của mô hình; vòng lặp tác nhân mở rộng các luồng công việc tuyến tính đơn giản (như quy trình đặt vé duy nhất) thành các cây hành vi đa nhánh bao gồm ràng buộc, từ chối và điều kiện đối kháng, mô phỏng các tình huống ra quyết định phức tạp thực tế. Kết quả đánh giá cho thấy AgenticQwen-8B đạt điểm trung bình 47.4 trên các bộ dữ liệu chuẩn môi trường công cụ thực tế (như TAU-2 và BFCL-V4), vượt xa Qwen3-8B cơ sở (23.8) và tiến gần đến Qwen3-235B (52.0). AgenticQwen-30B-A3B (chỉ kích hoạt 3B tham số) đạt điểm 50.2. Hiện tại, mô hình này đã được triển khai trong các hệ thống sản xuất nội bộ tương tự Manus, thu hẹp đáng kể khoảng cách với các mô hình 235B (thời gian suy luận đầu đến cuối ngắn hơn), tuy nhiên bài báo cũng thừa nhận rằng do giới hạn độ dài ngữ cảnh bản địa 40K, các mô hình nhỏ vẫn còn hạn chế trong các nhiệm vụ tìm kiếm sâu. (Nguồn: BlockBeats)

Nguồn:Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.