Mô hình Dense Qwen 3.6 27B đạt 40 tok/s trên RTX 3090

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Tin tức trên chuỗi từ MetaEra cho thấy mô hình Qwen 3.6 27B Dense đạt 40 token/giây trên một GPU RTX 3090 24GB duy nhất. Người dùng @sudoingX đã đăng kết quả vào ngày 24 tháng 4 (UTC+8) bằng cách sử dụng lượng tử hóa Q4_K_M của llama.cpp. Không áp dụng bất kỳ thủ thuật hay kernel kết hợp nào. Một bài kiểm tra swarm hạt nhân tùy chỉnh cũng đã được phát triển. Các nền tảng tin tức tiền điện tử đang theo dõi sát sao hiệu suất này.

Thông báo từ AIMPACT, ngày 24 tháng 4 (UTC+8), vào ngày 24 tháng 4 năm 2026, người dùng @sudoingX đã công bố kết quả thử nghiệm ban đầu: Mô hình Qwen 3.6 27B Dense đạt tốc độ 40 tok/s trên một card RTX 3090 24GB, vượt qua 10/10 bài kiểm tra. Kết quả này không sử dụng kỹ thuật lượng tử hóa hay kernel hợp nhất, chỉ áp dụng lượng tử hóa trực tiếp Q4_K_M từ llama.cpp. Người dùng cũng đã viết một bài kiểm tra bầy đàn hạt để đánh giá mô hình. (Nguồn: InFoQ)

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.