Google DeepMind ra mắt DiffusionGemma, tăng tốc độ tạo văn bản lên 4 lần
KuCoinFlashChia sẻ






Tin tức trên chuỗi: Google DeepMind đã ra mắt DiffusionGemma, một mô hình sinh văn bản mã nguồn mở giúp tăng tốc độ lên 4 lần. Sử dụng công nghệ khuếch tán, mô hình này tạo ra 256 token đồng thời, đạt hơn 1000 token/giây trên H100 và hơn 700 trên RTX 5090. Mô hình MoE 26B kích hoạt 3,8B tham số trong quá trình suy luận và hỗ trợ các GPU tiêu dùng sau khi lượng tử hóa. Mô hình có tính năng chú ý hai chiều và tự sửa lỗi, lý tưởng cho việc hoàn thành mã và chỉnh sửa nội tuyến. Mô hình đã được mở nguồn dưới giấy phép Apache 2.0. Các danh sách token mới có thể hưởng lợi từ những tiến bộ này trong hiệu suất sinh.
Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.