Google DeepMind ra mắt DiffusionGemma, tăng tốc độ tạo văn bản lên 4 lần

KuCoinFlash

Thời gian phát hành: 17:23:58 10/06/2026

Chia sẻ

Tóm tắt

Tin tức trên chuỗi: Google DeepMind đã ra mắt DiffusionGemma, một mô hình sinh văn bản mã nguồn mở giúp tăng tốc độ lên 4 lần. Sử dụng công nghệ khuếch tán, mô hình này tạo ra 256 token đồng thời, đạt hơn 1000 token/giây trên H100 và hơn 700 trên RTX 5090. Mô hình MoE 26B kích hoạt 3,8B tham số trong quá trình suy luận và hỗ trợ các GPU tiêu dùng sau khi lượng tử hóa. Mô hình có tính năng chú ý hai chiều và tự sửa lỗi, lý tưởng cho việc hoàn thành mã và chỉnh sửa nội tuyến. Mô hình đã được mở nguồn dưới giấy phép Apache 2.0. Các danh sách token mới có thể hưởng lợi từ những tiến bộ này trong hiệu suất sinh.

ME AI Tin tức, Google DeepMind đã phát hành mô hình thí nghiệm mã nguồn mở DiffusionGemma, sử dụng công nghệ khuếch tán văn bản, vượt qua cách tạo token từng bước theo mô hình tự hồi quy, đồng thời tạo song song 256 token mỗi lần tiến triển. Mô hình 26B MoE này khi suy luận chỉ kích hoạt 3,8B tham số, sau khi lượng tử hóa có thể chạy trên GPU tiêu dùng với 18GB VRAM. Trên H100 đạt hơn 1000 tokens/s, trên RTX 5090 đạt hơn 700 tokens/s, tăng tốc độ 4 lần. Mô hình có khả năng chú ý hai chiều và tự sửa lỗi, được thiết kế cho các luồng làm việc tương tác tại chỗ như chỉnh sửa nội tuyến, điền mã, và được phát hành dưới giấy phép Apache 2.0. (Nguồn: AiHot)

Nguồn:Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.