Google DeepMind melancarkan DiffusionGemma, kelajuan penjanaan teks ditingkatkan 4 kali
KuCoinFlashKongsi






berita pada rantai: Google DeepMind telah melancarkan DiffusionGemma, model penghasil teks sumber terbuka yang meningkatkan kelajuan sebanyak 4x. Dengan menggunakan teknologi diffusi, ia menghasilkan 256 token secara serentak, mencapai lebih daripada 1000 token/s pada H100 dan 700+ pada RTX 5090. Model MoE 26B mengaktifkan 3.8B parameter semasa inferens dan menyokong GPU pengguna selepas kuantisasi. Ia menampilkan perhatian berarah dua arah dan penyesuaian sendiri, sesuai untuk penyelesaian kod dan penyuntingan dalam baris. Model ini telah dibuka sumber di bawah Apache 2.0. Pencatatan token baharu mungkin mendapat manfaat daripada kemajuan dalam kecekapan penghasilan seperti ini.
Sumber:Tunjukkan artikel asal
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.