DeepSeek Mengumumkan Model Baru 'MODEL1' Setahun Setelah Peluncuran DeepSeek-R1

iconKuCoinFlash
Bagikan
AI summary iconRingkasan

Menurut laporan dari BlockBeats, pada 21 Januari, menurut berita dari QbitAI, pada perayaan ulang tahun pertama peluncuran DeepSeek-R1, model baru bernama "MODEL1" telah diungkapkan. DeepSeek memperbarui kode FlashMLA di GitHub, di mana dari 114 file, terdapat 28 bagian yang menyebutkan MODEL1, yang muncul sebagai model berbeda dari V32. Diketahui bahwa V32 adalah DeepSeek-V3.2, sehingga MODEL1 kemungkinan besar adalah arsitektur baru. Perbedaan spesifik dalam kode terlihat pada tata letak cache KV, penanganan sparsitas, dan dekode FP8, dengan beberapa perbedaan dalam optimasi memori.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.