DeepSeek Memperkenalkan Model Baru 'MODEL1' Setahun Selepas Pelancaran DeepSeek-R1

iconKuCoinFlash
Kongsi
AI summary iconRingkasan

Maklumat dari BlockBeats, pada 21 Januari, mengikut laporan Quantum Bit, ketika sambutan ulang tahun pertama pelancaran DeepSeek-R1, model baru yang dikenali sebagai "MODEL1" telah diperkenalkan. DeepSeek telah memperbaharui kod FlashMLA di GitHub, dengan 28 rujukan kepada MODEL1 dalam 114 fail, dan MODEL1 muncul sebagai model berbeza daripada V32. Diketahui V32 adalah DeepSeek-V3.2, jadi MODEL1 mungkin merupakan arsitektur baru. Perbezaan kod spesifik terdapat dalam susun atur cache KV, pengendalian kelincian, dan aspek penukaran FP8, dengan beberapa perbezaan dalam pengoptimuman ingatan.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.