Berita ME, 20 Mei (UTC+8), menurut pemantauan Beating, perusahaan chip wafer Cerebras mengumumkan peluncuran model besar dengan triliunan parameter, Kimi K2.6, dalam pengujian perusahaan. Dengan mengintegrasikan chip secara langsung pada seluruh wafer silikon berukuran 12 inci, latensi koneksi tradisional tingkat papan sepenuhnya dihilangkan. Hasil pengujian independen oleh lembaga penilaian Artificial Analysis menunjukkan kecepatan generasi mencapai 981 token/detik, 6,7 kali lebih cepat daripada layanan cloud GPU utama. Dalam tugas teks panjang dengan 10.000 token input dan 500 token output, waktu respons total berkurang dari 163,7 detik pada antarmuka resmi Kimi menjadi 5,6 detik, meningkatkan kecepatan hingga 29 kali lipat. Karena bobot model didistribusikan ke beberapa wafer untuk streaming nilai aktivasi, komunikasi antar lapisan sepenuhnya berjalan di jaringan anyaman internal wafer, dengan bandwidth komunikasi fisik mencapai lebih dari 200 kali lipat NVLink dalam arsitektur NVIDIA NVL72. Dengan optimasi komputasi terdistribusi, Kimi K2.6 menyimpan bobot asli dalam format 4-bit (4 bit) dengan kehilangan minimal, menggunakan bilangan floating-point 16-bit (16 bit) selama komputasi untuk mempertahankan akurasi, serta menerapkan kernel operator khusus dan decoding spekulatif untuk mencapai operasi real-time. (Sumber: BlockBeats)
Cerebras Menguji Model Kimi K2.6 dengan Peningkatan Kecepatan 29x pada Tugas Teks Panjang
KuCoinFlashBagikan






Cerebras mengungkapkan pada 20 Mei (UTC+8) bahwa perusahaan telah menguji model Kimi K2.6 dengan satu triliun parameter menggunakan chip skala wafer. Dengan memasang chip langsung pada wafer penuh 12 inci, perusahaan mengurangi penundaan komunikasi. Menurut Artificial Analysis, model tersebut menghasilkan teks pada kecepatan 981 token/detik, 6,7 kali lebih cepat daripada layanan GPU standar. Dalam pengujian teks panjang dengan 10.000 token input dan 500 token output, waktu respons turun dari 163,7 detik menjadi 5,6 detik, peningkatan sebesar 29 kali. Data on-chain terus menonjolkan peningkatan kinerja dalam infrastruktur AI.
Sumber:Tampilkan versi asli
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini.
Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.