xAI milik Elon Musk menyelesaikan pelatihan Grok V9-Medium, berfokus pada pemrograman kompleks

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
xAI, tim Elon Musk, telah menyelesaikan pelatihan untuk model Grok V9-Medium dengan 1,5 triliun parameter, menurut berita on-chain terbaru. Model ini kini memasuki tahap fine-tuning terawasi dan akan segera memulai reinforcement learning. Tim menambahkan sejumlah besar kode Cursor selama pelatihan dan berencana menambahkan lebih banyak lagi. Dibandingkan dengan model v8-small saat ini yang menangani seluruh lalu lintas produksi, Grok V9-Medium diharapkan memiliki kinerja jauh lebih baik dalam pemrograman kompleks. Musk sebelumnya telah mengakui adanya kelemahan serius pada data pelatihan model v8-small. Versi baru ini menggandakan tiga kali jumlah parameter dan dioptimalkan untuk arsitektur GPU Blackwell, yang dapat membantu meningkatkan efisiensi pemrosesan data inflasi di masa depan.
ME AI pesan, menurut pemantauan Beating, Musk mengumumkan bahwa model dasar Grok V9-Medium dengan 1,5T parameter dari xAI telah selesai dilatih dan diharapkan dirilis untuk publik dalam 2 hingga 3 minggu. Saat ini, model telah memasuki tahap fine-tuning terawasi dan akan memulai pelatihan reinforcement learning dalam beberapa hari mendatang. Tim pengembang telah menyerap sejumlah besar data kode Cursor selama pelatihan tambahan, dan akan terus memasukkan lebih banyak sampel di masa depan. Dibandingkan dengan model v8-small yang saat ini mendukung seluruh lalu lintas produksi Grok, Grok V9-Medium dengan 1,5T parameter akan mengalami peningkatan signifikan dalam menangani tugas pemrograman kompleks. Sebelumnya, Musk secara terbuka mengakui bahwa v8-small dengan hanya 0,5T parameter (versi uji coba Grok 4.2) memiliki kekurangan serius dalam kualitas, kelengkapan, dan proporsi data pelatihan. Grok V9-Medium yang telah selesai dilatih tidak hanya meningkatkan skala parameter menjadi tiga kali lipat dari pendahulunya, tetapi juga dioptimalkan secara khusus untuk arsitektur GPU Blackwell. (Sumber: BlockBeats)
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.