source avatarDavid Arnal

Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy

Salah satu laporan pelatihan LLM frontier paling mendetail dalam beberapa tahun terakhir. Microsoft baru saja menerbitkan analisis teknis mendalam tentang MAI-Thinking-1, model berfokus pada penalarannya: • 35B parameter aktif / 1T total parameter MoE • Jendela konteks 256k (~600 halaman dokumen) • Dilatih pada kluster 8.000 GPU GB200 Bagian yang menarik: fokusnya kurang pada arsitektur baru dan lebih pada kualitas data + resep pelatihan. Di situlah sebagian besar keunggulan model frontier mungkin berpindah. Model ini tidak akan di-open-source, tetapi Microsoft berencana menawarkan fine-tuning melalui API. Jika lebih banyak laboratorium Big Tech mulai membagikan detail selevel ini lagi, para peneliti dan pengembang akan mendapatkan pandangan yang jauh lebih jelas tentang apa yang benar-benar penting. Menurut Anda, keuntungan besar berikutnya akan datang dari arsitektur yang lebih baik—atau data dan pipeline pelatihan yang lebih baik?

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.