MiniMax Menggoda Model AI M3 Dengan Kelajuan Penerjemahan 15.6x Lebih Cepat

iconCryptoBriefing
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
MiniMax, sebuah lab AI berpusat di Shanghai yang disokong oleh Tencent, Alibaba, dan miHoYo, telah memperkenalkan model AI M3 yang akan datang. Model ini menjanjikan kecepatan decoding 15.6 kali lebih pantas dan kecepatan prefill 9.7 kali lebih pantas untuk konteks 1 juta token berbanding M2. Peningkatan ini diperoleh daripada MiniMax Sparse Attention (MSA), satu teknik yang menggunakan pemilihan blok dinamik berdasarkan GQA. Siri M2 termasuk M2, M2.5, dan M2.7. Tiada maklumat mengenai bilangan parameter, lesen, atau tarikh pelancaran M3 telah disahkan. Kemas kini berita AI + kripto ini menonjolkan kemungkinan senarai token baru yang sedang dalam perancangan.

MiniMax, makmal AI berpangkalan di Shanghai yang disokong oleh Tencent, Alibaba, dan miHoYo, baru sahaja mengeluarkan laporan teknikal mengenai siri model M2-nya. Di dalamnya terdapat petunjuk mengenai model M3 generasi seterusnya, yang menurut syarikat tersebut mencapai kelajuan dekod 15.6x lebih pantas dan kelajuan prefill 9.7x lebih pantas berbanding M2 apabila memproses konteks 1M-token.

Apa yang sebenarnya dibina oleh MiniMax

Rahsia di sebalik teaser M3 adalah sesuatu yang MiniMax panggil MiniMax Sparse Attention, atau MSA. Ia dibina berdasarkan teknik yang dipanggil pemilihan blok dinamik yang dipandu GQA. Alih-alih membolehkan model memperhatikan setiap maklumat dalam tetingkap konteks yang besar, MSA memilih dengan bijak blok-blok data yang benar-benar penting untuk setiap soalan tertentu. Hasilnya ialah penggunaan komputasi yang jauh lebih rendah dengan kualiti output yang hampir sama.

MiniMax menyatakan bahawa model M3 mengekalkan kualiti output yang sebanding dengan M2 walaupun peningkatan kelajuan yang besar ini.

Laporan teknikal itu sendiri merangkumi inovasi kejuruteraan di seluruh jajaran M2: M2, M2.5, dan M2.7.

Iklan

Perlu diperhatikan: tiada maklumat yang disahkan mengenai bilangan parameter, butiran lesen, atau jadual pelancaran untuk M3 telah diberikan sejauh ini.

Jejak MiniMax yang semakin membesar

Ditubuhkan pada awal 2022, MiniMax disenaraikan di Bursa Saham Hong Kong pada Januari 2026. Penyokongnya, Tencent, Alibaba, dan miHoYo (studio di sebalik Genshin Impact), mewakili pelbagai kalangan elit teknologi dan permainan China.

Selain teks dan kod, MiniMax mengendalikan platform Hailuo untuk penghasilan video. Hailuo 2.3, iterasi terkini, telah memproses miliaran hasil menurut syarikat.

Mengapa pelabur kripto dan AI perlu memperhatikan

Rangkaian inferens terpusat sentiasa dihambat oleh latensi dan kos. Jika kecekapan MSA menghasilkan pengurangan jejak sumber setiap permintaan, pengendali nod boleh melayani lebih banyak permintaan tanpa meningkatkan peralatan mereka.

Agen AI berasaskan kripto yang memantau data pada rantai, melaksanakan perdagangan, atau menganalisis kontrak pintar secara masa nyata juga dibatasi oleh kelajuan model asas mereka dalam memproses maklumat. Sebuah model yang menangani konteks 1M-token pada kelajuan hampir 16 kali lebih pantas daripada sebelumnya membuka peluang penggunaan yang sebelumnya tidak praktikal.

Tiada integrasi langsung antara teknologi MiniMax dan sebarang platform blok rantai atau token digital yang telah disahkan. Hubungan antara model AI yang lebih pantas dan aplikasi kripto tetap merupakan kesimpulan logik, bukan pengumuman produk.

Bagi pelabur di ruang AI terdesentralisasi, metrik utama yang perlu dipantau bukanlah tarikh pelancaran M3. Ia ialah sama ada arsitektur MSA dibuka sumber bersama dengan berat model. Jika MiniMax mengikuti corak lalunya dalam perlesenan yang longgar, setiap projek inferens terdesentralisasi di seluruh dunia akan mendapat peningkatan percuma kepada panduan kecekapan mereka. Jika syarikat mengekalkan MSA sebagai milik, keuntungan kompetitif akan kekal terpusat di Shanghai.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.