Google Meluncurkan Gemini 3.1 Flash-Lite dengan biaya input 1/8 dari Pro dan mengungguli GPT-5 Mini dan Claude 4.5 Haiku dalam 6 Uji Coba

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Google mengumumkan preview Gemini 3.1 Flash-Lite pada 4 Maret 2026, sebagai model tercepat dan paling terjangkau dalam seri Gemini 3. Dibangun di atas arsitektur Gemini 3 Pro dengan desain Mixture of Experts, model ini menawarkan harga input sebesar $0,25 per juta token—1/8 biaya versi Pro. Dalam benchmark internal, Flash-Lite mengungguli GPT-5 mini dan Claude 4.5 Haiku dalam enam kategori, termasuk GPQA Diamond (86,9%) dan LiveCodeBench (72,0%). Berita on-chain ini menyoroti langkah terbaru Google di bidang AI yang kompetitif, menambahkan momentum baru ke berita kripto.

Pesan BlockBeats, 4 Maret, Google meluncurkan versi pratinjau Gemini 3.1 Flash-Lite, yang diposisikan sebagai model tercepat dan termurah dalam seri Gemini 3. Model ini didasarkan pada arsitektur Gemini 3 Pro, menggunakan desain Mixture of Experts (MoE) yang hanya mengaktifkan sebagian parameter untuk mengurangi biaya inferensi. Harga API adalah $0,25 per juta token input dan $1,50 per juta token output, masing-masing sekitar 1/8 dari harga Gemini 3.1 Pro ($2/$18).


Dibandingkan dengan Gemini 2.5 Flash, latensi token pertama berkurang 2,5 kali, kecepatan output meningkat 45%, mencapai 363 token per detik. Mendukung input hingga 1 juta token dan output hingga 64.000 token, menerima input teks, gambar, audio, dan video. Dalam 11 uji coba internal, Flash-Lite unggul atas GPT-5 mini dan Claude 4.5 Haiku pada 6 di antaranya, dengan skor GPQA Diamond (pertanyaan ilmiah tingkat doktor) sebesar 86,9%, MMMU-Pro (penalaran multimodal) 76,8%, dan LiveCodeBench (generasi kode) 72,0%.


Model ini dilengkapi dengan tingkat pemikiran yang dapat disesuaikan (thinking levels), memungkinkan pengembang mengontrol kedalaman inferensi model di AI Studio dan Vertex AI untuk menyeimbangkan kualitas dan biaya dalam skenario frekuensi tinggi. Versi pratinjau kini tersedia melalui Gemini API (Google AI Studio) dan Vertex AI.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.