Google Melancarkan Gemini 3.1 Flash-Lite dengan kos input 1/8 daripada Pro dan mengatasi GPT-5 Mini dan Claude 4.5 Haiku dalam 6 ujian

KuCoinFlash

Masa Siaran: 04/03/2026, 01:46:15

Kongsi

Ringkasan

Google mengumumkan pra-pelancaran Gemini 3.1 Flash-Lite pada 4 Mac 2026, sebagai model paling pantas dan paling berpatutan dalam siri Gemini 3. Dibina di atas arsitektur Gemini 3 Pro dengan reka bentuk Mixture of Experts, ia menawarkan harga input pada $0.25 setiap juta token—1/8 daripada kos versi Pro. Dalam tolok dalaman, Flash-Lite mengungguli GPT-5 mini dan Claude 4.5 Haiku dalam enam kategori, termasuk GPQA Diamond (86.9%) dan LiveCodeBench (72.0%). Berita ini di rantai menonjolkan langkah terkini Google dalam ruang AI yang kompetitif, menambah momentum baharu kepada berita kripto.

Mesej BlockBeats, 4 Mac, Google melancarkan versi pra-pandangan Gemini 3.1 Flash-Lite, yang dikenal pasti sebagai model paling pantas dan paling murah dalam siri Gemini 3. Model ini berdasarkan arsitektur Gemini 3 Pro, menggunakan reka bentuk Mixed Experts (MoE) yang hanya mengaktifkan sebahagian parameter untuk mengurangkan kos inferens. Harga API ialah $0.25/ juta token untuk input dan $1.50/ juta token untuk output, masing-masing sekitar 1/8 daripada Gemini 3.1 Pro ($2/$18).

Dari segi prestasi, dibandingkan dengan Gemini 2.5 Flash, latensi token pertama berkurang 2.5 kali ganda, kelajuan output meningkat 45% hingga mencapai 363 token per saat. Menyokong input sehingga 1 juta token dan output sehingga 64,000 token, menerima input teks, gambar, audio, dan video. Dalam 11 ujian piawai dalaman, Flash-Lite melebihi GPT-5 mini dan Claude 4.5 Haiku dalam 6 ujian, dengan skor 86.9% untuk GPQA Diamond (soal jawab sains peringkat doktor), 76.8% untuk MMMU-Pro (penalaran multimodal), dan 72.0% untuk LiveCodeBench (penghasilan kod).

Model ini dilengkapi dengan "tingkat pemikiran" yang boleh disesuaikan, di mana pembangun boleh mengawal kedalaman inferens model di AI Studio dan Vertex AI untuk menyeimbangkan kualiti dan kos dalam skenario frekuensi tinggi. Versi pra-pandangan kini tersedia melalui Gemini API (Google AI Studio) dan Vertex AI.

Sumber:Tunjukkan artikel asal

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.