Ipinakilala ng Google ang Gemini 3.1 Flash-Lite na may 1/8 na gastos sa input kaysa sa Pro at lumalampas sa GPT-5 Mini at Claude 4.5 Haiku sa 6 na benchmark

iconKuCoinFlash
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ipinahayag ng Google ang preview ng Gemini 3.1 Flash-Lite noong Marso 4, 2026, bilang pinakamabilis at pinakamura sa mga modelo sa Gemini 3 series. Ginawa ito sa arkitekturang Gemini 3 Pro na may Mixture of Experts design, at nag-aalok ng presyo ng input na $0.25 bawat milyong token—1/8 na gastos kumpara sa bersyong Pro. Sa mga panloob na benchmark, lalong naging mas mahusay ang Flash-Lite kaysa sa GPT-5 mini at Claude 4.5 Haiku sa anim na kategorya, kabilang ang GPQA Diamond (86.9%) at LiveCodeBench (72.0%). Ang balitang ito sa blockchain ay nagpapakita ng pinakabagong hakbang ng Google sa kompetitibong larangan ng AI, at nagdadala ng bagong momentum sa balita sa crypto.

BlockBeats na mensahe, Marso 4, ipinakilala ng Google ang Gemini 3.1 Flash-Lite preview, na inilalagay bilang pinakamabilis at pinakamura sa Gemini 3 series. Batay sa Gemini 3 Pro architecture, gumagamit ito ng mixed experts (MoE) design na nag-activate lamang ng ilang parameter upang bawasan ang gastos sa pagpapatakbo. Ang presyo ng API ay $0.25/milyong token para sa input at $1.50/milyong token para sa output, na halos 1/8 ng presyo ng Gemini 3.1 Pro ($2/$18).


Sa aspeto ng performance, ang unang token latency ay nabawasan ng 2.5 beses kumpara sa Gemini 2.5 Flash, at ang output speed ay tumataas ng 45% patungo sa 363 token bawat segundo. Suportado ang maximum na 1 milyong token na input at 64,000 token na output, at tatanggapin ang text, imahe, audio, at video bilang input. Sa 11 internal benchmark tests, ang Flash-Lite ay lumampas sa GPT-5 mini at Claude 4.5 Haiku sa 6 dito, na nakakamit ng 86.9% sa GPQA Diamond (doctoral-level scientific Q&A), 76.8% sa MMMU-Pro (multimodal reasoning), at 72.0% sa LiveCodeBench (code generation).


Ang modelo ay may built-in na adjustable na "thinking levels", kung saan ang mga developer ay makakakontrol ng depth ng inference ng model sa AI Studio at Vertex AI upang balansehin ang kalidad at gastos sa mga high-frequency na scenario. Kasalukuyang available ang preview version sa pamamagitan ng Gemini API (Google AI Studio) at Vertex AI.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.