Google lance Gemini 3.1 Flash-Lite avec un coût d'entrée 8 fois inférieur à celui de Pro et surpasse GPT-5 Mini et Claude 4.5 Haiku dans 6 benchmarks

KuCoinFlash

Date de parution : 04/03/2026 01:46:15

Résumé

Google a annoncé la version préliminaire de Gemini 3.1 Flash-Lite le 4 mars 2026, en tant que modèle le plus rapide et le plus abordable de la série Gemini 3. Construit sur l'architecture Gemini 3 Pro avec une conception Mixture of Experts, il propose un prix d'entrée à 0,25 $ par million de jetons — un huitième du coût de la version Pro. Dans les benchmarks internes, Flash-Lite a surpassé GPT-5 mini et Claude 4.5 Haiku dans six catégories, notamment GPQA Diamond (86,9 %) et LiveCodeBench (72,0 %). Cette actualité sur chaîne met en lumière la dernière initiative de Google dans le domaine compétitif de l'IA, apportant un nouvel élan aux actualités crypto.

Message de BlockBeats, le 4 mars, Google a lancé la version préliminaire de Gemini 3.1 Flash-Lite, positionné comme le modèle le plus rapide et le moins coûteux de la série Gemini 3. Ce modèle repose sur l'architecture de Gemini 3 Pro, utilise une conception de experts mixtes (MoE) et n'active que部分 des paramètres pour réduire le coût d'inférence. Le prix de l'API est de 0,25 $ par million de tokens en entrée et de 1,50 $ par million de tokens en sortie, soit environ 1/8 du prix de Gemini 3.1 Pro (2 $ / 18 $).

En termes de performance, par rapport à Gemini 2.5 Flash, la latence du premier token est réduite de 2,5 fois, la vitesse de sortie est améliorée de 45 %, atteignant 363 tokens par seconde. Il prend en charge une entrée maximale de 1 million de tokens et une sortie maximale de 64 000 tokens, acceptant les entrées textuelles, d’images, d’audio et de vidéo. Sur 11 tests internes, Flash-Lite surpasse GPT-5 mini et Claude 4.5 Haiku dans 6 d’entre eux, avec un score de 86,9 % à GPQA Diamond (questions scientifiques de niveau doctorat), 76,8 % à MMMU-Pro (raisonnement multimodal) et 72,0 % à LiveCodeBench (génération de code).

Le modèle intègre un « niveau de réflexion » réglable ; les développeurs peuvent contrôler la profondeur d'inférence du modèle dans AI Studio et Vertex AI, équilibrant qualité et coût dans les scénarios à haute fréquence. Une version préliminaire est actuellement disponible via Gemini API (Google AI Studio) et Vertex AI.

Source:Afficher l'original

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.