Google lanza Gemini 3.1 Flash-Lite con 1/8 del costo de entrada de Pro y supera a GPT-5 Mini y Claude 4.5 Haiku en 6 pruebas

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Google anunció la versión preliminar de Gemini 3.1 Flash-Lite el 4 de marzo de 2026, como el modelo más rápido y asequible de la serie Gemini 3. Construido sobre la arquitectura Gemini 3 Pro con un diseño Mixture of Experts, ofrece un precio de entrada de $0.25 por millón de tokens, un octavo del costo de la versión Pro. En pruebas internas, Flash-Lite superó a GPT-5 mini y Claude 4.5 Haiku en seis categorías, incluyendo GPQA Diamond (86.9%) y LiveCodeBench (72.0%). Esta noticia en cadena resalta el último movimiento de Google en el competitivo ámbito de la IA, aportando nuevo impulso a las noticias de cripto.

Mensaje de BlockBeats, 4 de marzo: Google lanzó la versión preliminar de Gemini 3.1 Flash-Lite, posicionado como el modelo más rápido y de menor costo de la serie Gemini 3. Este modelo se basa en la arquitectura de Gemini 3 Pro y utiliza un diseño de expertos mixtos (MoE) que activa solo una parte de los parámetros para reducir el costo de inferencia. El precio de la API es de $0.25 por millón de tokens de entrada y $1.50 por millón de tokens de salida, aproximadamente 1/8 del precio de Gemini 3.1 Pro ($2/$18).


En términos de rendimiento, en comparación con Gemini 2.5 Flash, la latencia del primer token se reduce 2.5 veces, la velocidad de salida aumenta un 45 %, alcanzando 363 tokens por segundo. Admite entradas de hasta 1 millón de tokens y salidas de hasta 64 000 tokens, aceptando entradas de texto, imágenes, audio y video. En 11 pruebas internas, Flash-Lite superó a GPT-5 mini y Claude 4.5 Haiku en 6 de ellas, logrando un 86.9 % en GPQA Diamond (preguntas y respuestas científicas de nivel doctorado), 76.8 % en MMMU-Pro (razonamiento multimodal) y 72.0 % en LiveCodeBench (generación de código).


El modelo incluye un «nivel de pensamiento» ajustable, que permite a los desarrolladores controlar la profundidad de la inferencia del modelo en AI Studio y Vertex AI, equilibrando calidad y costo en escenarios de alta frecuencia. Actualmente se ofrece acceso en versión preliminar a través de Gemini API (Google AI Studio) y Vertex AI.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.