Google запускает Gemini 3.1 Flash-Lite с стоимостью ввода в 8 раз ниже, чем у Pro, и превосходит GPT-5 Mini и Claude 4.5 Haiku в 6 тестах

KuCoinFlash

Время выхода: 04.03.2026, 01:46:15

Сводка

Google объявила о предварительном запуске Gemini 3.1 Flash-Lite 4 марта 2026 года как самую быструю и доступную модель в серии Gemini 3. Построенная на архитектуре Gemini 3 Pro с использованием дизайна Mixture of Experts, она предлагает цену ввода на уровне 0,25 доллара за миллион токенов — в восемь раз дешевле, чем версия Pro. В внутренних тестах Flash-Lite превзошла GPT-5 mini и Claude 4.5 Haiku в шести категориях, включая GPQA Diamond (86,9%) и LiveCodeBench (72,0%). Эта новость в блокчейне подчеркивает последний шаг Google в конкурентной области ИИ, добавляя свежий импульс к крипто-новостям.

Сообщение BlockBeats, 4 марта: Google выпустила предварительную версию Gemini 3.1 Flash-Lite, позиционируя её как самую быструю и самую недорогую модель в серии Gemini 3. Модель основана на архитектуре Gemini 3 Pro и использует дизайн смешанных экспертов (MoE), активируя только часть параметров для снижения стоимости вывода. Цена API: ввод — $0,25 за миллион токенов, вывод — $1,50 за миллион токенов, что составляет примерно 1/8 от цены Gemini 3.1 Pro ($2/$18).

В плане производительности по сравнению с Gemini 2.5 Flash время задержки первого токена сокращено в 2,5 раза, скорость вывода увеличена на 45% и достигла 363 токенов в секунду. Поддерживается максимальный ввод до 1 миллиона токенов и вывод до 64 000 токенов. Принимаются входные данные в формате текста, изображений, аудио и видео. В 11 внутренних тестах Flash-Lite превзошел GPT-5 mini и Claude 4.5 Haiku в 6 тестах: GPQA Diamond (научные вопросы уровня доктора) — 86,9%, MMMU-Pro (мультимодальное рассуждение) — 76,8%, LiveCodeBench (генерация кода) — 72,0%.

Эта модель включает настраиваемый «уровень мышления» (thinking levels), позволяющий разработчикам управлять глубиной вывода модели в AI Studio и Vertex AI, обеспечивая баланс между качеством и стоимостью в сценариях с высокой частотой использования. В настоящее время предварительная версия доступна через Gemini API (Google AI Studio) и Vertex AI.

Источник:Показать оригинал

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.