Google、Gemini 3.1 Flash-Liteを発表。Proの入力コストの1/8で、GPT-5 MiniおよびClaude 4.5 Haikuを6つのベンチマークで上回る

KuCoinFlash

公開時期： 2026/03/04 1:46:15

概要

Googleは2026年3月4日、Gemini 3シリーズで最も高速かつコストパフォーマンスに優れたモデルであるGemini 3.1 Flash-Liteのプレビューを発表しました。このモデルはGemini 3 Proアーキテクチャに基づき、Mixture of Experts設計を採用しており、入力コストは100万トークンあたり0.25ドルと、Pro版の1/8です。内部ベンチマークでは、Flash-LiteはGPQA Diamond（86.9％）やLiveCodeBench（72.0％）を含む6つのカテゴリでGPT-5 miniおよびClaude 4.5 Haikuを上回りました。このオンチェーンニュースは、競争の激しいAI分野におけるGoogleの最新の動きを示し、暗号通貨ニュースに新たな勢いをもたらしています。

BlockBeatsの情報によると、3月4日、GoogleはGemini 3.1 Flash-Liteのプレビュー版をリリースし、Gemini 3シリーズの中で最速かつ最安価なモデルとして位置づけました。このモデルはGemini 3 Proアーキテクチャを基盤とし、混合エキスパート（MoE）設計を採用して、推論コストを削減するために一部のパラメータのみを活性化します。APIの価格は、入力が$0.25/百万トークン、出力が$1.50/百万トークンで、それぞれGemini 3.1 Pro（$2/$18）の約1/8です。

性能面では、Gemini 2.5 Flash と比較して、最初のトークンの遅延が2.5倍短縮され、出力速度が45%向上し、毎秒363トークンを達成しました。最大100万トークンの入力と6.4万トークンの出力をサポートし、テキスト、画像、音声、動画の入力を受け付けます。11の内部ベンチマークテストのうち、Flash-LiteはGPT-5 miniおよびClaude 4.5 Haikuを6つのテストで上回り、GPQA Diamond（博士レベルの科学的質問応答）では86.9%、MMMU-Pro（マルチモーダル推論）では76.8%、LiveCodeBench（コード生成）では72.0%を記録しました。

このモデルには調整可能な「思考レベル」（thinking levels）が内蔵されており、開発者はAI StudioおよびVertex AIでモデルの推論深度を制御し、高頻度シナリオにおいて品質とコストのバランスを取ることができます。現在、Gemini API（Google AI Studio）およびVertex AIを通じてプレビュー版へのアクセスが提供されています。

出典:原文を表示

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。