Google 推出 Gemini 3.1 Flash-Lite,輸入成本僅為 Pro 的 1/8,並在 6 項基準測試中表現優於 GPT-5 Mini 和 Claude 4.5 Haiku

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Google 於 2026 年 3 月 4 日宣布推出 Gemini 3.1 Flash-Lite 預覽版,為 Gemini 3 系列中最快且最具成本效益的模型。該模型基於 Gemini 3 Pro 架構並採用專家混合設計,輸入定價為每百萬個 token $0.25,僅為 Pro 版本的 1/8。在內部基準測試中,Flash-Lite 在六個類別中表現優於 GPT-5 mini 和 Claude 4.5 Haiku,包括 GPQA Diamond(86.9%)和 LiveCodeBench(72.0%)。此鏈上新聞突顯了 Google 在競爭激烈的 AI 領域的最新動向,為加密貨幣新聞注入了新動能。

BlockBeats 消息,3 月 4 日,谷歌發布 Gemini 3.1 Flash-Lite 預覽版,定位為 Gemini 3 系列中速度最快、成本最低的模型。該模型基於 Gemini 3 Pro 架構,採用混合專家(MoE)設計,僅激活部分參數以降低推理成本。API 定價為輸入 $0.25/百萬 token、輸出 $1.50/百萬 token,分別為 Gemini 3.1 Pro($2/$18)的約 1/8。


在性能方面,與 Gemini 2.5 Flash 相比,首個 token 延遲縮短 2.5 倍,輸出速度提升 45%,達到每秒 363 token。支援最大 100 萬 token 輸入和 6.4 萬 token 輸出,接受文字、圖片、音訊和影片輸入。在 11 項內部基準測試中,Flash-Lite 在 6 項上超越 GPT-5 mini 和 Claude 4.5 Haiku,GPQA Diamond(博士級科學問答)達 86.9%,MMMU-Pro(多模態推理)76.8%,LiveCodeBench(代碼生成)72.0%。


該模型內置可調的「思考級別」(thinking levels),開發者可在 AI Studio 和 Vertex AI 中控制模型的推理深度,以在高頻場景中平衡品質與成本。目前透過 Gemini API(Google AI Studio)和 Vertex AI 提供預覽版存取。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露