Google ra mắt Gemini 3.1 Flash-Lite với chi phí đầu vào bằng 1/8 so với Pro và vượt trội hơn GPT-5 Mini và Claude 4.5 Haiku tại 6 bài kiểm tra

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Google đã công bố bản dùng thử Gemini 3.1 Flash-Lite vào ngày 4 tháng 3 năm 2026, là mô hình nhanh nhất và tiết kiệm chi phí nhất trong dòng Gemini 3. Được xây dựng trên kiến trúc Gemini 3 Pro với thiết kế Mixture of Experts, nó cung cấp mức giá đầu vào là 0,25 USD mỗi triệu token—chỉ bằng 1/8 chi phí của phiên bản Pro. Trong các bài kiểm tra nội bộ, Flash-Lite vượt trội hơn GPT-5 mini và Claude 4.5 Haiku ở sáu danh mục, bao gồm GPQA Diamond (86,9%) và LiveCodeBench (72,0%). Tin tức trên chuỗi này nhấn mạnh động thái mới nhất của Google trong lĩnh vực AI cạnh tranh, mang lại đà tăng mới cho tin tức tiền điện tử.

BlockBeats tin tức, ngày 4 tháng 3, Google ra mắt bản xem trước Gemini 3.1 Flash-Lite, được định vị là mô hình nhanh nhất và chi phí thấp nhất trong dòng Gemini 3. Mô hình này dựa trên kiến trúc Gemini 3 Pro, sử dụng thiết kế chuyên gia hỗn hợp (MoE), chỉ kích hoạt một phần tham số để giảm chi phí suy luận. Giá API là $0,25/1 triệu token đầu vào và $1,50/1 triệu token đầu ra, tương đương khoảng 1/8 so với Gemini 3.1 Pro ($2/$18).


Về hiệu năng, so với Gemini 2.5 Flash, độ trễ token đầu tiên được rút ngắn 2,5 lần, tốc độ đầu ra tăng 45%, đạt 363 token mỗi giây. Hỗ trợ đầu vào tối đa 1 triệu token và đầu ra tối đa 64.000 token, chấp nhận đầu vào dạng văn bản, hình ảnh, âm thanh và video. Trong 11 bài kiểm tra nội bộ, Flash-Lite vượt trội hơn GPT-5 mini và Claude 4.5 Haiku ở 6 bài, đạt 86,9% trên GPQA Diamond (câu hỏi khoa học cấp tiến sĩ), 76,8% trên MMMU-Pro (suy luận đa phương tiện) và 72,0% trên LiveCodeBench (tạo mã).


Mô hình tích hợp mức độ suy nghĩ (thinking levels) có thể điều chỉnh, cho phép nhà phát triển kiểm soát độ sâu suy luận của mô hình trong AI Studio và Vertex AI để cân bằng giữa chất lượng và chi phí trong các kịch bản tần suất cao. Hiện tại, phiên bản dùng thử được cung cấp thông qua Gemini API (Google AI Studio) và Vertex AI.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.