Người dùng Google Gemini API báo cáo lỗi hóa đơn cực cao

icon MarsBit
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Báo cáo thị trường hàng ngày: Người dùng API Google Gemini gặp lỗi hóa đơn, với một số người bị tính phí gần 27.000 nhân dân tệ trong 12 giờ. Các vấn đề bao gồm phí cho bộ nhớ đệm đã xóa và các tác vụ không có đầu ra. Hai lỗi—hóa đơn bộ nhớ đệm ảo và vòng lặp suy luận vô hạn—vẫn chưa được khắc phục. Google chưa cung cấp giải pháp hoặc quy trình hoàn tiền. Báo cáo thị trường hàng tuần nhấn mạnh những lo ngại ngày càng tăng về quản lý chi phí và tính minh bạch của API. Các nhà phát triển kêu gọi Google đưa ra phản hồi rõ ràng.

Theo báo cáo của Beating Monitoring, gần đây, diễn đàn phát triển AI của Google đã ghi nhận nhiều trường hợp khẩn cấp về hệ thống tính phí Gemini API bị mất kiểm soát. Nhiều nhà phát triển đã phải đối mặt với các khoản phí bất thường lớn khi sử dụng bình thường do lỗ hổng ở tầng nền, ví dụ như có người bị trừ gần 27.000 nhân dân tệ chỉ trong 12 giờ. Hiện tại, các đội ngũ hóa đơn và kỹ thuật của Google vẫn đang đổ lỗi cho nhau và chưa đưa ra bất kỳ tuyên bố chính thức nào về việc khắc phục hoặc kênh hoàn tiền nhanh. Theo điều tra, hai lỗi cốt lõi chính gây ra hóa đơn khổng lồ cho các nhà phát triển là: Thứ nhất, lỗ hổng “bộ nhớ đệm ma”, khi bộ nhớ đệm ngữ cảnh được tạo qua API hết hạn hoặc bị xóa, danh sách quản lý phía trước đã được làm sạch, nhưng hệ thống tính phí phía sau của Google vẫn tiếp tục “chạy không tải” với tốc độ hàng ngàn nhân dân tệ mỗi giờ; Thứ hai, bẫy “vòng lặp tư duy vô hạn”, khi kích hoạt các công cụ như tìm kiếm trực tuyến, giới hạn “ngân sách suy luận” của mô hình bị vô hiệu hóa, khiến mô hình rơi vào suy luận vô hạn khi xử lý các tác vụ đơn giản, tiêu tốn tới 64.000 Token trước khi hết thời gian và sụp đổ — ngay cả khi đầu ra cuối cùng là “không có gì” (không trả về bất kỳ câu trả lời hữu ích nào), Google vẫn thu đầy đủ phí suy luận tăng vọt 1500 lần. Do hệ thống tính phí của Google Cloud có độ trễ nghiêm trọng từ 32 đến 72 giờ và thiếu cơ chế tự động ngắt khi vượt ngưỡng, các nhà phát triển đã bị trừ số tiền lớn trước khi nhận được cảnh báo. Vì dịch vụ hỗ trợ chính thức từ chối trách nhiệm và không có ai phản hồi tích cực trên diễn đàn, một số nhà phát triển bị ảnh hưởng đã tuyên bố ngừng hoàn toàn việc sử dụng bộ nhớ đệm ngữ cảnh và mô hình suy luận của Gemini trong môi trường sản xuất để tránh rủi ro tài chính.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.