Користувачі Google Gemini API повідомляють про проблеми з надмірними рахунками

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Щоденний звіт про ринок: Користувачі Google Gemini API стикаються з помилками відліку, де деякі були сплачені майже 27 000 юанів за 12 годин. Проблеми включають оплату за видалені кеш-дані та завдання з нульовим виводом. Дві помилки — «привид» кеш-рахунків та нескінченні цикли міркувань — залишаються нерозв’язаними. Google ще не надала вирішення чи процесу повернення коштів. Тижневий звіт про ринок підкреслює зростаючі занепокоєння щодо управління витратами на API та прозорості. Розробники закликають технологічний гігант надати чітку відповідь.

За даними Beating Monitoring, у недавній часі на форумі розробників Google AI з’явилося кілька термінових звернень щодо втрати контролю над системою оплати Gemini API. Кілька розробників, які використовували систему в нормальних умовах, зіткнулися з масштабними несправедливими списаннями через вади в нижньому рівні системи — наприклад, один із них був зобов’язаний сплатити майже 27 000 юанів за лише 12 годин. На даний момент команди Google з білінгу та технічної підтримки продовжують перекладати відповідальність одна на одну та не опублікували жодного офіційного заявлення про виправлення або швидкого механізму повернення коштів. Після розслідування було виявлено, що основними причинами надзвичайно високих рахунків є два ключових баги: перший — «призрачний кеш», коли кеш контексту, створений розробником через API, вичерпується або видаляється, а передній інтерфейс вже очищений, але бекенд-система оплати Google продовжує «порожньо» списувати кошти зі швидкістю тисяч юанів на годину; другий — «пастка нескінченного мислення», коли при увімкненні інструментів, таких як пошук у мережі, обмеження «бюджету мислення» моделі стають неефективними, що призводить до нескінченного ланцюжка міркувань під час обробки простих завдань, витрачаючи до 64 000 токенів, після чого модель перевищує ліміт часу і аварійно завершує роботу — навіть якщо результатом є «нульовий вивід» (не повертається жодної корисної відповіді), Google все одно повністю списує зростання вартості мислення у 1500 разів. Оскільки система оплати Google Cloud має серйозну затримку від 32 до 72 годин і не має автоматичного механізму аварійного вимкнення за лімітом, розробники отримують величезні суми до того, як отримають сповіщення. Оскільки офіційна служба підтримки уникатиме відповідальності, а на форумах ніхто не дає чіткої відповіді, деякі постраждалі розробники вже оголосили про повне припинення використання кешу контексту та моделей мислення Gemini у виробничому середовищі.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.