Les utilisateurs de l'API Google Gemini signalent des bugs de facturation exorbitants

icon MarsBit
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Rapport quotidien du marché : Les utilisateurs de l'API Google Gemini font face à des bugs de facturation, certains ayant été facturés près de 27 000 RMB en 12 heures. Les problèmes incluent des frais pour le cache supprimé et des tâches sans sortie. Deux bugs — la facturation fantôme du cache et les boucles de raisonnement infinies — restent non résolus. Google n'a pas encore fourni de solution ni de processus de remboursement. Le rapport hebdomadaire du marché met en lumière une inquiétude croissante concernant la gestion et la transparence des coûts des API. Les développeurs exigent une réponse claire de la part du géant technologique.

Selon les rapports de Beating, récemment, le forum des développeurs Google AI a été le théâtre de plusieurs appels à l'aide urgents concernant un système de facturation Gemini hors de contrôle. De nombreux développeurs, lors d'une utilisation normale, ont été confrontés à des prélèvements anormaux massifs en raison de vulnérabilités au niveau du système sous-jacent ; par exemple, certains ont vu près de 27 000 yuans retenus en seulement 12 heures. À ce jour, les équipes facturation et technique de Google continuent de se rejeter la responsabilité et n'ont publié aucune déclaration officielle de correction ni aucun canal de remboursement rapide. L'enquête a révélé que deux bogues principaux sont à l'origine des factures exorbitantes : d'abord, une vulnérabilité appelée « cache fantôme » — après l'expiration ou la suppression du cache de contexte créé via l'API, la liste de gestion frontale est vidée, mais le système de facturation arrière-plan continue de prélever des frais à un rythme de plusieurs milliers de yuans par heure, sans aucune activité réelle ; ensuite, un piège appelé « boucle de pensée infinie » — lors de l'activation d'outils comme la recherche en ligne, la limite budgétaire de « pensée » du modèle devient inefficace, entraînant une infinie chaîne d'inférence même pour des tâches simples ; après avoir consommé jusqu'à 64 000 jetons, le modèle explose par dépassement de délai, et même en cas de « sortie nulle » (aucune réponse utile retournée), Google facture intégralement des frais de pensée augmentés de 1500 %. En raison d'un retard grave de 32 à 72 heures dans le système de facturation Google Cloud, ainsi que l'absence de mécanisme automatique de coupure de limite, les développeurs se sont déjà vu prélever des sommes colossales avant même de recevoir une alerte. Face au refus de réponse des services clients officiels et à l'absence de réactions sur le forum, certains développeurs victimes ont annoncé qu'ils abandonnaient définitivement le cache de contexte et le modèle d'inférence Gemini dans leurs environnements de production afin d'éviter tout risque financier.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.