GitHub a annoncé la suspension des nouvelles abonnements à Copilot Personal pour faire face à la pression sur les ressources informatiques causée par les flux de travail d'agents IA. Joe Binder, vice-président produit, a indiqué que les agents IA nécessitent des calculs prolongés et à haut débit, bien au-delà des prévisions initiales du système. Pour garantir la stabilité du service aux utilisateurs existants, GitHub a mis en place des restrictions pour les nouveaux utilisateurs, ainsi que des limites de session et des quotas hebdomadaires de jetons, en passant progressivement à un modèle de facturation basé sur la consommation de jetons, tout en supprimant ou en augmentant le coût d'utilisation de certains modèles haut de gamme. Ce phénomène reflète la contrainte générale des infrastructures IA actuelles : Anthropic, Google, OpenAI ainsi que les fournisseurs de cloud AWS et Azure ont également adopté des mesures similaires, mettant en lumière la contradiction structurelle entre le déploiement à grande échelle des grands modèles et la capacité d'approvisionnement en ressources informatiques sous-jacentes.
Auteur et source de l'article : AIBase
Face à une pression sans précédent sur les ressources de calcul d'intelligence artificielle, GitHub, filiale de Microsoft, a officiellement annoncé la suspension des nouvelles abonnements personnels à Copilot. Cette plateforme de hébergement de code la plus grande au monde se trouve impliquée dans un conflit entre son budget et ses engagements de service.
Joe Binder, vice-président produit de GitHub, a souligné que les flux de travail pilotés par des agents IA ont radicalement transformé les besoins en calcul. Ces « agents », capables d'exécuter automatiquement des tâches complexes, nécessitent généralement un soutien en calcul prolongé et à haute concurrence, leur consommation de ressources dépassant largement les prévisions initiales.
Déficit de puissance de calcul entraînant une dégradation des services
Pour maintenir la stabilité des services aux utilisateurs existants, les autorités doivent prendre des mesures de restriction. Si la croissance des nouveaux utilisateurs n'est pas limitée, tous les développeurs risquent de faire face à une baisse significative de la qualité du service.
En réalité, cette pénurie de puissance de calcul est devenue un problème généralisé dans l'industrie, et des géants comme Anthropic, Google et OpenAI ont déjà resserré leurs restrictions d'utilisation. Les fournisseurs de services cloud peinent également, et même des acteurs de premier plan comme AWS et Azure ont récemment connu fréquemment des goulets d'étranglement de capacité.
Passage au modèle de facturation et ajustement des droits
Pour faire face aux coûts d'exploitation élevés, GitHub a commencé à ajuster ses règles d'utilisation en introduisant des restrictions de session plus strictes et des limites hebdomadaires de jetons. Cela signifie que les développeurs doivent attendre la réinitialisation de la fenêtre pour continuer à utiliser le service après avoir atteint leur pic de consommation.
En outre, le projet officiel prévoit de supprimer progressivement le modèle de tarification fixe pour adopter un système de facturation basé sur la consommation de jetons. Dans le cadre du plan de réduction des coûts, certains modèles haut de gamme coûteux ont été retirés de l'abonnement ou facturés à un taux plus élevé.
