智东西5月7日报道,今日凌晨,Anthropic在开发者大会Code with Claude上连续发布多项重大更新:放宽开发者接口调用速率限制、Claude托管智能体上线三大新功能、Claude Code新增十余项功能,并与SpaceX达成重要合作。
Dès aujourd'hui, Anthropic double la limite d'utilisation de 5 heures pour Claude Code dans les forfaits Pro, Max, Équipe et Entreprise basés sur le nombre d'utilisateurs, pour la porter à 10 heures ; supprime les réductions de quota pendant les heures de pointe pour les comptes Pro et Max ; et assouplit les limites de débit API pour le modèle Claude Opus.

Limites de débit de l'API après mise à jour du modèle Claude Opus
Ensuite, les agents hébergés Claude intègrent trois nouvelles fonctionnalités : l'orchestration multi-agents, les résultats cibles (Outcomes) et la déduction autonome (Dreaming). Dreaming est actuellement en version préliminaire de recherche et nécessite une demande pour y accéder. Les fonctionnalités Outcomes, l'orchestration multi-agents et la mémoire sont désormais disponibles en version bêta publique dans le cadre du service d'agents hébergés Managed Agents.

Claude Code introduit plusieurs nouvelles fonctionnalités, notamment le contrôle à distance, le rafraîchissement de l'interface utilisateur, le rendu sans clignotement et le contrôle des autorisations.
Enfin, pour élargir encore sa portée de services, Anthropic a conclu un partenariat avec SpaceXAI (anciennement xAI), qui lui accordera l'utilisation exclusive de l'ensemble des ressources de calcul du centre de données Colossus 1 de SpaceXAI. Cela permettra d'ajouter plus de 300 mégawatts de capacité de calcul ce mois-ci, soit plus de 220 000 GPU NVIDIA, afin d'améliorer la capacité et l'expérience d'utilisation pour les abonnés à Claude Pro et Claude Max.

Ce renforcement des capacités de calcul est une autre mesure majeure annoncée dans le cadre de la stratégie globale d'Anthropic en matière de puissance de calcul.
Précédemment, Anthropic a conclu un accord de collaboration pour une puissance informatique pouvant atteindre 5 gigawatts avec Amazon, dont près de 1 gigawatt de capacité supplémentaire sera mis en œuvre d'ici la fin de 2026 ; a signé des accords de puissance informatique de 5 gigawatts avec Google et Broadcom, dont la puissance informatique correspondante sera progressivement mise en service d'ici 2027 ; a établi un partenariat stratégique avec Microsoft et NVIDIA couvrant des ressources de calcul cloud Azure d'une valeur de 300 milliards de dollars ; et s'est associé à Fluidstack pour investir 500 milliards de dollars dans l'infrastructure américaine d'intelligence artificielle.
À 4 heures du matin aujourd'hui, Dario Amodei, cofondateur et PDG d'Anthropic, Daniela Amodei, cofondatrice et présidente d'Anthropic, ont dialogué avec Ami Vora, chef produit d'Anthropic.
Dario a déclaré que, grâce à Claude, le monde s'est intéressé pour la première fois à Anthropic. Le taux de croissance du ARR d'Anthropic a augmenté de façon exponentielle ; ils pensaient initialement que ce chiffre pourrait progresser lentement jusqu'à un facteur 10, mais ont finalement observé une croissance de 80 fois, et ils fournissent actuellement autant de puissance de calcul que possible, bien plus qu'auparavant. Toutefois, il a également mentionné espérer que cette tendance ne se poursuive pas, car cela deviendrait trop absurde et impossible à gérer.

Ami Vora, chef produit d'Anthropic, Daniela Amodei, cofondatrice d'Anthropic, et Dario Amodei, cofondateur et PDG d'Anthropic (de gauche à droite)
01. Mise à jour de l'agent hébergé Claude, l'IA apprend à se réévaluer et à évoluer
Les trois améliorations apportées par Anthropic à l'agent hébergé de Claude incluent :
Tout d'abord, la capacité d'orchestration multi-agents permet aux développeurs de constituer des clusters d'agents pour collaborer à la réalisation de tâches d'une complexité extrême.
Ensuite, la fonction Résultats cibles (Outcomes) permet aux développeurs de définir précisément les critères de réussite d'une tâche ; Claude itère automatiquement jusqu'à ce que la tâche soit accomplie selon les normes établies.
Enfin, la capacité d'auto-déduction (Dreaming) : grâce à Dreaming, Claude peut planifier des tâches de manière autonome. Il peut analyser activement les historiques de conversations précédentes, identifier ses compétences manquantes et les leçons qu'il aurait dû tirer, puis intégrer directement ces acquis dans sa mémoire.

Angela Jiang, directrice produit d'Anthropic, et Katelyn Lesse, ingénieure, ont fondé sur place une startup appelée Lumara à partir de trois nouvelles fonctionnalités basées sur les agents hébergés de Claude, et ont développé un logiciel d'algorithmes génétiques pour cette startup afin de permettre l'atterrissage autonome de drones sur la Lune.
Ils ont d'abord imaginé un scénario dans lequel un client souhaite déployer un drone sur la Lune pour exploiter une ressource minière imaginaire, puis ont démontré le processus de configuration à l'aide de l'outil en ligne de commande Claude.
D'abord, Lesse a présenté les plusieurs agents nécessaires pour accomplir le travail en collaboration : l'agent directeur principal a pour responsabilité principale de garantir le bon déroulement de l'ensemble de la tâche, l'agent de détection est chargé de sélectionner les sites d'atterrissage appropriés riches en ressources minérales de haute qualité, et l'agent de navigation assure l'atterrissage sécurisé des drones ainsi que leur vol précis vers la cible désignée.

Pendant l'exécution de l'ensemble des tâches, l'agent de commande central démarre une session de tâche, et chaque agent sous-jacent dispose d'un thread d'exécution indépendant avec sa propre fenêtre de contexte dédiée.
Ensuite, basé sur la fonction Résultats cibles, un agent avancé est configuré pour garantir l'atteinte des objectifs prédéfinis. On peut voir que le fichier Markdown simplifié ci-dessous énumère clairement les critères permettant de déterminer si la tâche a été réussie : exiger un atterrissage doux et stable de l'无人机 ; atterrir obligatoirement sur une surface plane et dégagée ; conserver un carburant de réserve suffisant pour assurer le retour sécurisé de l'无人机 sur Terre.

Pour établir ces critères d'évaluation aux fins de l'objectif de la tâche, le démonstrateur envoie un événement à la session de tâche, définissant ces règles d'évaluation comme critères d'acceptation de l'objectif.
En outre, pendant l'exécution de la tâche, un agent d'évaluation et de vérification est créé séparément. Cet agent évalue en temps réel au sein de la session chaque itération pour déterminer si les critères d'acceptation prédéfinis sont remplis. Les développeurs peuvent également définir eux-mêmes le nombre maximal d'itérations autorisé.
Ensuite, la phase de test commence : les clients ont fourni des données relatives à six landing pages hypothétiques et doivent exécuter plusieurs sessions de simulation pour évaluer les résultats réels. Sur le tableau de bord backend de Lumara, des simulations ont déjà été lancées pour les six landing pages ; les résultats montrent que quatre d'entre elles ont été correctement identifiées, mais les sites numéro 3 et 4 présentent encore des possibilités d'optimisation.

La prochaine étape consiste à mettre à niveau et à optimiser ce système. Les démonstrateurs accèdent au tableau de bord développeur de Claude, ouvrent l'interface de la fonction Dreaming (raisonnement autonome), cliquent sur le bouton étiqueté Dream, puis sélectionnent un dépôt de mémoire. L'agent de raisonnement autonome revoit alors toutes les conversations simulées précédentes et intègre les expériences tirées dans la mémoire. Toutes les nouvelles sessions de tâches pourront désormais faire référence à ces expériences accumulées.

Plus important encore, cet agent génère automatiquement un manuel d'opérations d'atterrissage. Toutes les nouvelles sessions de tâche pourront désormais s'appuyer sur ce manuel, qui recense les règles d'expérience issues des missions précédentes.
02. Lancement de plus de 10 mises à jour, axées sur l'expérience utilisateur et l'intelligence autonome
L'ingénieur Claude Code, Dickson Tsai, a présenté plus de dix mises à jour de Claude Code dans deux grands domaines.
Le premier grand axe concerne l'expérience des développeurs : comment rendre l'utilisation quotidienne de Claude Code plus fluide et plus conviviale.
Contrôle à distance : les utilisateurs peuvent laisser les tâches s'exécuter en arrière-plan sur leur ordinateur et reprendre la même session, le même environnement de développement, depuis leur téléphone lorsqu'ils sont en déplacement.

Affichage sans clignotement : l’ancienne version ajoutait du contenu à la vue existante, ce qui provoquait des redessinages fréquents en cas de décalage de la vue. L’interface utilisateur actuelle prend en charge le mode plein écran et utilise la technologie de rendu par liste virtuelle. Grâce à cette optimisation, elle élimine les saccades et les clignotements de l’interface, permettant aux éléments de code dans le terminal d’être interactifs par clic ; même avec des journaux de session extrêmement longs, elle maintient une consommation mémoire stable.
Pendant l'exécution de Claude, les développeurs peuvent visualiser directement l'effet de rendu. Même avec des contenus extrêmement longs, aucun problème de déformation ou de désorganisation du rendu ne se produit.

Mise à jour de l’interface utilisateur : ajout de fonctionnalités de filtrage et de regroupement, permettant de gérer les projets et les tâches par groupes. Les développeurs peuvent également ouvrir librement divers panneaux par glisser-déposer, avec prise en charge de plusieurs disposions d’affichage interchangeables à volonté.
Les développeurs peuvent désormais accéder directement aux résumés des étapes correspondantes, laisser des commentaires à tout moment ; tous les commentaires seront ultérieurement regroupés et suivis par Claude. En plus de la vue de planification, les développeurs peuvent basculer vers d'autres vues et laisser des commentaires directement aux emplacements concernés. Enfin, ils peuvent ouvrir directement n'importe quel fichier du répertoire de travail pour effectuer rapidement des modifications.
Lorsque le journal de session est long, les développeurs peuvent passer la souris au-dessus de n'importe quel message. En attribuant un titre personnalisé à n'importe quel message de la session, un plan de contenu est automatiquement généré en haut.

Le deuxième thème est l'autonomie intelligente.
Mode Auto : Claude peut désormais exécuter automatiquement les demandes d'autorisation de privilèges, créer des branches et exécuter des commandes de build, et gère entièrement ces tâches par lui-même.
Claude Code introduit un mode d'autorisation : grâce à un classificateur de sécurité, l'IA prend automatiquement les décisions d'autorisation à la place des développeurs. Le classificateur vérifie principalement deux points : premièrement, si l'opération présente un risque de dommage ; deuxièmement, si elle présente des caractéristiques d'injection de prompt. Si l'appel à l'outil est jugé sûr, il est automatiquement autorisé et exécuté ; en cas de risque, l'opération est bloquée et attend la confirmation manuelle de l'autorisation par le développeur.
Worktrees : permet aux développeurs d'isoler complètement chaque tâche et de maintenir des environnements de code propres et indépendants. Les worktrees natifs de Git présentent de nombreux problèmes d'utilisation et des limites ; Anthropic les a optimisés et affinés, offrant aux développeurs une interface plus conviviale et facile à utiliser.

Fonction Mémoire automatique (Auto Memory) : Claude peut accumuler des connaissances entre les sessions, en se souvenant des commandes clés de construction, des conseils de débogage, des préférences de projet, etc. Claude détermine automatiquement si ces informations seront utiles pour les futures conversations afin de décider s'il faut les enregistrer.

Fonction de révision de code à plusieurs étapes et avec plusieurs agents : le système déclenche un groupe d’agents de révision qui examinent indépendamment le code selon différents critères, puis vérifie et confirme tous les résultats de révision. Ce mécanisme permet de détecter de nombreux problèmes qui auraient autrement nécessité plusieurs heures de débogage.

Procédures de tâches (Routines) : Cette fonction est disponible en version préliminaire. Pour l’utiliser, configurez une seule fois les invites, le dépôt de code et les connexions associées, puis sélectionnez un déclencheur tel qu’une tâche Cron planifiée, une exécution quotidienne fixe ou un événement GitHub Webhook pour permettre à Claude de l’exécuter automatiquement.

Les mises à jour récentes incluent également ce qui est illustré ci-dessous :

03. Définir trois orientations de recherche et développement futures ; concevoir l'architecture en vue du modèle de prochaine génération
Dianne Penn a déclaré qu'Anthropic a lancé 18 versions du modèle Claude, y compris Sonnet, Opus et la toute nouvelle série Mythos, désormais toutes accessibles aux développeurs.
Au cours de la dernière année, ils ont progressivement lancé huit modèles avancés pour les développeurs. Le développement exponentiel des modèles signifie que leur intelligence devient de plus en plus logique, planifiée et réfléchie.

Les développeurs du futur posséderont des agents actifs et en ligne 24/7, qui savent exactement quelles tâches accomplir et maintiennent une logique cohérente tout au long du processus, sans dévier. La manière dont tout le monde utilise et développe sur le modèle Claude devra également évoluer.
Ainsi, au sein d'Anthropic, il est considéré que la conception d'architecture doit être orientée vers les modèles de la prochaine génération, et non seulement adaptée à la version actuelle. Les développeurs qui réussiront finalement auront anticipé en optimisant dès maintenant leur architecture pour se préparer à la prochaine sautée de capacité intelligente, plutôt que de se concentrer uniquement sur les petites itérations de performance actuelles. Cela exige que l'industrie élabore et construise continuellement des systèmes d'évaluation plus exigeants, et développe audacieusement des prototypes de pointe qui semblent aujourd'hui impossibles à mettre en œuvre.
Pour les entreprises, les deux principaux défis sont d'obtenir des résultats conformes aux attentes et de mettre rapidement les services en production avec une livraison rapide.
La plateforme Claude a été conçue à cet effet, dotée de primitives API spécifiquement optimisées pour les modèles Claude. Elle fournit l'infrastructure de base nécessaire aux entreprises pour construire et déployer à grande échelle des systèmes d'agents, ainsi qu'un ensemble complet de fonctionnalités de gestion pour opérer et administrer ces systèmes.
Angela affirme que le problème le plus courant rencontré par les entreprises est qu'elles ont un besoin urgent de capacités d'intelligence avancée, mais qu'il leur est difficile de les mettre en œuvre efficacement. L'une des solutions proposées par Anthropic est la capacité de conseil stratégique.
Les entreprises doivent simplement mettre à jour la configuration du tableau d'outils dans l'API Messages.
Plus précisément, ils offrent aux entreprises une architecture d’agents qui sépare les étapes d’exécution des étapes de conseil décisionnel. Lors de l’exécution des tâches, les entreprises peuvent utiliser des modèles légers, ce qui réduit les coûts. Lorsque ce petit modèle a besoin de décider de la prochaine étape à entreprendre, il peut appeler à tout moment un modèle plus grand pour obtenir des conseils et des recommandations.

Dans la pratique, les entreprises peuvent utiliser un modèle léger pour exécuter les tâches, tandis que le modèle haut de gamme Opus agit en tant que conseiller décisionnel. Lorsqu’ils ont testé la combinaison Sonnet pour l’exécution et Opus comme conseiller, les performances globales ont largement dépassé celles obtenues avec Sonnet seul, tout en présentant un coût d’utilisation inférieur à celui d’une utilisation exclusive de Sonnet.

04. Conclusion : Anthropic se lance-t-elle dans une approche à trois volets : modèle, puissance de calcul et commercialisation ?
La concurrence autour des grands modèles s'intensifie de plus en plus, et Anthropic a également révélé ses directions de recherche et ses plans futurs :
D'abord, une meilleure capacité de jugement et des compétences en codage de plus haute qualité permettent aux développeurs de confier à Claude des tâches de développement autonome ;
Ensuite, une mémoire de haute qualité permet de créer une fenêtre de contexte plus longue, permettant aux développeurs de mener des tâches complexes à long terme tout en obtenant de meilleurs résultats.
Enfin, la capacité de collaboration entre agents multiples, permettant de constituer des équipes d’agents travaillant ensemble, avec plusieurs instances de Claude répartissant les tâches et collaborant pour accomplir des missions complexes.
Les entreprises de grands modèles se tournent actuellement vers une concurrence globale basée sur la puissance de calcul, les modèles, l'écosystème et la commercialisation. Anthropic ne se contente pas de mettre à jour ses propres produits, mais a également annoncé une collaboration majeure avec SpaceX, renforcée par la puissance de calcul d'Amazon, de Google et de Microsoft, ce qui élargit continuellement l'écart entre ses réserves de puissance de calcul et celles de ses concurrents. Parallèlement, avec la baisse des prix des API et l'augmentation simultanée des limites d'appel, le rapport qualité-prix global des produits Anthropic se distingue, ce qui devrait inciter un grand nombre de petites et moyennes entreprises à migrer rapidement vers l'écosystème Claude, consolidant ainsi sa part de marché dans le secteur de l'IA professionnelle.
Cet article provient du compte officiel WeChat « Zhi Dongxi » (ID : zhidxcom), auteur : Cheng Qian, éditeur : Li Shuiqing
