Anthropic affirme que le chemin d'amélioration autonome de l'IA devient clair, suscitant un débat sur le récit de l'IPO

Article | LettreAI

Anthropic a publié hier soir un long article intitulé « When AI builds itself », qui semble sorti d’un roman de science-fiction d’Asimov, et dont le thème est effectivement un concept très science-fictionnel : l’amélioration récursive de soi.

Claude

En bref, auparavant, des chercheurs humains écrivaient du code, menaient des expériences et entraînaient des modèles pour rendre l'IA plus puissante. Mais si l'IA commence à participer elle-même à la conception, à l'entraînement, au test et à l'optimisation de ses propres versions suivantes, la vitesse de progression de l'IA ne dépendra plus uniquement des humains, et pourrait commencer à être guidée par une « auto-évolution » de l'IA.

À cet effet, Anthropic lance un appel :

Nous pensons qu'il serait grandement bénéfique pour le monde que la société puisse choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe afin de permettre aux structures sociales et aux recherches sur l'alignement de rattraper l'évolution technologique.

Cette phrase ressemble à un avertissement de sécurité, mais à l'heure où Anthropic se prépare à son IPO, il est difficile de ne pas la voir comme une autre répétition narrative : Claude est tellement utile qu'il commence à créer lui-même la prochaine génération de Claude.

Une nouvelle tempête est apparue

Pour illustrer le fait que l'IA participe de plus en plus à son propre développement, Anthropic a présenté de nombreuses données internes.

Par exemple, en mai 2026, plus de 80 % du code intégré dans la base de code d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.

D'après les statistiques d'Anthropic, le volume de code fusionné quotidiennement par les ingénieurs aura augmenté d'environ 8 fois d'ici au deuxième trimestre 2026 par rapport à 2024.

Claude

Ce qui est plus remarquable que la quantité de code, c'est que Claude traite des problèmes d'ingénierie plus ouverts.

Anthropic indique que, au cours de la dernière année, la fréquence à laquelle les employés corrigeaient Claude, le ramenaient sur la bonne voie ou reprenaient les tâches en cours a constamment diminué. Ce changement ne se produit pas seulement sur les tâches simples, mais aussi sur les tâches ouvertes les plus complexes.

Les tâches ouvertes sont des problèmes sans documentation claire. Par exemple, un système qui plante ou une tâche d'entraînement qui échoue : les ingénieurs ne savent pas au départ à quoi la solution ressemble et doivent procéder par investigation et évaluation progressive.

Ces tâches étaient autrefois les plus dépendantes de l'expérience humaine, et pour les tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, soit une augmentation de 50 points de pourcentage en six mois.

Claude

Au lieu de simplement écrire du code, Anthropic utilise Claude pour effectuer des revues de code, détecter des bogues, des vulnérabilités de sécurité et d'autres défauts. Une analyse rétrospective a révélé que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bogues ayant causé des incidents en ligne sur claude.ai auraient pu être interceptés avant le déploiement.

Plus loin, Claude a commencé à participer au processus de recherche.

Anthropic dispose d'un test fixe : fournir à Claude un code d'entraînement d'un petit modèle, et lui demander d'accélérer l'exécution sans modifier le résultat. En mai 2025, Claude Opus 4 parvient à une accélération d'environ 3 fois ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52 fois.

Anthropic a également mentionné un cas d'étude ouvert sur la sécurité de l'IA. Ils ont posé à un agent piloté par Claude la question suivante : un modèle plus faible peut-il surveiller de manière fiable un modèle plus puissant ?

Ce processus nécessite de formuler des hypothèses, de les tester et de partager les découvertes avec des agents parallèles, en itérant de manière répétée.

Deux chercheurs humains ont réduit l'écart d'environ 23 % en une semaine ; tandis que Claude a réduit 97 % avec un coût cumulé d'environ 800 heures et 18 000 dollars de puissance de calcul.

Bien sûr, ces résultats présentent des limites : les choix ont été faits par des humains, les critères d'évaluation ont été définis par des humains, et les résultats n'ont pas entièrement été transférés à des modèles à échelle de production. Toutefois, ils démontrent néanmoins que Claude est déjà capable, dans un cadre de recherche dont les orientations ont été établies par un humain, de concevoir des expériences, de les exécuter et de les itérer lui-même.

De plus, lorsque les chercheurs humains prennent une mauvaise direction, Claude peut fournir un meilleur jugement sur la prochaine étape.

Anthropic a sélectionné 129 sessions de recherche internes avec Claude Code, au cours desquelles des chercheurs humains ont collaboré avec Claude pour résoudre des problèmes de recherche ouverts. Anthropic a identifié certains points où les chercheurs humains ont ultérieurement démontré qu'ils avaient emprunté une voie inefficace, puis a fourni le contexte précédent à différentes versions de Claude pour observer les étapes suivantes qu'elle suggérait. Un autre Claude, connaissant la conclusion complète de la session, a évalué quelle proposition — celle du modèle ou celle faite par l'humain — était la meilleure.

Les résultats montrent que, sur les points où les chercheurs humains ont été ultérieurement démontrés comme ayant des perspectives d'amélioration, Claude devient de plus en plus capable de proposer la prochaine étape optimale.

Claude

Par le passé, les progrès des modèles d'IA étaient principalement poussés par des chercheurs et des ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.

De plus en plus d'étapes de cette chaîne commencent à être prises en charge par Claude.

Anthropic a fourni un tableau de phases très intuitif :

Claude

De 2021 à 2023, Anthropic n'était pas différente des entreprises technologiques classiques : des humains écrivaient du code et des documents sur des ordinateurs portables.

De 2023 à 2025, les chatbots ont commencé à intégrer les flux de travail. Les ingénieurs faisaient générer des extraits de code par le modèle, puis les copiaient dans l’éditeur.

De 2025 à 2026, des agents de programmation apparaissent, et Claude commence à pouvoir écrire et modifier du code de manière autonome, parfois même terminer des fichiers entiers seul.

Aujourd'hui, les agents peuvent exécuter du code eux-mêmes et déléguer des tâches pouvant durer plusieurs heures à d'autres agents.

Ensuite, vient la phase que Anthropic craint vraiment : la boucle fermée.

Si ce jour arrive, les versions ultérieures de Claude pourraient être continuellement améliorées par Claude lui-même — c'est ce qu'on appelle l'amélioration récursive de soi.

Anthropic affirme avec prudence dans le texte : nous n'avons pas encore atteint ce stade, et l'amélioration automatique récursive n'est pas inévitable. Mais elle souligne néanmoins que le chemin menant à ce stade commence à devenir visible.

C'est pourquoi Anthropic aborde la question d'un ralentissement, voire d'une suspension, à la fin de l'article. Il ne s'agit pas d'arrêter immédiatement toutes les entreprises d'IA, mais de dire que, si les risques liés à l'amélioration autonome de l'IA continuent d'augmenter, les laboratoires de pointe auront besoin d'un mécanisme coordonné et vérifiable pour ralentir.

En d'autres termes, le point de singularité approche, et l'humanité doit le contrôler.

Claude, une force inarrêtable

Si l'on se contente de la surface, il s'agit d'un document de sécurité extrêmement visionnaire. Anthropic aborde l'amélioration récursive de soi, la possibilité que l'IA s'améliore de plus en plus rapidement, et la nécessité pour la société humaine de se préparer à des mécanismes de ralentissement et d'arrêt anticipés.

Mais à la lumière de la préparation d'Anthropic pour son IPO, cet article prend une autre dimension.

D'une certaine manière, les dernières actions de l'usine A ressemblent à celles de l'élève modèle qui se comporte de façon provocante en classe — il a vraiment du talent, mais il fait aussi semblant.

Il ne s'agit pas seulement de dire « nous avons un Claude très puissant » ; il va plus loin en affirmant que « Claude nous aide à créer un Claude encore plus puissant ».

Si Anthropic ne vendait qu’un modèle ou un outil, il lui serait difficile de s’éviter complètement les comparaisons horizontales : Anthropic dispose de Claude, OpenAI dispose de GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic cible les clients entreprises, OpenAI cible également les clients entreprises. La concurrence entre les deux entreprises est très serrée, et il s’agit simplement de savoir laquelle pourra raconter une histoire plus grande au marché.

Il convient de noter que, il y a juste trois jours, OpenAI a écrit dans un document sur la gouvernance des IA avancées :

Nous avons également observé aujourd'hui les premiers signes d'amélioration récursive autonome : le développement de l'IA est lui-même accéléré par l'IA.

Cela intensifiera la pression concurrentielle entre les développeurs et les États, et engendrera des défis de gouvernance que les institutions existantes ne sont pas en mesure de gérer.

Trois jours plus tard, Anthropic a déclaré : le chemin de Claude vers l'amélioration récursive de soi commence à devenir visible.

Claude

Si Claude se développe comme il l'espère, ce ne sera plus une simple narration produit, mais un moteur de R&D.

Claude écrit du code, exécute des expériences, optimise les processus d'entraînement, puis réduit à son tour les incidents dans les produits d'Anthropic lui-même... Une fois ce système en marche, Claude ne sera plus seulement un produit d'Anthropic, mais aussi un outil de production essentiel pour Anthropic.

Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic souhaite vraiment faire remarquer aux marchés financiers, c'est que Claude est désormais intégré aux processus fondamentaux de développement de modèles avancés ; il a été placé dans le moteur d'Anthropic.

Les marchés financiers adorent entendre l'histoire de la roue de la fortune, comme un bassin rempli d'or qui génère des revenus sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner davantage de code, plus de code permet une itération plus rapide des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'effectuer davantage d'expériences, et ces expériences renforcent à leur tour la prochaine génération de Claude. Une fois que la prochaine génération de Claude est plus puissante, elle accélère encore davantage la R&D d'Anthropic.

La vitesse d'itération de Claude soutient également cette roue motrice. Du point de vue des dates de publication publiques, entre 2023 et début 2025, les mises à jour principales des modèles de Claude se produisaient généralement tous les trois à quatre mois ; toutefois, depuis l'entrée dans la série Claude 4, les mises à jour des modèles d'Anthropic sont devenues nettement plus fréquentes.

Claude 4 a été publié en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre et Opus 4.5 en novembre.

En 2026, Opus 4.6 a été publié le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril et Opus 4.8 le 28 mai. Il n'y a eu que 42 jours entre Opus 4.7 et Opus 4.8.

Anthropic prétend apparemment : « Cet événement pourrait être dangereux, nous devons préparer un frein à l'avance », mais il sous-entend également : « Nous avons déjà vu ce qui se passe lorsque l'on enfonce l'accélérateur. »

La subtilité du récit de l’IPO réside dans cela : elle met en avant les risques tout en positionnant hautement sa technologie.

Toutes les entreprises d'IA ne sont pas éligibles pour discuter de l'amélioration récursive de soi ; vous devez d'abord faire croire au monde extérieur que votre IA a déjà intégré le processus de recherche et développement en IA, avant de pouvoir affirmer que cela pourrait nécessiter une coordination mondiale.

OpenAI : Comment peut-on faire ça ?

Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article long, OpenAI vient de mettre la récursivité et l'amélioration de soi sur la table.

Mais les deux entreprises présentent les choses très différemment.

L'article d'OpenAI intitulé « Democratic Governance of Frontier AI » est un plan politique destiné à Washington, qui ne se concentre pas sur la manière dont les modèles deviennent plus puissants, mais sur la façon de les encadrer alors que l'IA de pointe continue d'avancer.

La plupart des éléments mentionnés dans ce rapport ne sont pas appropriés pour être développés, à l'exception d'une phrase clé : OpenAI affirme que l'on peut déjà observer les premiers signes d'amélioration récursive automatique dans les systèmes d'aujourd'hui.

Cette phrase et cet article long d'Anthropic pointent en réalité dans la même direction.

OpenAI parle de systèmes, tandis qu'Anthropic parle d'elle-même.

OpenAI signifie que l'évolution de l'IA est trop rapide pour que les structures de gouvernance actuelles puissent suivre, ce qui nécessite un nouvel ensemble de règles.

Anthropic a directement révélé ce système au marché : Claude fait désormais partie de notre processus de recherche et développement, ce qui nous permet de voir la voie vers l'accélération autonome de l'IA.

C’est une manœuvre très habile, on sent bien qu’à l’intérieur d’OpenAI, les tensions doivent commencer à monter — c’est du vol de conception ! Nous étions les premiers !

Je plaisante, mais OpenAI doit vraiment se dépêcher et sortir GPT 5.6.