GPT-5.5-Cyber d'OpenAI surpasse Mythos d'Anthropic sur le benchmark de cybersécurité

Titre : GPT-5.5-Cyber d’OpenAI surpasse le modèle Mythos d’Anthropic — et il est toujours en ligne. Ce que cela signifie pour la sécurité crypto. Dans un affrontement à hauts enjeux pour la cybersécurité pilotée par l’IA, le récemment lancé GPT-5.5-Cyber d’OpenAI a dépassé le modèle Mythos d’Anthropic, interdit, sur un benchmark clé de vulnérabilités — et contrairement aux modèles d’Anthropic, il reste en ligne et en cours de déploiement. Ce qui s’est passé - Le 22 juin, OpenAI a lancé GPT-5.5-Cyber dans le cadre de son initiative Daybreak de défense cyber. - Sur CyberGym — un benchmark de l’UC Berkeley qui teste les agents IA contre 1 507 vulnérabilités logicielles connues réparties dans 188 projets open source — GPT-5.5-Cyber a obtenu un score de 85,6 %. - Mythos 5 d’Anthropic, que le gouvernement américain a ordonné de désactiver, a obtenu 83,8 % au même test. Le modèle plus large de Anthropic, Claude Opus 4.7, a obtenu 73,1 %. Pourquoi cette petite marge compte Un avantage inférieur à deux points est normalement banal, mais le contexte change la donne. Anthropic a désactivé Mythos 5 et Fable 5 le 12 juin après que le Département du Commerce américain ait émis une directive d’exportation d’urgence, invoquant des préoccupations de sécurité nationale liées à une technique de « jailbreak » pouvant contourner les contrôles de sécurité. Étant donné qu’Anthropic ne pouvait pas vérifier de manière fiable la nationalité des utilisateurs à grande échelle, il a désactivé les modèles dans le monde entier. Les avertissements d’Anthropic ont amplifié le drame. L’entreprise avait publiquement décrit Mythos comme exceptionnellement puissant et potentiellement dangereux sans contrôles stricts ; le PDG Dario Amodei a comparé les IA de pointe à des avions que les régulateurs devraient pouvoir clouer au sol en cas d’échec aux audits de sécurité. Anthropic a également fait face à des critiques après avoir révélé un filtre caché dans Fable 5 qui dégradait les sorties pour les concurrents supposés — une politique qu’elle a ensuite annulée et pour laquelle elle s’est excusée. Au 23 juin, Mythos 5 et Fable 5 restent suspendus tandis qu’Anthropic négocie avec le Département du Commerce et poursuit une action en justice. L’approche différente d’OpenAI OpenAI a adopté une voie plus conforme aux autorités gouvernementales. GPT-5.5-Cyber n’est pas accessible au grand public : l’accès est limité aux professionnels de la sécurité vérifiés, et OpenAI a effectué des tests pré-déploiement avec des organismes fédéraux américains de cybersécurité — notamment le Center for AI Standards and Innovation et le Bureau du Directeur national de la cybersécurité — avant son lancement. OpenAI accélère également l’intégration du modèle dans les gouvernements et l’industrie. Daybreak a signé des partenariats cybersécurité avec l’Australie, le Canada, la France, l’Allemagne, le Japon, la Corée du Sud et des institutions de l’UE, y compris l’Agence européenne de la cybersécurité. Vingt-huit fournisseurs de sécurité — parmi lesquels CrowdStrike, Cisco et Cloudflare — ont rejoint le Cyber Partner Program d’OpenAI pour intégrer les capacités de GPT-5.5 dans leurs produits pour des clients vérifiés. Impact sur le terrain OpenAI affirme que son outil Codex Security a déjà analysé plus de 30 millions de commits sur 30 000 bases de code et enregistré plus de 500 000 vulnérabilités corrigées depuis son lancement en mars. L’entreprise développe des intégrations avec des partenaires et a lancé « Patch the Planet », une initiative visant à aider à corriger les vulnérabilités dans des projets open source largement utilisés. Pourquoi les équipes crypto doivent s’en préoccuper - Les protocoles DeFi, les wallets, les ponts et l’infrastructure des plateformes d’échange dépendent tous du code open source et des bibliothèques tierces — précisément la surface que CyberGym et des outils comme Codex Security scrutent pour détecter les failles. - Une détection et une correction plus rapides, assistées par l’IA, peuvent réduire la fenêtre d’exploitation pour les attaquants ciblant des contrats intelligents ou des services back-end. Les intégrations avec les principaux fournisseurs de sécurité pourraient signifier davantage de vérifications automatisées intégrées dans les pipelines CI utilisés par les développeurs blockchain. - Le compromis réside dans le contrôle d’accès : des modèles puissants capables de détecter ou même de générer des techniques d’exploitation sont restreints aux professionnels de la sécurité vérifiés et aux partenaires gouvernementaux — un calcul réglementaire et de confiance qui importera aux équipes construisant sur des blockchains publiques. Note finale Les modèles d’Anthropic restent hors ligne plus d’une semaine après la directive américaine, tandis que GPT-5.5-Cyber d’OpenAI, approuvé par les autorités et à accès restreint, est déployé auprès des gouvernements et partenaires industriels. Pour les projets crypto dépendant d’outils open source, la course à l’intégration d’une sécurité assistée par l’IA semble sur le point de s’accélérer — tout comme les questions concernant la gouvernance, l’accès et les abus.