La Maison Blanche et Anthropic discutent d'un cadre d'évaluation de la sécurité des modèles d'IA

CoinGape rapporte :

La Maison-Blanche discute avec l'entreprise d'IA Anthropic d'un cadre d'évaluation de la sécurité des modèles, visant à établir une méthode unifiée de classification des défauts de sécurité des nouveaux modèles d'IA, afin de déterminer si une intervention gouvernementale est nécessaire. Cela intervient après que les États-Unis aient imposé des restrictions à l'exportation du dernier modèle d'Anthropic en raison d'un problème de sécurité qualifié de « jailbreak ».

Établir une norme unifiée autour de la vulnérabilité « jailbreak »

Selon les rapports, ce cadre sera utilisé pour évaluer la gravité des événements futurs similaires, en se concentrant sur trois éléments : le degré de contournement des mesures de protection, les capacités du modèle exposées, et les conséquences réelles de la vulnérabilité.

Actuellement, les divergences entre les gouvernements et les entreprises sur ces questions restent marquées. Précédemment, Dario Amodei, PDG d'Anthropic, et des responsables gouvernementaux avaient des jugements différents sur la question de savoir si ces vulnérabilités constituaient un problème de sécurité majeur. Les rapports indiquent que l'évolution rapide des technologies d'IA dépasse la capacité des systèmes gouvernementaux actuels à fournir une évaluation cohérente de ces controverses.

Les négociations se poursuivent après les restrictions à l'exportation

La Maison Blanche avait précédemment imposé des restrictions à l'exportation sur Anthropic, interdisant aux utilisateurs étrangers d'accéder à ses derniers modèles Fable 5 et Mythos 5. L'entreprise a ensuite suspendu les services externes de ces deux modèles.

Le rapport indique que les négociations entre les deux parties ont failli échouer vendredi dernier, car Anthropic a refusé de désactiver Fable selon la demande du gouvernement, estimant que les vulnérabilités concernées avaient un impact limité et ne constituaient pas un défaut de sécurité grave. Par la suite, la Maison Blanche a imposé des restrictions à l'exportation, forçant l'entreprise à retirer les modèles concernés du marché.

Cependant, dès le week-end, les deux parties ont rétabli la communication. Le secrétaire au Commerce américain Howard Lutnick, le directeur national du cyberespace Sean Cairncross et le cofondateur d'Anthropic Tom Brown ont participé à plusieurs appels prolongés. Par la suite, les deux parties ont mené près d'une semaine de discussions en personne à Washington.

La Maison Blanche accélère la mise en œuvre des règles de sécurité pour l'IA

Les personnes d'Anthropic impliquées dans les négociations incluent Sarah Heck, responsable des politiques publiques, et le cofondateur Tom Brown. L'entreprise a également envoyé lundi des chercheurs seniors et des experts en sécurité au Département du Commerce des États-Unis pour poursuivre les consultations avec les responsables gouvernementaux.

Ce débat reflète également un jugement plus réaliste : aucun modèle d'IA ne peut être entièrement à l'abri des attaques informatiques. Par conséquent, les gouvernements souhaitent d'abord établir des normes pour que les entreprises évaluent les risques sécuritaires, avant de déterminer dans quelles circonstances des mesures restrictives doivent être prises.

Cette orientation résonne également avec les discussions tenues lors de la récente réunion du G7. Plusieurs entreprises leader en IA et certains dirigeants nationaux ont souligné la nécessité d'établir rapidement des normes plus claires pour évaluer la sécurité des modèles, afin de faire face aux risques économiques et pour la sécurité nationale posés par les systèmes d'IA dont les capacités continuent de s'améliorer.