Claude Mythos d'Anthropic : l'IA autonome qui a découvert 10 000 failles critiques en un mois

Cybersécurité & IA

Claude Mythos d'Anthropic : l'IA autonome qui a découvert 10 000 failles critiques en un mois

Publié le 24 mai 2026 — Lecture : environ 8 minutes

Un mois. Dix mille failles. Et une question qui plane désormais sur toute l'industrie de la sécurité informatique : à quoi ressemble vraiment un chercheur en cybersécurité dopé à l'intelligence artificielle ? Anthropic vient de donner une réponse concrète, chiffrée, et franchement difficile à ignorer.

Pourquoi cette annonce change la donne aujourd'hui

Le 24 mai 2026, Anthropic a publié les résultats de son initiative baptisée Project Glasswing. Derrière ce nom se cache quelque chose d'assez inédit : un modèle d'IA frontier, Claude Mythos Preview, laissé en mode autonome pendant trente jours, avec pour mission d'éplucher des milliers de projets open-source à la recherche de vulnérabilités logicielles.

Le résultat ? Plus de 10 000 vulnérabilités zero-day identifiées. Le terme "zero-day" désigne une faille encore inconnue des éditeurs de logiciels, donc sans correctif disponible au moment de sa découverte. C'est ce qui rend ces failles particulièrement redoutées : elles peuvent être exploitées sans que personne ne s'en aperçoive.

Pour situer l'ampleur de la chose : une équipe humaine de chercheurs en sécurité travaille des mois, parfois des années, pour documenter quelques dizaines de ces failles. Claude Mythos en a découvert des milliers en quatre semaines.

Project Glasswing : comment ça fonctionne concrètement

Un agent IA qui lit le code comme un humain, mais en beaucoup plus vite

Claude Mythos Preview n'est pas un simple outil d'analyse statique de code. Ces outils traditionnels cherchent des patterns connus, des erreurs déjà répertoriées. Ils sont utiles, mais limités. Ce que fait Claude Mythos, c'est différent : le modèle comprend le contexte, suit les chemins d'exécution, et raisonne sur les effets en chaîne d'une vulnérabilité.

Concrètement, il a été déployé sur plus de 1 000 projets open-source, avec la capacité de travailler de manière autonome : sans intervention humaine à chaque étape, il identifie une piste, l'explore, la valide ou l'écarte, puis documente le résultat. C'est ce qu'on appelle un agent IA autonome.

Des failles classées par niveau de gravité

Sur les 10 000+ vulnérabilités découvertes, 6 202 ont été classées "high" ou "critical" selon l'échelle CVSS (Common Vulnerability Scoring System). Cette échelle va de 0 à 10, et une note supérieure à 7 indique une faille sérieuse. Une faille "critical" dépasse 9.

Niveau de gravité	Score CVSS	Nombre de failles identifiées
Critical	9.0 – 10.0	Incluses dans les 6 202
High	7.0 – 8.9	Incluses dans les 6 202
Medium / Low	0.1 – 6.9	Le reste des 10 000+

La faille WolfSSL : un exemple qui illustre tout

Parmi les découvertes les plus marquantes, une faille dans WolfSSL a été répertoriée sous l'identifiant CVE-2026-5194, avec un score CVSS de 9.1. WolfSSL est une bibliothèque cryptographique open-source très utilisée dans les environnements embarqués, les appareils connectés (IoT), et les systèmes industriels.

La vulnérabilité permet de forger des certificats SSL. En termes simples : un attaquant pourrait se faire passer pour un serveur légitime, intercepter des communications censées être chiffrées et sécurisées, et tromper un appareil ou un utilisateur sur l'identité de son interlocuteur. Le genre de faille qui peut compromettre des systèmes entiers sans laisser de trace évidente.

C'est précisément le type de vulnérabilité qu'un outil d'analyse classique aurait du mal à détecter, car elle nécessite une compréhension fine de la logique d'authentification cryptographique. Claude Mythos l'a trouvée seul.

Mozilla et Firefox : un test grandeur nature

Le cas Mozilla est peut-être l'un des plus parlants pour illustrer ce que Claude Mythos apporte de nouveau. L'organisation a utilisé ce modèle pour analyser Firefox 150, et le résultat est saisissant : 271 vulnérabilités ont été identifiées.

Pour comparer, le modèle précédent d'Anthropic utilisé sur des tâches similaires, Claude Opus 4.6, permettait de trouver environ dix fois moins de failles dans des conditions équivalentes. Ce bond de performance — un facteur 10 — n'est pas anodin. Il signifie que Claude Mythos ne s'améliore pas à la marge : il change de catégorie.

Firefox est l'un des navigateurs les plus audités au monde, avec des équipes de sécurité dédiées et un programme de bug bounty actif depuis des années. Y trouver 271 nouvelles vulnérabilités en un cycle, c'est un signal fort sur la capacité de détection de ce modèle.

Le test de l'AI Security Institute du Royaume-Uni

Autre performance notable : Claude Mythos est devenu le premier modèle à résoudre intégralement les simulations de cyberattaques multi-étapes conçues par l'AI Security Institute du Royaume-Uni. Ces simulations reproduisent des scénarios d'attaque complexes, où un agent doit enchaîner plusieurs actions coordonnées pour atteindre un objectif — reconnaître un réseau, identifier une entrée, exploiter une faille, se déplacer latéralement.

Jusqu'ici, aucun modèle ne parvenait à compléter ces scénarios de bout en bout. Claude Mythos l'a fait. Ce résultat est important pour deux raisons opposées.

D'un côté, cela prouve que l'IA peut désormais simuler des attaques suffisamment sophistiquées pour être utilisée dans des exercices de sécurité défensive — les équipes "red team" qui testent la résistance des systèmes avant que de vrais attaquants ne le fassent. De l'autre, cela soulève des questions légitimes sur le risque d'utilisation offensive de telles capacités.

Ce que ça implique pour la cybersécurité

Une accélération du côté défensif

Le cas d'usage le plus immédiat est clair : des organisations peuvent désormais auditer leur code à une vitesse et une profondeur inédites. Pour les équipes de sécurité qui manquent souvent de ressources humaines, un agent IA capable de faire un premier tri massif représente un gain de temps considérable. Les analystes humains peuvent alors concentrer leur attention sur les cas les plus critiques, déjà triés et documentés.

Un double tranchant à ne pas minimiser

Les mêmes capacités qui permettent de trouver des failles permettent potentiellement de les exploiter. C'est le défi central de la cybersécurité augmentée par l'IA : la frontière entre l'outil défensif et l'outil offensif est mince. Anthropic est conscient de ce risque — c'est d'ailleurs l'une des raisons pour lesquelles la publication des résultats de Project Glasswing s'est accompagnée d'une divulgation coordonnée avec les mainteneurs des projets concernés.

La divulgation responsable (responsible disclosure) consiste à prévenir en privé les équipes des logiciels affectés avant de rendre l'information publique, pour leur laisser le temps de corriger. C'est la procédure standard, et son respect à cette échelle — des milliers de projets — est en soi un défi logistique.

L'open-source particulièrement exposé

Le fait que le projet se soit concentré sur des logiciels open-source n'est pas anodin. Ces projets, souvent maintenus par des bénévoles ou de petites équipes, constituent l'infrastructure invisible du web. Des milliers d'applications commerciales s'appuient sur eux. Une faille dans une bibliothèque open-source largement utilisée peut avoir des répercussions en cascade sur des centaines de systèmes qui ne savent même pas qu'ils sont exposés.

Notre point de vue

Les chiffres de Project Glasswing sont difficiles à remettre en question. Dix mille failles, six mille critiques ou sévères, une bibliothèque cryptographique compromise, Firefox audité à une profondeur inédite. Ce n'est plus un prototype de laboratoire : c'est un outil opérationnel.

Ce qui est frappant, c'est moins la performance brute que ce qu'elle révèle sur l'état de nos logiciels. Si un modèle peut trouver autant de failles en un mois dans des projets pourtant utilisés massivement, c'est que notre dette de sécurité est bien plus élevée qu'on ne l'estimait. L'IA ne crée pas ces vulnérabilités — elle les révèle.

La vraie question n'est pas de savoir si Claude Mythos est impressionnant. Elle est de savoir si l'écosystème — les mainteneurs de projets open-source, les équipes de sécurité, les entreprises utilisatrices — a la capacité d'absorber et de corriger des milliers d'alertes à ce rythme. Une IA qui détecte vite ne sert pas à grand-chose si les correctifs arrivent en retard.

Sources

Pour conclure

Claude Mythos et Project Glasswing marquent une étape réelle dans l'automatisation de la recherche en sécurité informatique. La capacité de détecter des failles zero-day à grande échelle, de façon autonome, n'est plus un horizon lointain. Elle est là, documentée, chiffrée. La prochaine étape — et probablement la plus complexe — sera de construire une réponse collective aussi efficace que la détection. Est-ce que l'industrie de la cybersécurité est prête à travailler à cette vitesse ?