Anthropic ouvre finalement au public une version « bridée » de Mythos, son IA jugée trop dangereuse
Deux mois après avoir jugé Mythos trop dangereux pour le grand public, Anthropic lance Claude Fable 5. Cette version dérivée reprend l'essentiel des performances de Mythos, tout en intégrant des restrictions destinées à limiter les usages les plus sensibles.
Publié par Vanille Dujardin
Résumé de l'article
Anthropic rend accessible Claude Fable 5, une version sécurisée de Mythos. Le modèle rivalise avec les meilleures IA du marché mais reste fortement encadré.
L'annonce illustre la tension croissante qui traverse aujourd'hui l'industrie de l'intelligence artificielle : comment continuer à avancer vers des modèles toujours plus puissants tout en affirmant vouloir ralentir la course à l'IA pour des raisons de sécurité ?
De « trop dangereux » à largement disponible
Lorsque Anthropic avait présenté Mythos au printemps dernier, l'entreprise de Dario Amodei avait créé la surprise. Contrairement à OpenAI, Google ou xAI, la société avait refusé de rendre son modèle accessible au public.
La raison avancée était simple : Mythos se révélait particulièrement performant dans la découverte et l'exploitation de failles informatiques. Selon Anthropic, un accès généralisé aurait pu faciliter le travail de cybercriminels ou d'acteurs étatiques malveillants.
Le modèle avait alors été réservé à un cercle très restreint de partenaires au sein du programme « Project Glasswing », composé notamment de gouvernements, d'institutions financières et de grandes entreprises. En Belgique, les groupes Swift et Euroclear ont récemment rejoint ce programme.
Aujourd'hui, Anthropic estime avoir trouvé un compromis avec Claude Fable 5.
Des performances proches de Mythos
Selon les premiers résultats publiés par Anthropic et plusieurs organismes indépendants, Fable 5 se situe parmi les modèles les plus performants du marché.
Sur Humanity's Last Exam, l'un des tests de référence pour mesurer les capacités générales d'un modèle, Fable 5 obtient le deuxième meilleur résultat jamais enregistré, juste derrière Mythos lui-même.
En programmation, domaine devenu crucial pour les entreprises, le nouveau modèle impressionne encore davantage. Sur SWE-Bench Pro, un benchmark qui évalue la capacité des IA à résoudre des problèmes réels de développement logiciel, Fable 5 rivalise avec Mythos et devance largement plusieurs concurrents.
Cette domination confirme la stratégie d'Anthropic. Alors que ChatGPT reste la référence grand public, Claude est devenu l'un des outils favoris des développeurs et des entreprises technologiques.
Des garde-fous intégrés
Pour éviter les dérives qui avaient conduit à bloquer Mythos, Anthropic affirme avoir installé plusieurs mécanismes de sécurité.
Les requêtes liées à la cybersécurité offensive, à la chimie ou à la biologie sont automatiquement redirigées vers Claude Opus 4.8, un modèle plus ancien considéré comme moins risqué.
L'entreprise affirme également avoir mis en place des protections contre la « distillation », une technique permettant à certains acteurs de copier indirectement les capacités d'un modèle avancé afin d'entraîner leurs propres systèmes.
Autre mesure notable : Anthropic conservera pendant trente jours l'ensemble des requêtes et réponses générées par Fable 5. Officiellement, ces données serviront à surveiller d'éventuels abus et non à entraîner de futurs modèles.
Selon l'entreprise, plus de 1.000 heures de tests de sécurité et de « red teaming » ont été réalisées afin de tenter de contourner ces protections avant le lancement.
Un discours de prudence difficile à concilier avec la concurrence
La sortie de Fable 5 intervient dans un contexte particulier.
La semaine dernière encore, Anthropic appelait publiquement à ralentir le développement de l'intelligence artificielle avancée, estimant que l'humanité approchait d'un seuil où le contrôle des systèmes pourrait devenir problématique.
Quelques jours plus tard, la société met pourtant à disposition du public un modèle directement dérivé de celui qu'elle considérait récemment comme trop dangereux.
Cette apparente contradiction s'explique en partie par l'intensification de la concurrence. OpenAI prépare de nouveaux modèles, Google accélère le développement de Gemini, tandis que plusieurs acteurs chinois comme MoonshotAI ou Alibaba réduisent rapidement l'écart technologique.
Anthropic doit également répondre à une demande croissante. L'entreprise a récemment connu des tensions de capacité et aurait conclu un accord spectaculaire avec xAI pour accéder à une partie de la puissance de calcul du centre de données Colossus.
Une IA d'élite... mais à prix d'or
L'autre particularité de Fable 5 concerne son coût.
Anthropic le positionne comme un produit premium destiné aux entreprises et aux développeurs professionnels. Son tarif est nettement supérieur à celui de plusieurs concurrents et même plus élevé que celui des précédentes générations de Claude.
Ce choix intervient alors que de nombreuses entreprises commencent à s'interroger sur l'explosion de leurs dépenses liées aux « tokens », l'unité qui mesure la consommation de calcul des modèles d'IA.
Anthropic fait donc un pari clair : convaincre ses clients que les gains de productivité obtenus grâce à un modèle plus performant justifient une facture plus élevée.
Mythos reste sous clé
Parallèlement à Fable 5, Anthropic a également lancé une nouvelle version de Mythos. Celle-ci reste toutefois réservée aux membres du programme Project Glasswing.
L'entreprise considère manifestement que certaines capacités du modèle demeurent trop sensibles pour être diffusées largement.
Une distinction qui montre que, malgré l'ouverture de Fable 5, Anthropic continue de considérer Mythos comme une catégorie à part dans la hiérarchie des intelligences artificielles les plus avancées.
Pour l'instant, Fable 5 représente donc probablement ce qui se rapproche le plus d'un accès public à la puissance de Mythos. Une manière pour Anthropic de rester dans la course face à OpenAI et Google, tout en tentant de préserver son image de laboratoire soucieux de la sécurité.