Aller au contenu
Règlement du forum ×
IPTV et arnaques ×

Messages recommandés

  • 3 weeks later...
  • 4 weeks later...

Depuis son retour, Claude Fable 5 fait beaucoup moins rêver

Depuis son retour, Fable 5 est la cible de critiques virulentes sur ses performances. Le modèle ne semble pas présenter les mêmes capacités qu’avant son blocage, suite à la directive de la Maison-Blanche. Même Mythos 5 semble perdre de sa superbe.

Rappelons rapidement quelques éléments chronologiques. Le 9 juin 2026, Anthropic lance Claude Fable 5, une version de Mythos 5 disposant de garde-fous et présenté alors comme le modèle le plus « capables » de l’histoire de l’entreprise. Trois jours plus tard, une directive de contrôle des exportations, signée par la Maison-Blanche et juridiquement contraignante, force Anthropic à suspendre l’accès aux deux modèles pour tout ressortissant étranger, y compris ses propres employés non-américains. Le décret conduit l’entreprise à un arrêt mondial pour tous les clients, Anthropic ayant jugé impossible de filtrer les utilisateurs par nationalité en temps réel.

Le déclencheur invoqué était un rapport de chercheurs d’Amazon selon lequel Fable 5 aurait pu être manipulé (jailbreaké) pour livrer des informations exploitables dans des cyberattaques. En toile de fond, des soupçons qu’un groupe lié à la Chine ait pu accéder à Mythos, ce qui faisait craindre une rétro-ingénierie ou une distillation par un adversaire étranger.

Fin juin, le Department of Commerce lève ces contrôles. L’accès à Fable 5 est restauré le 1ᵉʳ juillet sur Claude Platform, Claude.ai, Claude Code et Claude Cowork. Mythos 5, lui, reste réservé aux partenaires vérifiés du programme Glasswing, comme on l’a vu avec Mozilla.

Au-delà du temps perdu par Anthropic (environ trois semaines), le retour de Fable 5 ne s’est pas fait sous les cotillons. Ses performances, selon les cas d’utilisation, semblent en fort retrait. Pendant ce temps, l’utilisation des modèles chinois grimpe rapidement.

Kaboum !

Dans la plupart des résultats obtenus avant le retrait de Fable 5, de nombreux sites ont relevé les excellentes performances du modèle, notant souvent un saut générationnel significatif. Parmi les notes obtenues : 80,3 % sur SWE-Bench Pro (contre 69,2 % pour Opus 4.8), 64,5 % sur Humanity’s Last Exam avec outils (contre 57,9 % pour Opus 4.8 et 52,2 % pour GPT-5.5), et ainsi de suite pour tous les benchmarks majeurs (FrontierCode Diamond, OSWorld-Verified, GDPval-AA, Terminal-Bench 2.1), comme relevé notamment par Datacamp.

Pour Every, le résultat était encore plus tranché : Fable 5 était tout simplement « le meilleur modèle de programmation ». La société en tenait pour preuve le score de 91/100 obtenu sur leur propre benchmark « Senior Engineer », contre 63 pour Opus 4.8 et 62 pour GPT-5.5. Même son de cloche chez BenchLM.

C’est là que le tableau se complique singulièrement depuis le 1ᵉʳ juillet. Le retour de Fable 5 s’est accompagné d’un nouveau classificateur de cybersécurité, et selon des données publiées le 2 juillet par la plateforme de test BridgeMind, les scores de débogage TypeScript de Fable 5 se sont effondrés de 70 %, comme relevé par Tech Times

Source

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...