ActualitéFebruary 24, 2026

Claude 5 Atteint 85 % sur SWE-bench : Un Nouveau Record de Benchmark de Codage IA

Claude 5 d Anthropic établit un nouveau record sur SWE-bench Verified avec un score de 85,3 %.

Claude 5 : Record SWE-bench 85,3 %

Anthropic annonce que Claude 5 atteint 85,3 % sur SWE-bench Verified, nouveau record mondial de codage IA.

Comparaison

ModeleScoreDate
Claude 585,3 %Fevrier 2026
Sonnet 4.679,6 %Fevrier 2026
GPT-578,2 %Janvier 2026
Gemini 3 Pro71,4 %Decembre 2025

Ameliorations cles

  • Raisonnement multi-etapes pour decomposer les problemes complexes
  • Fenetre de contexte 500K tokens pour les grandes bases de code
  • Auto-verification : le modele verifie et corrige ses solutions
  • Meilleure integration des outils de debogage et de test

Reactions developpeurs

"85 % sur SWE-bench signifie que Claude 5 peut resoudre de vraies issues GitHub de maniere autonome."

Disponibilite

Claude 5 est disponible via l API Anthropic et sera integre dans Claude Code prochainement.

Ready to Experience Claude 5?

Try Now