Codex 5.3 Lancé : 77,3 % sur Terminal-Bench, 56,8 % sur SWE-Bench Pro
OpenAI lance GPT-5.3-Codex le 5 février 2026 — le modèle de codage agentique le plus performant à ce jour, avec des résultats remarquables sur les benchmarks terminal et codage.
OpenAI Lance son Modèle de Codage le Plus Performant
Le 5 février 2026, OpenAI a lancé GPT-5.3-Codex, le décrivant comme « le modèle de codage agentique le plus performant à ce jour ». Le modèle fait progresser à la fois les performances de codage de pointe et les capacités de raisonnement général, tout en étant 25 % plus rapide que son prédécesseur.
Performances Benchmark
Terminal-Bench 2.0 : 77,3 % - Leader sur toutes les tâches orientées terminal SWE-Bench Pro (Public) : 56,8 % de précision sur quatre langages de programmation OSWorld-Verified : 64,7 % - Solides capacités d'utilisation informatique Vitesse : 25 % plus rapide que GPT-5.2-Codex avec une meilleure efficacité de tokensInnovations Techniques
Développement Auto-Bootstrap
Fait remarquable, GPT-5.3-Codex a contribué à sa propre création. L'équipe Codex a utilisé des versions préliminaires pour :
- Déboguer son propre processus d'entraînement
- Gérer l'infrastructure de déploiement
- Diagnostiquer et corriger les résultats de tests
- Optimiser les performances d'inférence
Capacités Améliorées
Codage Agentique : Exécution autonome de tâches multi-étapes avec intervention humaine minimale Maîtrise du Terminal : Compétence en ligne de commande de niveau natif surpassant les modèles précédents Support Multi-Langages : Génération de code de qualité production en Python, JavaScript, TypeScript, Java, C++, Go et Rust Efficacité de Tokens : Utilise moins de tokens de sortie tout en maintenant la qualité - réduisant les coûts APISécurité & Sûreté
GPT-5.3-Codex est le premier modèle OpenAI classé « Élevé » dans le cadre du Preparedness Framework, notamment pour les capacités de cybersécurité. Des garde-fous renforcés empêchent la génération de code malveillant tout en préservant les fonctionnalités légitimes de recherche en sécurité.
Disponibilité & Tarifs
Utilisateurs ChatGPT : Disponible maintenant avec les plans ChatGPT Plus, Team et Enterprise Accès API : 10 $/30 $ par million de tokens (entrée/sortie) Intégration Plateforme : Application ChatGPT, CLI, extensions IDE et interface web Fournisseurs Cloud : AWS Bedrock et Azure OpenAI Service (T1 2026)Comparaison des Performances
| Modèle | Terminal-Bench | SWE-Bench Pro | Vitesse | Prix (Entrée) |
| Codex 5.3 | 77,3 % | 56,8 % | 1,8s | 10 $/M |
| Claude Opus 4.6 | 68,4 % | 54,2 % | 3,2s | 15 $/M |
| Gemini 3 Pro | 64,1 % | 48,3 % | 2,4s | 7 $/M |
Réception par les Développeurs
Les premiers utilisateurs rapportent que Codex 5.3 excelle pour :
- Le développement de services backend
- L'automatisation terminal et les tâches DevOps
- La génération de code à haut volume
- La correction de bugs avec itération rapide
Certains développeurs notent que Claude Code reste en tête pour :
- Le raisonnement architectural approfondi
- La compréhension de bases de code en contexte long
- Les suggestions de design UI/UX
Utilisez Codex 5.3 Si...
- La vitesse est critique pour votre workflow
- Vous travaillez principalement avec des outils terminal/CLI
- Vous avez besoin de génération à haut volume économique
- Vous construisez des services backend et des API
- Vous avez besoin de code fiable et sans bugs dès le premier essai
Conclusion
GPT-5.3-Codex représente un bond significatif dans les capacités de codage IA, particulièrement pour les workflows orientés terminal et agents autonomes. Sa combinaison de performance, de vitesse et de tarifs compétitifs en fait un choix convaincant pour les équipes de développement.