إصدار Codex 5.3: 77.3% على Terminal-Bench، 56.8% على SWE-Bench Pro
أطلقت OpenAI نموذج GPT-5.3-Codex في 5 فبراير 2026 - أكثر نماذج البرمجة الوكيلة قدرةً حتى الآن مع أداء متميز على معايير الطرفية والبرمجة.
OpenAI تطلق أقوى نموذج برمجة
في 5 فبراير 2026، أصدرت OpenAI نموذج GPT-5.3-Codex، واصفةً إياه بأنه "أقوى نموذج برمجة وكيلي حتى الآن." يُطوّر النموذج أداء البرمجة المتقدمة وقدرات التفكير العامة مع كونه أسرع بنسبة 25% من سابقه.
أداء المعايير
Terminal-Bench 2.0: 77.3% - يتصدر جميع النماذج في المهام المعتمدة على الطرفية SWE-Bench Pro (العام): 56.8% دقة عبر أربع لغات برمجة OSWorld-Verified: 64.7% - قدرات قوية في استخدام الحاسوب السرعة: أسرع بنسبة 25% من GPT-5.2-Codex مع كفاءة محسّنة في الرموزالابتكارات التقنية
التطوير الذاتي التمهيدي
بشكل لافت، كان GPT-5.3-Codex فعالاً في بناء نفسه. استخدم فريق Codex إصدارات مبكرة لـ:
- تصحيح أخطاء عملية التدريب الخاصة به
- إدارة بنية النشر التحتية
- تشخيص وإصلاح نتائج الاختبارات
- تحسين أداء الاستدلال
القدرات المحسّنة
البرمجة الوكيلية: تنفيذ مهام متعددة الخطوات بشكل مستقل مع تدخل بشري محدود إتقان الطرفية: إجادة سطر الأوامر بمستوى احترافي تتفوق على النماذج السابقة دعم متعدد اللغات: توليد كود بمستوى إنتاجي في Python وJavaScript وTypeScript وJava وC++ وGo وRust كفاءة الرموز: يستخدم عدداً أقل من رموز الإخراج مع الحفاظ على الجودة - مما يقلل تكاليف APIالأمان والسلامة
GPT-5.3-Codex هو أول نموذج من OpenAI يُعامل كـ"عالي الخطورة" وفقاً لإطار الاستعداد، خاصة فيما يتعلق بقدرات الأمن السيبراني. تمنع الضمانات المحسّنة توليد الكود الخبيث مع الحفاظ على وظائف البحث الأمني المشروعة.
الإتاحة والتسعير
مستخدمو ChatGPT: متاح الآن مع خطط ChatGPT Plus وTeam وEnterprise وصول API: $10/$30 لكل مليون رمز (إدخال/إخراج) تكامل المنصات: تطبيق ChatGPT وCLI وإضافات بيئة التطوير وواجهة الويب مزودو السحابة: AWS Bedrock وAzure OpenAI Service (الربع الأول 2026)مقارنة الأداء
| النموذج | Terminal-Bench | SWE-Bench Pro | السرعة | السعر (إدخال) |
| Codex 5.3 | 77.3% | 56.8% | 1.8 ثانية | $10/مليون |
| Claude Opus 4.6 | 68.4% | 54.2% | 3.2 ثانية | $15/مليون |
| Gemini 3 Pro | 64.1% | 48.3% | 2.4 ثانية | $7/مليون |
استقبال المطورين
يُفيد المستخدمون الأوائل بتفوق Codex 5.3 في:
- تطوير خدمات الخلفية
- أتمتة الطرفية ومهام DevOps
- توليد الكود بكميات كبيرة
- إصلاح الأخطاء مع التكرار السريع
يلاحظ بعض المطورين أن Claude Code لا يزال يتصدر في:
- التفكير المعماري العميق
- فهم قواعد الكود ذات السياق الطويل
- اقتراحات تصميم واجهة المستخدم
استخدم Codex 5.3 إذا...
- السرعة حاسمة لسير عملك
- تعمل أساساً مع أدوات الطرفية/CLI
- تحتاج توليداً فعالاً من حيث التكلفة بكميات كبيرة
- تبني خدمات خلفية وAPIs
- تحتاج كوداً موثوقاً وخالياً من الأخطاء من المحاولة الأولى
الخلاصة
يمثل GPT-5.3-Codex قفزة كبيرة في قدرات البرمجة بالذكاء الاصطناعي، خاصة لسير العمل المعتمد على الطرفية والوكلاء المستقلين. مزيجه من الأداء والسرعة والتسعير التنافسي يجعله خياراً مقنعاً لفرق التطوير.
قدرة النموذج على المساعدة في بناء نفسه تُظهر أننا ندخل حقبة تشارك فيها أنظمة الذكاء الاصطناعي بنشاط في تطويرها الخاص - تحول جذري له تداعيات عميقة.