إصدار Codex 5.3: 77.3% على Terminal-Bench، 56.8% على SWE-Bench Pro

OpenAI تطلق أقوى نموذج برمجة

في 5 فبراير 2026، أصدرت OpenAI نموذج GPT-5.3-Codex، واصفةً إياه بأنه "أقوى نموذج برمجة وكيلي حتى الآن." يُطوّر النموذج أداء البرمجة المتقدمة وقدرات التفكير العامة مع كونه أسرع بنسبة 25% من سابقه.

أداء المعايير

Terminal-Bench 2.0: 77.3% - يتصدر جميع النماذج في المهام المعتمدة على الطرفية SWE-Bench Pro (العام): 56.8% دقة عبر أربع لغات برمجة OSWorld-Verified: 64.7% - قدرات قوية في استخدام الحاسوب السرعة: أسرع بنسبة 25% من GPT-5.2-Codex مع كفاءة محسّنة في الرموز

الابتكارات التقنية

التطوير الذاتي التمهيدي

بشكل لافت، كان GPT-5.3-Codex فعالاً في بناء نفسه. استخدم فريق Codex إصدارات مبكرة لـ:

تصحيح أخطاء عملية التدريب الخاصة به

إدارة بنية النشر التحتية

تشخيص وإصلاح نتائج الاختبارات

تحسين أداء الاستدلال

القدرات المحسّنة

البرمجة الوكيلية: تنفيذ مهام متعددة الخطوات بشكل مستقل مع تدخل بشري محدود إتقان الطرفية: إجادة سطر الأوامر بمستوى احترافي تتفوق على النماذج السابقة دعم متعدد اللغات: توليد كود بمستوى إنتاجي في Python وJavaScript وTypeScript وJava وC++ وGo وRust كفاءة الرموز: يستخدم عدداً أقل من رموز الإخراج مع الحفاظ على الجودة - مما يقلل تكاليف API

الأمان والسلامة

GPT-5.3-Codex هو أول نموذج من OpenAI يُعامل كـ"عالي الخطورة" وفقاً لإطار الاستعداد، خاصة فيما يتعلق بقدرات الأمن السيبراني. تمنع الضمانات المحسّنة توليد الكود الخبيث مع الحفاظ على وظائف البحث الأمني المشروعة.

الإتاحة والتسعير

مستخدمو ChatGPT: متاح الآن مع خطط ChatGPT Plus وTeam وEnterprise وصول API: $10/$30 لكل مليون رمز (إدخال/إخراج) تكامل المنصات: تطبيق ChatGPT وCLI وإضافات بيئة التطوير وواجهة الويب مزودو السحابة: AWS Bedrock وAzure OpenAI Service (الربع الأول 2026)

مقارنة الأداء

النموذج

Terminal-Bench

SWE-Bench Pro

السرعة

السعر (إدخال)

Codex 5.3

77.3%

56.8%

1.8 ثانية

$10/مليون

Claude Opus 4.6

68.4%

54.2%

3.2 ثانية

$15/مليون

Gemini 3 Pro

64.1%

48.3%

2.4 ثانية

$7/مليون

استقبال المطورين

يُفيد المستخدمون الأوائل بتفوق Codex 5.3 في:

تطوير خدمات الخلفية

أتمتة الطرفية ومهام DevOps

توليد الكود بكميات كبيرة

إصلاح الأخطاء مع التكرار السريع

يلاحظ بعض المطورين أن Claude Code لا يزال يتصدر في:

التفكير المعماري العميق

فهم قواعد الكود ذات السياق الطويل

اقتراحات تصميم واجهة المستخدم

استخدم Codex 5.3 إذا...

السرعة حاسمة لسير عملك

تعمل أساساً مع أدوات الطرفية/CLI

تحتاج توليداً فعالاً من حيث التكلفة بكميات كبيرة

تبني خدمات خلفية وAPIs

تحتاج كوداً موثوقاً وخالياً من الأخطاء من المحاولة الأولى

الخلاصة

يمثل GPT-5.3-Codex قفزة كبيرة في قدرات البرمجة بالذكاء الاصطناعي، خاصة لسير العمل المعتمد على الطرفية والوكلاء المستقلين. مزيجه من الأداء والسرعة والتسعير التنافسي يجعله خياراً مقنعاً لفرق التطوير.

قدرة النموذج على المساعدة في بناء نفسه تُظهر أننا ندخل حقبة تشارك فيها أنظمة الذكاء الاصطناعي بنشاط في تطويرها الخاص - تحول جذري له تداعيات عميقة.