تحليلNovember 26, 2025

مراجعة أداء GPT-5.1: تحليل شامل للمعايير (نوفمبر 2025)

مراجعة شاملة لأداء GPT-5.1 عبر جميع المعايير الرئيسية. SWE-bench وAIME 2025 وتحليل التفكير التكيفي والمقارنة مع المنافسين.

مراجعة أداء GPT-5.1

تحليل شامل لمعايير GPT-5.1 الصادر في نوفمبر 2025.

النتائج الرئيسية

SWE-bench Verified: 76.3%

AIME 2025: 94%

HumanEval: 94.2%

MMLU: 86.2%

التفكير التكيفي

ميزة جديدة تتيح للنموذج ضبط عمق التفكير تلقائياً بناءً على تعقيد المهمة.

تحسينات السرعة

أسرع بنسبة 35% من GPT-5.0

زمن استجابة متوسط 2.2 ثانية

المقارنة التنافسية

المعيار

GPT-5.1

Claude Opus 4.5

Gemini 3

SWE-bench

76.3%

80.9%

71.8%

السرعة

2.2 ثانية

3.2 ثانية

2.4 ثانية

السعر

$2.50/M

$15/M

$3.50/M

نقاط القوة

أفضل قيمة مقابل السعر

سرعة ممتازة

نظام بيئي أنضج

نقاط الضعف

أداء برمجي أقل من Claude

هلوسات أكثر

سياق أقصر

الخلاصة

GPT-5.1 خيار ممتاز للاستخدام العام، لكن Claude يتفوق في البرمجة والتفكير.

Ready to Experience Claude 5?

Back to All News