أخبار عاجلةFebruary 4, 2026

تسريب بيانات تدريب Claude 5 يكشف الصلصة السرية لـ Anthropic

تظهر وثائق التدريب المسربة أن Claude 5 يستخدم تقنية 'التحسين الذاتي الدستوري' الثورية ومدرب على 12 تريليون رمز من الكود المفلتر.

تسريب بيانات تدريب Claude 5

كشفت وثائق مسربة عن نهج Anthropic الثوري في تدريب Claude 5.

التقنية الجديدة: التحسين الذاتي الدستوري

بدلاً من الاعتماد فقط على المقيّمين البشريين، يستخدم Claude 5 تقنية يُحسّن فيها نفسه بناءً على مبادئ دستورية.

كيف يعمل

1. النموذج يولّد حلولاً متعددة

2. يُقيّم كل حل وفقاً للمبادئ الدستورية

3. يختار الأفضل ويتعلم منه

4. تتكرر العملية آلاف المرات

بيانات التدريب

  • 12 تريليون رمز من الكود المفلتر
  • مصادر: GitHub وGitLab وBitbucket ومستودعات خاصة (بإذن)
  • تصفية صارمة للجودة والأمان

التداعيات

  • نهج أكثر قابلية للتوسع من RLHF التقليدي
  • قد يُفسر القفزة الكبيرة في الأداء المتوقعة
  • يُثير أسئلة حول الشفافية في التدريب

رد Anthropic

"لا نؤكد ولا ننفي تفاصيل عمليات التدريب الداخلية."

الخلاصة

إذا صحّت التسريبات، فإن Anthropic تستخدم نهجاً جديداً في التدريب قد يمنحها ميزة تنافسية كبيرة.

Ready to Experience Claude 5?

Try Now