تسريب بيانات تدريب Claude 5 يكشف الصلصة السرية لـ Anthropic

تسريب بيانات تدريب Claude 5

كشفت وثائق مسربة عن نهج Anthropic الثوري في تدريب Claude 5.

بدلاً من الاعتماد فقط على المقيّمين البشريين، يستخدم Claude 5 تقنية يُحسّن فيها نفسه بناءً على مبادئ دستورية.

1. النموذج يولّد حلولاً متعددة

2. يُقيّم كل حل وفقاً للمبادئ الدستورية

3. يختار الأفضل ويتعلم منه

4. تتكرر العملية آلاف المرات

"لا نؤكد ولا ننفي تفاصيل عمليات التدريب الداخلية."

إذا صحّت التسريبات، فإن Anthropic تستخدم نهجاً جديداً في التدريب قد يمنحها ميزة تنافسية كبيرة.