ActualitéFebruary 4, 2026
La Fuite de Données d'Entraînement de Claude 5 Révèle la Formule Secrète d'Anthropic
Des documents d'entraînement divulgués montrent que Claude 5 utilise une technique révolutionnaire d'« Auto-Amélioration Constitutionnelle » et est entraîné sur 12 trillions de tokens de code filtré.
Fuite des Secrets d'Entraînement de Claude 5
Des documents d'entraînement divulgués révèlent l'approche innovante d'Anthropic pour Claude 5.
Auto-Amélioration Constitutionnelle
La technique clé identifiée est l'« Auto-Amélioration Constitutionnelle » où Claude 5 :
- S'auto-évalue contre des principes constitutionnels
- Génère ses propres données d'entraînement améliorées
- Itère sur son propre raisonnement pour l'améliorer
- Réduit la dépendance aux annotateurs humains
Données d'Entraînement
- 12 trillions de tokens de code filtré et curé
- Sources : GitHub, documentation technique, articles de recherche
- Filtrage agressif du code de mauvaise qualité et des vulnérabilités
- Diversité linguistique : 15+ langages de programmation
Entraînement Synthétique
Claude 5 utilise des données synthétiques générées par des versions précédentes de Claude pour améliorer les capacités de raisonnement — une forme d'auto-distillation.
Implications
Si exactes, ces techniques pourraient expliquer le bond de performance prédit pour Claude 5 et suggèrent un avantage méthodologique durable pour Anthropic.