ActualitéFebruary 4, 2026

La Fuite de Données d'Entraînement de Claude 5 Révèle la Formule Secrète d'Anthropic

Des documents d'entraînement divulgués montrent que Claude 5 utilise une technique révolutionnaire d'« Auto-Amélioration Constitutionnelle » et est entraîné sur 12 trillions de tokens de code filtré.

Fuite des Secrets d'Entraînement de Claude 5

Des documents d'entraînement divulgués révèlent l'approche innovante d'Anthropic pour Claude 5.

Auto-Amélioration Constitutionnelle

La technique clé identifiée est l'« Auto-Amélioration Constitutionnelle » où Claude 5 :

  • S'auto-évalue contre des principes constitutionnels
  • Génère ses propres données d'entraînement améliorées
  • Itère sur son propre raisonnement pour l'améliorer
  • Réduit la dépendance aux annotateurs humains

Données d'Entraînement

  • 12 trillions de tokens de code filtré et curé
  • Sources : GitHub, documentation technique, articles de recherche
  • Filtrage agressif du code de mauvaise qualité et des vulnérabilités
  • Diversité linguistique : 15+ langages de programmation

Entraînement Synthétique

Claude 5 utilise des données synthétiques générées par des versions précédentes de Claude pour améliorer les capacités de raisonnement — une forme d'auto-distillation.

Implications

Si exactes, ces techniques pourraient expliquer le bond de performance prédit pour Claude 5 et suggèrent un avantage méthodologique durable pour Anthropic.

Ready to Experience Claude 5?

Try Now