Les Utilisateurs Préfèrent Claude Sonnet 4.6 à Opus 4.5 dans les Tests Directs
Anthropic révèle que 59 % des utilisateurs ont préféré Sonnet 4.6 au précédent modèle phare Opus 4.5, citant un meilleur suivi des instructions.
Le Modèle Mid-Tier Surpasse l'Ancien Phare
Les tests utilisateurs montrent que Sonnet 4.6 bat le précédent modèle phare Opus 4.5.
Résultats des Tests
Sonnet 4.6 vs Sonnet 4.5 : 70 % préfèrent Sonnet 4.6 Sonnet 4.6 vs Opus 4.5 : 59 % préfèrent Sonnet 4.6Pourquoi les Utilisateurs Préfèrent Sonnet 4.6
1. Meilleur Suivi d'Instructions
« Sonnet 4.6 fait ce que je demande. Opus avait tendance à "améliorer" ma requête d'une manière non souhaitée. »
2. Moins d'Hallucinations
« Moins confiant dans les mauvaises réponses. Quand Sonnet 4.6 ne sait pas, il le dit. »
3. Moins de Sur-Ingénierie
« J'ai demandé une fonction simple, j'ai obtenu une fonction simple. Pas un framework avec injection de dépendances. »
Implications Tarifaires
Les utilisateurs obtiennent une qualité perçue supérieure à 20 % du coût.
Opus 4.6 Garde Sa Place
Opus 4.6 reste supérieur pour le raisonnement scientifique de niveau PhD, la coordination multi-agents et la récupération en contexte extrêmement long.