Les Utilisateurs Préfèrent Claude Sonnet 4.6 à Opus 4.5 dans les Tests Directs

Le Modèle Mid-Tier Surpasse l'Ancien Phare

Les tests utilisateurs montrent que Sonnet 4.6 bat le précédent modèle phare Opus 4.5.

Résultats des Tests

Sonnet 4.6 vs Sonnet 4.5 : 70 % préfèrent Sonnet 4.6 Sonnet 4.6 vs Opus 4.5 : 59 % préfèrent Sonnet 4.6

Pourquoi les Utilisateurs Préfèrent Sonnet 4.6

1. Meilleur Suivi d'Instructions

« Sonnet 4.6 fait ce que je demande. Opus avait tendance à "améliorer" ma requête d'une manière non souhaitée. »

2. Moins d'Hallucinations

« Moins confiant dans les mauvaises réponses. Quand Sonnet 4.6 ne sait pas, il le dit. »

3. Moins de Sur-Ingénierie

« J'ai demandé une fonction simple, j'ai obtenu une fonction simple. Pas un framework avec injection de dépendances. »

Implications Tarifaires

Les utilisateurs obtiennent une qualité perçue supérieure à 20 % du coût.

Opus 4.6 Garde Sa Place

Opus 4.6 reste supérieur pour le raisonnement scientifique de niveau PhD, la coordination multi-agents et la récupération en contexte extrêmement long.