BenchmarksFebruary 17, 2026
Claude Sonnet 4.6: 79,6 % SWE-bench – nahe an Opus
Claude Sonnet 4.6 erreicht 79,6 % auf SWE-bench Verified und nähert sich damit dem Premium-Opus-4.5-Modell auf nur 1,3 Prozentpunkte.
Sonnet 4.6: Fast auf Opus-Niveau
Mit 79,6 % auf SWE-bench Verified liegt Claude Sonnet 4.6 nur 1,3 Prozentpunkte unter dem Premium-Opus-4.5-Modell (80,9 %).
Bedeutung
- Bestätigt den Trend: Jedes neue Sonnet nähert sich dem vorherigen Opus
- Bei $4/$20 vs. $15/$75 ist Sonnet jetzt die rationale Wahl für 95 % der Nutzer
- Claude bleibt führend im Coding-Benchmark
Historischer Trend
| Modell | SWE-bench | Verhältnis zum Opus |
| Sonnet 3.5 | ~49 % | 70 % des Opus 3 |
| Sonnet 4 | ~65 % | 85 % des Opus 3.5 |
| Sonnet 4.5 | 73,5 % | 91 % des Opus 4 |
| Sonnet 4.6 | 79,6 % | 98 % des Opus 4.5 |
Fazit
Der Qualitätsunterschied zwischen Sonnet und Opus schrumpft weiter. Sonnet 4.6 ist das neue Sweet Spot-Modell.