BenchmarksFebruary 17, 2026

Claude Sonnet 4.6: 79,6 % SWE-bench – nahe an Opus

Claude Sonnet 4.6 erreicht 79,6 % auf SWE-bench Verified und nähert sich damit dem Premium-Opus-4.5-Modell auf nur 1,3 Prozentpunkte.

Sonnet 4.6: Fast auf Opus-Niveau

Mit 79,6 % auf SWE-bench Verified liegt Claude Sonnet 4.6 nur 1,3 Prozentpunkte unter dem Premium-Opus-4.5-Modell (80,9 %).

Bedeutung

Bestätigt den Trend: Jedes neue Sonnet nähert sich dem vorherigen Opus

Bei $4/$20 vs. $15/$75 ist Sonnet jetzt die rationale Wahl für 95 % der Nutzer

Claude bleibt führend im Coding-Benchmark

Historischer Trend

Modell

SWE-bench

Verhältnis zum Opus

Sonnet 3.5

~49 %

70 % des Opus 3

Sonnet 4

~65 %

85 % des Opus 3.5

Sonnet 4.5

73,5 %

91 % des Opus 4

Sonnet 4.6

79,6 %

98 % des Opus 4.5

Fazit

Der Qualitätsunterschied zwischen Sonnet und Opus schrumpft weiter. Sonnet 4.6 ist das neue Sweet Spot-Modell.

Ready to Experience Claude 5?

Back to All News