BenchmarksFebruary 17, 2026

Claude Sonnet 4.6: 79,6 % SWE-bench – nahe an Opus

Claude Sonnet 4.6 erreicht 79,6 % auf SWE-bench Verified und nähert sich damit dem Premium-Opus-4.5-Modell auf nur 1,3 Prozentpunkte.

Sonnet 4.6: Fast auf Opus-Niveau

Mit 79,6 % auf SWE-bench Verified liegt Claude Sonnet 4.6 nur 1,3 Prozentpunkte unter dem Premium-Opus-4.5-Modell (80,9 %).

Bedeutung

  • Bestätigt den Trend: Jedes neue Sonnet nähert sich dem vorherigen Opus
  • Bei $4/$20 vs. $15/$75 ist Sonnet jetzt die rationale Wahl für 95 % der Nutzer
  • Claude bleibt führend im Coding-Benchmark

Historischer Trend

ModellSWE-benchVerhältnis zum Opus
Sonnet 3.5~49 %70 % des Opus 3
Sonnet 4~65 %85 % des Opus 3.5
Sonnet 4.573,5 %91 % des Opus 4
Sonnet 4.679,6 %98 % des Opus 4.5

Fazit

Der Qualitätsunterschied zwischen Sonnet und Opus schrumpft weiter. Sonnet 4.6 ist das neue Sweet Spot-Modell.

Ready to Experience Claude 5?

Try Now