БенчмаркFebruary 17, 2026
Claude Sonnet 4.6 набирает 79.6% на SWE-bench, в пределах 1.2% от Opus 4.6
Новая модель Sonnet сокращает разрыв с флагманской моделью по бенчмаркам программирования, достигая отраслевой производительности по среднеуровневым ценам.
Sonnet 4.6 почти догоняет Opus
Claude Sonnet 4.6 достигает 79.6% на SWE-bench — разрыв с Opus составляет всего 1.2%.
Детальные результаты
| Модель | SWE-bench | Цена (вход) | Разница |
| Opus 4.6 | 80.8% | $15/M | — |
| Sonnet 4.6 | 79.6% | $3/M | -1.2% |
Анализ
1.2% разницы при 5-кратной разнице в цене делает Sonnet оптимальным выбором для большинства задач программирования.
Заключение
Sonnet 4.6 предлагает 98.5% производительности Opus за 20% стоимости.