АнализFebruary 17, 2026
Пользователи предпочитают Claude Sonnet 4.6 в сравнении с Opus 4.5 в прямых тестах
Anthropic раскрывает, что 59% пользователей предпочли Sonnet 4.6 предыдущему флагману Opus 4.5, ссылаясь на лучшее следование инструкциям.
Sonnet 4.6 побеждает Opus 4.5 в слепых тестах
59% пользователей предпочли Sonnet 4.6 предыдущему флагману.
Результаты тестирования
- Показатель побед: 59% в пользу Sonnet 4.6
- Следование инструкциям: +12% улучшение
- Галлюцинации: На 8% меньше
- Скорость: На 20% быстрее
Почему Sonnet побеждает
1. Лучшая калибровка ответов
2. Более точное следование инструкциям
3. Меньше избыточной информации
4. Быстрее и дешевле
Заключение
Sonnet 4.6 демонстрирует, что среднеуровневые модели могут превосходить флагманы предыдущего поколения.