Полное руководство по Claude Sonnet 4.6: Функции, бенчмарки и цены

Краткий обзор

Claude Sonnet 4.6, выпущенный 17 февраля 2026 года, обеспечивает производительность, близкую к Opus, за 1/5 стоимости. Ключевые характеристики: 79.6% SWE-bench Verified, 72.5% OSWorld, контекстное окно 1M токенов (бета) и Adaptive Thinking для динамического рассуждения. Цена остаётся на уровне $3/$15 за миллион токенов — как и у Sonnet 4.5.

Обзор выпуска

Anthropic выпустила Claude Sonnet 4.6 17 февраля 2026 года — всего через 12 дней после запуска Opus 4.6. Модель теперь является стандартной для пользователей бесплатного и Pro-планов на Claude.ai, а также доступна в Claude Code, Claude Cowork, API и на всех основных облачных платформах (AWS Bedrock, Google Vertex AI, Microsoft Foundry).

Ключевые функции

Контекстное окно 1M токенов (бета)

Sonnet 4.6 поддерживает контекстное окно в 1M токенов — примерно 750,000 слов или 5-10 полных кодовых баз. Это дополнено новой функцией сжатия контекста, которая автоматически суммирует старый контекст при приближении к лимиту, обеспечивая практически неограниченные диалоги.

Движок Adaptive Thinking

Заменяя старый бинарный режим «расширенного мышления», Adaptive Thinking позволяет модели динамически определять, какой объём рассуждений необходим. Используя новый параметр effort, разработчики могут балансировать скорость, стоимость и интеллект в зависимости от сложности задачи.

Улучшенное использование компьютера

Sonnet 4.6 набирает 72.5% на OSWorld-Verified — в пределах 0.2% от 72.7% у Opus 4.6. Это делает его наиболее мощной моделью среднего уровня для агентных компьютерных задач, включая веб-сёрфинг, заполнение форм и автоматизацию рабочего стола.

Улучшенный веб-поиск

Через API веб-поиск Claude генерирует и выполняет код для сортировки и фильтрации результатов поиска, сохраняя только релевантную информацию. Это улучшает качество ответов и снижает ненужный расход токенов.

Результаты бенчмарков

Бенчмарк	Sonnet 4.6	Opus 4.6	Sonnet 4.5

SWE-bench Verified

79.6%

80.8%

77.2%

OSWorld-Verified

72.5%

72.7%

61.4%

GPQA Diamond

74.1%

91.3%

65.0%

Математика (AIME)

89%

93%

62%

GDPval-AA (офисные задачи)

1633 Elo

1606 Elo

Примечательно, что Sonnet 4.6 превосходит Opus 4.6 в реальных офисных задачах (GDPval-AA) и агентном финансовом анализе (63.3% vs 60.1%).

Предпочтения пользователей

В раннем тестировании:

Пользователи предпочли Sonnet 4.6 перед Sonnet 4.5 в 70% случаев

Пользователи предпочли Sonnet 4.6 перед Opus 4.5 в 59% случаев

Тестировщики отметили лучшее следование инструкциям, меньше галлюцинаций и сниженную склонность к overengineering как ключевые улучшения.

Цены

Модель	Вход ($/M)	Выход ($/M)

Claude Sonnet 4.6

$15

Claude Opus 4.6

$15

$75

Sonnet 4.6 обеспечивает ~98-99% производительности Opus при 20% стоимости. Дополнительная экономия: 90% с кэшированием промптов, 50% с пакетной обработкой.

Когда использовать Sonnet 4.6 vs Opus 4.6

Используйте Sonnet 4.6 для:

Большинства задач программирования (79.6% SWE-bench)

Использования компьютера и автоматизации

Офисных и knowledge-задач

Финансового анализа

Приложений, чувствительных к стоимости

Переходите на Opus 4.6 для:

Рассуждений экспертного уровня по науке/исследованиям (91.3% GPQA)

Мультиагентных координированных задач

Максимального поиска «иголки в стоге сена» (76% vs 18.5%)

Начало работы

import anthropic

client = anthropic.Anthropic()
response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=8192,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Заключение

Claude Sonnet 4.6 представляет новую золотую середину в AI: производительность флагманского класса по ценам среднего уровня. Для большинства разработчиков он должен быть выбором по умолчанию, с Opus, зарезервированным для граничных случаев, требующих максимальной глубины рассуждения.