Claude Sonnet 4.6 완전 가이드: 기능, 벤치마크 및 가격

요약

2026년 2월 17일 출시된 Claude Sonnet 4.6은 1/5 비용으로 Opus에 근접한 성능을 제공합니다. 주요 하이라이트: SWE-bench Verified 79.6%, OSWorld 72.5%, 1M 토큰 컨텍스트 창(베타), 동적 추론을 위한 Adaptive Thinking. 가격은 백만 토큰당 $3/$15로 Sonnet 4.5와 동일하게 유지됩니다.

출시 개요

Anthropic은 Opus 4.6 출시 불과 12일 만인 2026년 2월 17일에 Claude Sonnet 4.6을 출시했습니다. 이 모델은 현재 Claude.ai의 무료 및 Pro 플랜 사용자를 위한 기본 모델이며, Claude Code, Claude Cowork, API, 모든 주요 클라우드 플랫폼(AWS Bedrock, Google Vertex AI, Microsoft Foundry)에서 사용 가능합니다.

주요 기능

1M 토큰 컨텍스트 창 (베타)

Sonnet 4.6은 1M 토큰 컨텍스트 창을 지원합니다 - 약 750,000단어 또는 5-10개 전체 코드베이스에 해당합니다. 이는 컨텍스트 제한에 접근할 때 이전 컨텍스트를 자동으로 요약하는 새로운 컨텍스트 압축 기능과 결합되어 사실상 무제한 대화를 가능하게 합니다.

Adaptive Thinking 엔진

이전의 이진 "확장된 사고" 모드를 대체하며, Adaptive Thinking은 모델이 필요한 추론량을 동적으로 결정할 수 있게 합니다. 새로운 effort 파라미터를 사용하여 개발자는 작업 복잡도에 따라 속도, 비용, 지능을 균형 있게 조절할 수 있습니다.

향상된 컴퓨터 사용

Sonnet 4.6은 OSWorld-Verified에서 72.5%를 달성합니다 - Opus 4.6의 72.7%와 0.2% 차이. 이로써 웹 브라우징, 양식 작성, 데스크탑 자동화를 포함한 에이전트 컴퓨터 작업에서 가장 유능한 중간 티어 모델이 됩니다.

개선된 웹 검색

API를 통해 Claude의 웹 검색은 검색 결과를 정렬하고 정제하는 코드를 생성하고 실행하여 관련 정보만 보존합니다. 이를 통해 불필요한 토큰 사용을 줄이면서 응답 품질을 개선합니다.

벤치마크 성능

벤치마크	Sonnet 4.6	Opus 4.6	Sonnet 4.5

SWE-bench Verified

79.6%

80.8%

77.2%

OSWorld-Verified

72.5%

72.7%

61.4%

GPQA Diamond

74.1%

91.3%

65.0%

Math (AIME)

89%

93%

62%

GDPval-AA (사무 작업)

1633 Elo

1606 Elo

주목할 점은, Sonnet 4.6이 실제 사무 작업(GDPval-AA)과 에이전트 금융 분석(63.3% vs 60.1%)에서 Opus 4.6을 능가한다는 것입니다.

사용자 선호도

초기 테스트에서:

사용자는 Sonnet 4.5보다 Sonnet 4.6을 70% 선호

사용자는 Opus 4.5보다 Sonnet 4.6을 59% 선호

테스터들은 더 나은 지시 따르기, 더 적은 환각, 줄어든 과도한 엔지니어링을 주요 개선 사항으로 꼽았습니다.

가격

모델	입력 ($/M)	출력 ($/M)

Claude Sonnet 4.6

$15

Claude Opus 4.6

$15

$75

Sonnet 4.6은 20% 비용으로 Opus 성능의 ~98-99%를 제공합니다. 추가 절약 가능: 프롬프트 캐싱으로 90%, 배치 처리로 50%.

Sonnet 4.6 vs Opus 4.6 사용 시기

Sonnet 4.6 사용:

대부분의 코딩 작업 (79.6% SWE-bench)

컴퓨터 사용 및 자동화

사무/지식 작업

금융 분석

비용에 민감한 애플리케이션

Opus 4.6으로 에스컬레이션:

전문가 수준 과학/연구 추론 (91.3% GPQA)

멀티 에이전트 조정 작업

최대 needle-in-haystack 검색 (76% vs 18.5%)

시작하기

import anthropic

client = anthropic.Anthropic()
response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=8192,
    messages=[{"role": "user", "content": "여기에 프롬프트"}]
)

결론

Claude Sonnet 4.6은 AI의 새로운 최적점을 나타냅니다: 중간 티어 가격에 플래그십급 성능. 대부분의 개발자에게 기본 선택이 되어야 하며, 최대 추론 깊이가 필요한 엣지 케이스에 Opus를 예약합니다.

요약