Claude Sonnet 4.6 완전 가이드: 기능, 벤치마크 및 가격
Claude Sonnet 4.6에 대해 알아야 할 모든 것: 1M 토큰 컨텍스트, SWE-bench 79.6% 점수, Adaptive Thinking, Sonnet 가격에 Opus 수준의 성능.
요약
2026년 2월 17일 출시된 Claude Sonnet 4.6은 1/5 비용으로 Opus에 근접한 성능을 제공합니다. 주요 하이라이트: SWE-bench Verified 79.6%, OSWorld 72.5%, 1M 토큰 컨텍스트 창(베타), 동적 추론을 위한 Adaptive Thinking. 가격은 백만 토큰당 $3/$15로 Sonnet 4.5와 동일하게 유지됩니다.
출시 개요
Anthropic은 Opus 4.6 출시 불과 12일 만인 2026년 2월 17일에 Claude Sonnet 4.6을 출시했습니다. 이 모델은 현재 Claude.ai의 무료 및 Pro 플랜 사용자를 위한 기본 모델이며, Claude Code, Claude Cowork, API, 모든 주요 클라우드 플랫폼(AWS Bedrock, Google Vertex AI, Microsoft Foundry)에서 사용 가능합니다.
주요 기능
1M 토큰 컨텍스트 창 (베타)
Sonnet 4.6은 1M 토큰 컨텍스트 창을 지원합니다 - 약 750,000단어 또는 5-10개 전체 코드베이스에 해당합니다. 이는 컨텍스트 제한에 접근할 때 이전 컨텍스트를 자동으로 요약하는 새로운 컨텍스트 압축 기능과 결합되어 사실상 무제한 대화를 가능하게 합니다.
Adaptive Thinking 엔진
이전의 이진 "확장된 사고" 모드를 대체하며, Adaptive Thinking은 모델이 필요한 추론량을 동적으로 결정할 수 있게 합니다. 새로운 effort 파라미터를 사용하여 개발자는 작업 복잡도에 따라 속도, 비용, 지능을 균형 있게 조절할 수 있습니다.
향상된 컴퓨터 사용
Sonnet 4.6은 OSWorld-Verified에서 72.5%를 달성합니다 - Opus 4.6의 72.7%와 0.2% 차이. 이로써 웹 브라우징, 양식 작성, 데스크탑 자동화를 포함한 에이전트 컴퓨터 작업에서 가장 유능한 중간 티어 모델이 됩니다.
개선된 웹 검색
API를 통해 Claude의 웹 검색은 검색 결과를 정렬하고 정제하는 코드를 생성하고 실행하여 관련 정보만 보존합니다. 이를 통해 불필요한 토큰 사용을 줄이면서 응답 품질을 개선합니다.
벤치마크 성능
| 벤치마크 | Sonnet 4.6 | Opus 4.6 | Sonnet 4.5 |
|---|
| SWE-bench Verified | 79.6% | 80.8% | 77.2% |
| OSWorld-Verified | 72.5% | 72.7% | 61.4% |
| GPQA Diamond | 74.1% | 91.3% | 65.0% |
| Math (AIME) | 89% | 93% | 62% |
| GDPval-AA (사무 작업) | 1633 Elo | 1606 Elo | - |
주목할 점은, Sonnet 4.6이 실제 사무 작업(GDPval-AA)과 에이전트 금융 분석(63.3% vs 60.1%)에서 Opus 4.6을 능가한다는 것입니다.
사용자 선호도
초기 테스트에서:
- 사용자는 Sonnet 4.5보다 Sonnet 4.6을 70% 선호
- 사용자는 Opus 4.5보다 Sonnet 4.6을 59% 선호
- 대부분의 코딩 작업 (79.6% SWE-bench)
- 컴퓨터 사용 및 자동화
- 사무/지식 작업
- 금융 분석
- 비용에 민감한 애플리케이션
- 전문가 수준 과학/연구 추론 (91.3% GPQA)
- 멀티 에이전트 조정 작업
- 최대 needle-in-haystack 검색 (76% vs 18.5%)
테스터들은 더 나은 지시 따르기, 더 적은 환각, 줄어든 과도한 엔지니어링을 주요 개선 사항으로 꼽았습니다.
가격
| 모델 | 입력 ($/M) | 출력 ($/M) |
|---|
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Opus 4.6 | $15 | $75 |
Sonnet 4.6은 20% 비용으로 Opus 성능의 ~98-99%를 제공합니다. 추가 절약 가능: 프롬프트 캐싱으로 90%, 배치 처리로 50%.
Sonnet 4.6 vs Opus 4.6 사용 시기
Sonnet 4.6 사용:
Opus 4.6으로 에스컬레이션:
시작하기
import anthropicclient = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6-20260217",
max_tokens=8192,
messages=[{"role": "user", "content": "여기에 프롬프트"}]
)
결론
Claude Sonnet 4.6은 AI의 새로운 최적점을 나타냅니다: 중간 티어 가격에 플래그십급 성능. 대부분의 개발자에게 기본 선택이 되어야 하며, 최대 추론 깊이가 필요한 엣지 케이스에 Opus를 예약합니다.