가이드

Claude Sonnet 4.6 완전 가이드: 기능, 벤치마크 및 가격

Claude Sonnet 4.6에 대해 알아야 할 모든 것: 1M 토큰 컨텍스트, SWE-bench 79.6% 점수, Adaptive Thinking, Sonnet 가격에 Opus 수준의 성능.

February 2026

요약

2026년 2월 17일 출시된 Claude Sonnet 4.6은 1/5 비용으로 Opus에 근접한 성능을 제공합니다. 주요 하이라이트: SWE-bench Verified 79.6%, OSWorld 72.5%, 1M 토큰 컨텍스트 창(베타), 동적 추론을 위한 Adaptive Thinking. 가격은 백만 토큰당 $3/$15로 Sonnet 4.5와 동일하게 유지됩니다.

출시 개요

Anthropic은 Opus 4.6 출시 불과 12일 만인 2026년 2월 17일에 Claude Sonnet 4.6을 출시했습니다. 이 모델은 현재 Claude.ai의 무료 및 Pro 플랜 사용자를 위한 기본 모델이며, Claude Code, Claude Cowork, API, 모든 주요 클라우드 플랫폼(AWS Bedrock, Google Vertex AI, Microsoft Foundry)에서 사용 가능합니다.

주요 기능

1M 토큰 컨텍스트 창 (베타)

Sonnet 4.6은 1M 토큰 컨텍스트 창을 지원합니다 - 약 750,000단어 또는 5-10개 전체 코드베이스에 해당합니다. 이는 컨텍스트 제한에 접근할 때 이전 컨텍스트를 자동으로 요약하는 새로운 컨텍스트 압축 기능과 결합되어 사실상 무제한 대화를 가능하게 합니다.

Adaptive Thinking 엔진

이전의 이진 "확장된 사고" 모드를 대체하며, Adaptive Thinking은 모델이 필요한 추론량을 동적으로 결정할 수 있게 합니다. 새로운 effort 파라미터를 사용하여 개발자는 작업 복잡도에 따라 속도, 비용, 지능을 균형 있게 조절할 수 있습니다.

향상된 컴퓨터 사용

Sonnet 4.6은 OSWorld-Verified에서 72.5%를 달성합니다 - Opus 4.6의 72.7%와 0.2% 차이. 이로써 웹 브라우징, 양식 작성, 데스크탑 자동화를 포함한 에이전트 컴퓨터 작업에서 가장 유능한 중간 티어 모델이 됩니다.

개선된 웹 검색

API를 통해 Claude의 웹 검색은 검색 결과를 정렬하고 정제하는 코드를 생성하고 실행하여 관련 정보만 보존합니다. 이를 통해 불필요한 토큰 사용을 줄이면서 응답 품질을 개선합니다.

벤치마크 성능

벤치마크Sonnet 4.6Opus 4.6Sonnet 4.5
SWE-bench Verified79.6%80.8%77.2%
OSWorld-Verified72.5%72.7%61.4%
GPQA Diamond74.1%91.3%65.0%
Math (AIME)89%93%62%
GDPval-AA (사무 작업)1633 Elo1606 Elo-

주목할 점은, Sonnet 4.6이 실제 사무 작업(GDPval-AA)과 에이전트 금융 분석(63.3% vs 60.1%)에서 Opus 4.6을 능가한다는 것입니다.

사용자 선호도

초기 테스트에서:

    • 사용자는 Sonnet 4.5보다 Sonnet 4.6을 70% 선호
      • 사용자는 Opus 4.5보다 Sonnet 4.6을 59% 선호

      테스터들은 더 나은 지시 따르기, 더 적은 환각, 줄어든 과도한 엔지니어링을 주요 개선 사항으로 꼽았습니다.

      가격

      모델입력 ($/M)출력 ($/M)
      Claude Sonnet 4.6$3$15
      Claude Opus 4.6$15$75

      Sonnet 4.6은 20% 비용으로 Opus 성능의 ~98-99%를 제공합니다. 추가 절약 가능: 프롬프트 캐싱으로 90%, 배치 처리로 50%.

      Sonnet 4.6 vs Opus 4.6 사용 시기

      Sonnet 4.6 사용:

        • 대부분의 코딩 작업 (79.6% SWE-bench)
          • 컴퓨터 사용 및 자동화
            • 사무/지식 작업
              • 금융 분석
                • 비용에 민감한 애플리케이션

                Opus 4.6으로 에스컬레이션:

                  • 전문가 수준 과학/연구 추론 (91.3% GPQA)
                    • 멀티 에이전트 조정 작업
                      • 최대 needle-in-haystack 검색 (76% vs 18.5%)

                      시작하기

                      import anthropic
                      
                      

                      client = anthropic.Anthropic()

                      response = client.messages.create(

                      model="claude-sonnet-4-6-20260217",

                      max_tokens=8192,

                      messages=[{"role": "user", "content": "여기에 프롬프트"}]

                      )

                      결론

                      Claude Sonnet 4.6은 AI의 새로운 최적점을 나타냅니다: 중간 티어 가격에 플래그십급 성능. 대부분의 개발자에게 기본 선택이 되어야 하며, 최대 추론 깊이가 필요한 엣지 케이스에 Opus를 예약합니다.

Ready to Experience Claude 5?

Try Now