Claude Sonnet 4.6 完全ガイド: 機能、ベンチマーク、価格
Claude Sonnet 4.6のすべてがわかる完全ガイド。1Mトークンコンテキスト、SWE-benchスコア79.6%、Adaptive Thinking、Opus級パフォーマンスをSonnet価格で。
要約
2026年2月17日にリリースされたClaude Sonnet 4.6は、1/5のコストでOpusに近いパフォーマンスを提供します。主要ハイライト:SWE-bench Verified 79.6%、OSWorld 72.5%、1Mトークンコンテキストウィンドウ(ベータ)、動的推論のためのAdaptive Thinking。価格は100万トークンあたり$3/$15のまま、Sonnet 4.5と同じです。
リリース概要
AnthropicはOpus 4.6のリリースからわずか12日後の2026年2月17日にClaude Sonnet 4.6をリリースしました。このモデルは現在、Claude.aiの無料プランとProプランのデフォルトとなっており、Claude Code、Claude Cowork、API、すべての主要クラウドプラットフォーム(AWS Bedrock、Google Vertex AI、Microsoft Foundry)で利用可能です。
主要機能
1Mトークンコンテキストウィンドウ(ベータ)
Sonnet 4.6は1Mトークンコンテキストウィンドウをサポートします。約750,000語または5〜10の完全なコードベースに相当します。これは、コンテキスト制限に近づくと古いコンテキストを自動的に要約する新しいコンテキスト圧縮機能と組み合わされ、事実上無制限の会話を可能にします。
Adaptive Thinkingエンジン
旧来のバイナリ「拡張思考」モードに代わり、Adaptive Thinkingはモデルが必要な推論量を動的に決定できます。新しいeffortパラメーターを使用して、開発者はタスクの複雑さに基づいて速度、コスト、知性のバランスを取ることができます。
ベンチマークパフォーマンス
| ベンチマーク | Sonnet 4.6 | Opus 4.6 | Sonnet 4.5 |
|---|
| SWE-bench Verified | 79.6% | 80.8% | 77.2% |
| OSWorld-Verified | 72.5% | 72.7% | 61.4% |
| GPQA Diamond | 74.1% | 91.3% | 65.0% |
| Math (AIME) | 89% | 93% | 62% |
| GDPval-AA(オフィスタスク) | 1633 Elo | 1606 Elo | - |
注目すべきは、Sonnet 4.6が実世界のオフィスタスク(GDPval-AA)とエージェント型金融分析(63.3% vs 60.1%)でOpus 4.6を上回っていることです。
価格
| モデル | 入力($/M) | 出力($/M) |
|---|
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Opus 4.6 | $15 | $75 |
Sonnet 4.6はOpusパフォーマンスの約98〜99%を20%のコストで提供します。プロンプトキャッシングで90%、バッチ処理で50%の追加節約が可能です。
結論
Claude Sonnet 4.6はAIの新しいスイートスポットを代表しています:フラッグシップクラスのパフォーマンスをミッドティア価格で。ほとんどの開発者にとってデフォルトの選択肢となるべきであり、Opusは最大の推論深度が必要なエッジケースに留保すべきです。