指南
Claude Opus 4.6 完整指南:功能、性能与定价
全面了解 Claude Opus 4.6:详细的功能介绍、基准性能、定价,以及与之前版本的对比。
February 2026
摘要
Claude Opus 4.6 于 2026 年 2 月 5 日发布,是 Anthropic 迄今最强大的模型。具备 200K 上下文、82.1% SWE-bench Verified 得分和增强的 agent 能力,相比 Opus 4.5 有显著提升。定价保持每百万 token $15/$75,成本效率有所提高。
Opus 4.6 的新特性
相比 Claude 4.5 Opus 的关键改进:
- 性能:SWE-bench 82.1%(从 80.9% 提升)
- 速度:响应时间快 25%
- Agent 模式:增强的自主任务执行
- 可靠性:更少的幻觉,更好的事实准确性
- 工具使用:改进的 MCP 集成
基准性能
| 基准测试 | Opus 4.6 | Opus 4.5 | 提升 |
|---|
| SWE-bench Verified | 82.1% | 80.9% | +1.2% |
| GPQA Diamond | 88.5% | 87.3% | +1.2% |
| HumanEval | 97.8% | 97.3% | +0.5% |
| MATH | 94.2% | 92.8% | +1.4% |
定价
| 模型 | 输入($/M) | 输出($/M) |
|---|
| Claude Opus 4.6 | $15.00 | $75.00 |
结论
Claude Opus 4.6 巩固了 Anthropic 在编程 AI 领域的领先地位。性能、速度和可靠性的渐进提升使其成为复杂开发任务的最佳选择。