Claude Sonnet 4.6 自适应思考指南：面向开发者的动态推理

摘要

自适应思考用动态、任务适配的推理取代了 Claude 的二元 "扩展思考" 模式。使用 effort 参数（low/medium/high/auto），开发者可以控制模型在响应前的推理深度——按请求平衡速度、成本和智能。

什么是自适应思考？

以往的 Claude 模型有两种模式：标准（快速、便宜）或扩展思考（慢速、昂贵、深入）。自适应思考引入了一个谱系，允许模型根据任务复杂度自动校准推理深度。

核心洞察：不是每个问题都需要深度推理。"2+2 等于几？" 不应与 "设计一个分布式系统架构" 花费相同的成本。

effort 参数

通过 effort 参数控制推理深度：

值	行为	适用场景

low

最少推理，最快响应

简单问答、格式化、基本任务

medium

平衡推理

大多数编程任务、分析

high

深度推理，较慢响应

复杂问题、架构设计

auto

模型根据查询自动决定

通用应用

成本影响

effort 级别	思考 Token	相对成本	延迟

low

约 100-500

约 1 秒

medium

约 500-2000

1.5-2x

约 2-3 秒

high

约 2000-10000

3-5x

约 5-15 秒

auto

可变

1-5x

可变

思考 token 按输出费率计费（Sonnet 4.6 为 $15/M）。高 effort 请求生成 5,000 个思考 token 将增加约 $0.075 的成本。

新旧对比

方面	扩展思考（旧）	自适应思考（新）

控制

开/关二元

细粒度 effort 级别

成本

开启时总是昂贵

与复杂度成比例

延迟

开启时总是慢

随 effort 缩放

优化

手动切换

可用 auto 模式

结论

自适应思考将 Claude 从二元工具转变为细腻的推理者。通过将 effort 与任务复杂度匹配，你可以在简单任务上减少 50-80% 的成本，同时在需要时保持深度推理能力。通用应用从 auto 开始，然后在理解工作负载模式后使用显式 effort 级别进行优化。

Claude Sonnet 4.6 自适应思考：完整开发者指南

摘要

什么是自适应思考？

effort 参数

成本影响

新旧对比

结论

Ready to Experience Claude 5?