Claude Sonnet 4.6 百万上下文窗口指南：处理海量文档

摘要

Claude Sonnet 4.6 的 100 万 token 上下文窗口（测试版）可处理约 75 万字——相当于 5-10 个完整代码库或数本书。上下文压缩自动总结较旧内容，实现实质上无限的对话。超过 200K token 的请求适用高级定价。

上下文窗口规格

指标	数值

最大上下文

1,000,000 token

大约字数

约 750,000

等效页数

约 3,000 页

代码行数	约 150,000 行

标准定价阈值

200,000 token

定价结构

超过 200K 输入 token 的请求适用长上下文高级费率：

上下文大小	输入价格	输出价格

0-200K token

$3/M

$15/M

200K-100 万 token

$6/M（2 倍）

$30/M（2 倍）

上下文压缩

Sonnet 4.6 新增的上下文压缩自动管理长对话：

接近上下文限制时，较旧消息被自动总结

关键信息被保留；冗长细节被压缩

实现实质上无限的对话长度

对用户透明——无需手动管理

质量考量

虽然 Sonnet 4.6 处理 100 万 token，但质量因任务而异：

任务类型	100 万时的质量	备注

搜索/检索

良好

可能遗漏深埋的信息

总结

优秀

处理整本书效果好

代码分析

非常好

架构理解能力强

特定问答

良好

使用明确上下文标记效果更好

对于 100 万规模的大海捞针检索，Opus 4.6（76% 准确率）显著优于 Sonnet 4.6（约 18%）。

局限性

100 万上下文处于测试阶段——可能存在偶发问题

超过 200K token 的高级定价

在极端长度下大海捞针能力弱于 Opus

延迟随上下文大小增加

输出仍限于 max_tokens（通常 8-16K）

结论

100 万上下文窗口改变了 AI 的可能性：完整代码库分析、多文档综合和书籍长度处理变得切实可行。结合上下文压缩和提示缓存，Sonnet 4.6 使大规模 AI 应用在经济上可行。

Claude Sonnet 4.6 百万 Token 上下文：完整开发者指南

摘要

上下文窗口规格

定价结构

上下文压缩

质量考量

局限性

结论

Ready to Experience Claude 5?