Claude 5 预期功能：我们从泄露和传闻中了解到的一切

摘要

Claude 5 预计将是 "agent 原生" 的——针对自主任务执行而非单纯对话进行优化。预期核心功能：50 万至 100 万 token 上下文、Dev Team 多智能体协作模式、85%+ SWE-bench 性能，以及可能比 Opus 4.5 低 50% 的定价。

Agent 原生架构

与以往主要为聊天设计的 Claude 版本不同，Claude 5 从底层就为 agent 工作流构建：

自主导航你的电脑和应用

无需持续监督地执行多步骤任务

在长时间运行的流程中保持状态

从反馈中学习并自我纠正

Dev Team 模式

最受期待的功能之一是多智能体协作：

自动生成子智能体进行并行任务

协调多个 AI 智能体处理复杂项目

一个智能体负责架构，另一个写测试，另一个实现功能

大型项目开发时间缩短 3-5 倍

扩展上下文窗口

当前传闻表明上下文将大幅扩展：

最低预期：50 万 token（当前的 2.5 倍）

乐观预期：100 万 token（追平 Gemini）

关键改进：最大上下文下的质量更好

这将允许在单次会话中分析整个代码库、法律文件或研究论文。

性能目标

基于泄露和行业分析：

基准测试	Claude 4.5 Opus	Claude 5 预期

SWE-bench Verified

80.9%

85-90%

HumanEval

97.3%

99%+

GPQA Diamond

87.3%

90%+

ARC-AGI-2

~30%

50%+

多模态改进

视频理解（新增能力）

会议和播客的音频处理

更好的文档分析，支持版面理解

实时屏幕共享分析

定价预测

行业分析师预计定价将具有竞争力：

Claude 5 Sonnet：输入 $1.50-3 / 输出 $7.50-15（每百万）

Claude 5 Opus：输入 $7.50-15 / 输出 $37.50-75

Claude 5 Haiku：输入 $0.125-0.25 / 输出 $0.625-1.25

Fennec 泄露表明 Sonnet 5 的定价可能比 Opus 4.5 低 50%，同时提供相当的性能。

安全增强

改进的 Constitutional AI v2

更好的拒绝校准（减少过度谨慎）

增强的越狱防护

安全决策的透明推理

不太可能包含的功能

原生图像生成（DALL-E 等效功能）

实时网页浏览（可能后续推出）

语音对话模式（发布时）

本地部署选项

结论

Claude 5 代表了 Anthropic 对 AI agent 未来的押注。专注于自主任务执行、多智能体协作和扩展上下文，将其定位为真正的 AI 协作伙伴，而不仅仅是聊天助手。预计发布时间：2026 年 Q2-Q3。

摘要