开发者反应：Claude Fable 5 是"阶跃式进步"——Karpathy

开发者生态迅速给出了对 Claude Fable 5 的评价——而且态度鲜明。在 Anthropic 6 月 9 日发布后的一天之内，知名研究者和工具厂商高管都将这款模型描述为一次代际跃迁，而非渐进式更新。

Karpathy："在所有项目上都以明显优势领先"

Andrej Karpathy 给出了被引用最多的评价，称 Fable 5 是"一次配得上大版本升级的阶跃式进步"。他将基准结果描述为"在所有项目上都以明显优势领先"，并特别指出该模型在"针对极难问题的长时间求解会话"中尤其强大——这与 Anthropic 在自家公告中强调的长期任务特征如出一辙。

工具厂商纷纷站台

那些构建开发者实际使用这些模型的环境的公司同样表态直接：

Cursor CEO Michael Truell："Claude Fable 5 是 CursorBench 上的业界领先模型。它打开了一类此前遥不可及的长期任务。"

GitHub CPO Mario Rodriguez："最让我们兴奋的是它所指向的方向：一个开发者可以把日益宏大的工作交给智能体的未来。"

Lyzr CTO Fabian Hedin："一年前需要上百条提示的应用，它现在一次就能完成。"

Equinox CTO Luke Anderson："Claude Fable 5 比以往模型用更少的轮次交付了更强的工程能力。"

共同的主线不是原始分数，而是可委派工作单元的改变——从提示和代码片段，变成整个问题和整个项目。

热情背后的数据

这些反应与公布的数据一致。Fable 5 在 SWE-Bench Pro 上取得 80.3%，领先 Claude Opus 4.8（69.2%）约 11 个百分点，GPT-5.5 为 58.6%，Gemini 3.1 Pro 为 54.2%。它在 Cognition 的 FrontierCode 评测中取得前沿模型最高分。早期客户证据也一致：Stripe 报告称，一项预计需团队两个多月的 5000 万行 Ruby 代码库迁移在一天内完成。

一丝矛盾情绪

并非所有评论都是纯粹的庆祝。TechCrunch 指出，此次发布恰在 Anthropic 警告 AI 正变得过于危险的几天后——这一讽刺被多位评论者注意到。Anthropic 的回应已内置于产品中：网络安全分类器会将敏感查询改由 Claude Opus 4.8 处理，触发率低于 5% 的会话，而超过 1000 小时的外部红队测试未发现任何通用越狱方法。

对于一线开发者，实际结论更简单：该模型在 6 月 22 日前免费包含在 Pro、Max、Team 和 Enterprise 套餐中，这让接下来两周成为检验这波热度的难得低成本时机。

来源

Anthropic：Claude Fable 5 与 Claude Mythos 5

Interconnects：Claude Fable 5 与新的 AI 安全

TechCrunch 报道

开发者对 Claude Fable 5 的反应：Karpathy 称其为"阶跃式进步"

Karpathy："在所有项目上都以明显优势领先"

工具厂商纷纷站台

热情背后的数据

一丝矛盾情绪

来源

Ready to Experience Claude 5?