Claude Fable 5 视觉能力:科学图表、截图转应用与 Pokemon FireRed
Claude Fable 5 为视觉能力树立了新标杆:从科学图表精确提取数据、根据截图重建 Web 应用,并仅凭视觉通关 Pokemon FireRed。
TL;DR
Claude Fable 5 的视觉能力在两个实用领域达到业界最先进水平:从科学图表中提取精确数值,以及根据截图重建 Web 应用。最令人难忘的演示是它仅凭视觉通关了 Pokemon FireRed——这项任务上,早期 Claude 模型需要辅助工具来追踪游戏状态。
从科学图表中提取精确数值
粗略地"看懂"一张图很容易;提取每个数据点背后的确切数值很难——这正是以往视觉模型频繁失手的地方。Fable 5 在从科学图表中提取精确数值上达到业界最先进水平。对于做文献综述、荟萃分析,或需要从已发表论文中恢复数据(而原始数据集不可得)的人来说,这相当于把图表从图片还原成了数据。
它还与 Claude Mythos 5 的科学叙事相互叠加:一个能准确读图的模型,可以直接与科学文献本身对话,而不只是与文字摘要对话。
从截图到可运行的 Web 应用
第二项标志性能力是根据截图重建 Web 应用。给 Fable 5 看一张界面图片,它就能重建出这个应用——布局、组件和行为。实际用途随之而来:
- 一步把设计稿变成可运行的前端
- 重建源代码已经丢失的遗留内部工具
- 基于产品截图快速做竞品原型
结合它的编程实力——SWE-Bench Pro 80.3% 与 Cognition FrontierCode 前沿模型最高分——这条"截图到应用"的链路产出的代码不仅视觉上忠实,工程上也扎实。
Pokemon FireRed 里程碑
Claude 模型玩宝可梦已经成为社区衡量智能体耐力的非正式基准,早期模型需要辅助工具——读内存的脚手架和状态追踪器——才能推进。Fable 5 仅凭视觉就通关了 Pokemon FireRed:看屏幕、理解游戏状态、做出行动,就像人类玩家一样。
这件事的意义超出趣味本身。纯视觉通关需要在极长的时间跨度内可靠地读取动态界面、跨数小时游戏记住目标,并从错误中恢复——这正是通过屏幕操作真实软件的计算机使用型智能体所需的全部技能。它同时也展示了模型的长上下文耐力:Fable 5 能在数百万 token 中保持专注。
亲自试一试
2026 年 6 月 9 日至 6 月 22 日,Fable 5 免费包含在 Pro、Max、Team 和 Enterprise 计划中,并已在 Claude API、Amazon Bedrock 和 GitHub Copilot 上全面开放。不错的入门实验:把你所在领域一篇论文里信息密集的图表交给它,要求以表格形式输出数据;或者截一张内部仪表盘的图,请它重建这个页面。