anthropic

Claude Fable 5

Anthropic 的 Claude Fable 5 是一款 Mythos-class model,具有 1M context window 和 128K 输出 tokens。它在 agentic coding 和 3D 物理模拟方面表现优异。

AnthropicMythos-ClassAgentic CodingReasoning1M Context
anthropic logoanthropicClaude2026年6月9日
上下文
1.0Mtokens
最大输出
128Ktokens
输入价格
$10.00/ 1M
输出价格
$50.00/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
88.5%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Claude Fable 5 在此基准测试中得分 88.5%。
HLE
42%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Claude Fable 5 在此基准测试中得分 42%。
MMLU
91.2%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Claude Fable 5 在此基准测试中得分 91.2%。
MMLU Pro
82%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Claude Fable 5 在此基准测试中得分 82%。
SimpleQA
54%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Claude Fable 5 在此基准测试中得分 54%。
IFEval
92%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Claude Fable 5 在此基准测试中得分 92%。
AIME 2025
90%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Claude Fable 5 在此基准测试中得分 90%。
MATH
91.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Claude Fable 5 在此基准测试中得分 91.2%。
GSM8k
97.8%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Claude Fable 5 在此基准测试中得分 97.8%。
MGSM
96%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Claude Fable 5 在此基准测试中得分 96%。
MathVista
71%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Claude Fable 5 在此基准测试中得分 71%。
SWE-Bench
72%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Claude Fable 5 在此基准测试中得分 72%。
HumanEval
93.5%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Claude Fable 5 在此基准测试中得分 93.5%。
LiveCodeBench
76%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Claude Fable 5 在此基准测试中得分 76%。
MMMU
74.3%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Claude Fable 5 在此基准测试中得分 74.3%。
MMMU Pro
58%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Claude Fable 5 在此基准测试中得分 58%。
ChartQA
92%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Claude Fable 5 在此基准测试中得分 92%。
DocVQA
95%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Claude Fable 5 在此基准测试中得分 95%。
Terminal-Bench
55%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Claude Fable 5 在此基准测试中得分 55%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Claude Fable 5 在此基准测试中得分 12%。

关于 Claude Fable 5

了解 Claude Fable 5 的功能、特性以及它如何帮助您获得更好的效果。

Claude Fable 5 是 Anthropic 最强大的通用 model,基于 Mythos 架构类别构建。它专为需要深度 reasoning 和海量内存缓冲的高风险自主任务而设计。凭借 1,000,000 token 的 context window,它可以在单个 prompt 中摄入整个公司的代码库或数百篇研究论文。该 model 专门针对需要自我纠正的长期 agentic 工作流进行了优化。

该 model 引入了独特的 128,000 输出 token 限制,使其能够编写完整的软件模块或详尽的技术文档而无需截断。它具有自我验证循环,使用 vision 能力来检查其生成的代码,特别是在 UI 和 3D 模拟方面。虽然它对生物学等高风险领域保持严格的安全过滤器,但其通用 reasoning 性能达到了高级工程师水平,在复杂的系统架构和大规模迁移方面超越了先前的版本。

开发人员主要使用 Fable 5 来处理那些因 context 分裂或逻辑缺失而无法在标准 models 上完成的任务。它将高保真 vision 与专家级软件工程能力相结合,使其能够构建复杂的 3D 环境并根据原始设计验证视觉输出。从技术上讲,它代表了多模态逻辑和自主可靠性的重大飞跃。

Claude Fable 5

Claude Fable 5 的使用案例

发现使用 Claude Fable 5 获得出色效果的不同方式。

自动化代码库迁移

通过在 1M context window 内处理整个项目,将 5000 万行的旧代码库迁移到现代框架中。

3D 物理模拟生成

通过单个 prompt 创建带有复杂网格碰撞器和流体动力学的独立 C++ 或 WebGL 模拟。

专家级科学研究分析

综合数百篇博士级研究论文,在遵守安全防护栏的同时提出新颖的假设。

Agentic 战略金融建模

驱动自主 agents 处理多年市场数据,并生成带有交互式仪表板的详细预测。

实时网络可视化

构建可捕获实时数据包并将其可视化为 3D 环境的后端系统,以识别安全异常。

高保真技术内容创作

利用扩展的 token 限制,单次生成 10 万字的技术手册和全面的文档集。

优势

局限性

业界领先的逻辑能力: 在 benchmark 中表现卓越,MMLU 评分达 91.2%,GPQA 评分达 88.5%,达到了专家级研究科学家的智能水平。
高级定价: 每 100 万输出 token 50 美元的价格使其成为市面上最昂贵的 models 之一,不太适合简单的聊天任务。
巨大的输出容量: 128,000 个输出 token 限制允许一次性生成完整应用程序和深度的多章节技术报告。
严格的安全过滤器: 针对网络安全和生物学的防护措施偶尔会对良性技术查询产生误报,迫使任务回退至 Opus。
自主可靠性: 在 SWE-Bench Pro 上得分 80.3%,展示了在无需人工干预的情况下解决复杂 GitHub 问题的高超能力。
高 reasoning 延迟: 与较小的 models 相比,处理完整的 1M context 或使用高强度 reasoning 模式会导致显著更长的响应时间。
先进的 vision 集成: 利用 vision 检查自身工作,确保生成的 UI 和 3D 资产与用户的原始设计意图保持一致。
数据保留策略: 标准使用需要 30 天的数据保留以进行安全监控,这可能无法满足高度敏感环境的要求。

API快速入门

anthropic/claude-fable-5

查看文档
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: "claude-fable-5",
  max_tokens: 1024,
  messages: [{ 
    role: "user", 
    content: "Analyze this codebase for security vulnerabilities and suggest fixes." 
  }],
});

console.log(message.content[0].text);

安装SDK并在几分钟内开始进行API调用。

人们对 Claude Fable 5 的评价

看看社区对 Claude Fable 5 的看法

从质量上讲,这是一个值得重大版本更新的飞跃。在解决极度困难问题的长会话中,它表现处于顶峰。
Andrej Karpathy
twitter
Fable 5 让 GPT 5.5 看起来像个玩具。对于复杂、困难的任务,它是新的基准和新的 state-of-the-art。
MattVidPro
youtube
Fable 5 仅凭 vision 就完成了《精灵宝可梦:火红》。仅使用原始截图,没有地图,没有隐藏状态。这非常令人印象深刻。
Charly Wargnier
twitter
1M context window 终于让大规模旧代码迁移感觉像是个已解决的问题。现在对于我的大多数项目来说,RAG 感觉是可选的了。
u/DevOps_Master
reddit
Claude 5 Fable(超高强度)通过 1 小时的 reasoning,在单次 prompt 中生成了 8000 行代码并克隆了一个宝可梦游戏。这是一个新时代。
Chris
twitter
Anthropic 发布了面向大众的 Fable 5 和面向受限研究的 Claude Mythos 5。这是他们目前公开最强大的 model。
TechCrunch
news

关于 Claude Fable 5 的视频

观看关于 Claude Fable 5 的教程、评测和讨论

“我认为这极有可能是我们所接触过的最强大的 language model。”

“看看这些水体效果,真是太疯狂了。这很可能是该 prompt 下我得到过的最佳结果。”

“它感觉更加成熟,考虑得非常周全。绝对令人震惊。”

“从质量上讲,这是一个值得重大版本升级的跨越式进步。”

“Fable 5 让 GPT 5.5 看起来像个玩具。”

“Fable 5 在 Swaybench Pro 的几乎每一个 benchmark 上都是 state-of-the-art。”

“Fable 5 的 vision 能力非常出色,仅凭纯粹的 vision 就能通关《精灵宝可梦:火红》。”

“他们终于带着 Fable 5 回归了,伙计们,它太不可思议了。”

“它以专家级的逻辑处理长期运行、复杂且异步的任务。”

“该 model 专为自主知识工作和编码而优化。”

“这可以说是一种新范式。它在建筑物上添加了网格碰撞器,我们甚至能看到内部。”

“这个 model 可能真的有能力制作 GTA 6。不,不会……看看那个效果。”

“对细节的关注,比如 3D 打印机上旋转的长丝线轴,简直令人惊叹。”

“它在大约一个小时内重现了 2011 年的年度游戏。”

“巨大的输出容量允许一次性生成整个应用程序。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Claude Fable 5专业提示

专家提示助您充分利用Claude Fable 5。

使用高强度 reasoning 模式

在 API 中将 model 设置为“高”或“超高”强度,以解决需要深度 chain-of-thought 的数学或逻辑问题。

利用 prompt caching

对频繁访问的代码库使用 prompt caching,可在多天自主任务会话中将成本降低高达 90%。

通过 vision 锚定任务

提供目标 UI 的截图,让 Fable 5 利用 vision 验证其代码是否符合你的需求。

显式请求自我验证

指导 model 在返回最终结果前,自行编写测试套件并执行以排查 bug。

利用 128K 输出上限

避免拆分长请求,在单个 prompt 中要求生成完整的后端和前端,以确保架构的一致性。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M

关于Claude Fable 5的常见问题

查找关于Claude Fable 5的常见问题答案