Claude Opus 4.5 的价格是多少？

输入 tokens 的价格为每百万 tokens 5.00 美元，输出 tokens 的价格为每百万 tokens 25.00 美元。这比之前的 Opus 4.1 定价降低了 67%。

我可以通过 API 访问 Opus 4.5 吗？

是的，它可以在 Anthropic Developer Platform 上通过模型标识符 claude-opus-4-5-20251101 使用。

context window 的大小是多少？

该模型支持 200,000 个 token 的 context window。这使得它能够同时处理庞大的代码仓库或多份长文档。

它支持视觉功能吗？

是的，它是一个 multimodal 模型，在解读图表、架构图和 UI 布局方面表现卓越。

它在编程方面与竞争对手相比如何？

它是第一个在 SWE-bench Verified 上突破 80% 阈值的模型，在软件工程领域表现优于当前所有的 frontier model。

什么是 effort 参数？

这是一个开发者控制项，允许你在针对特定 prompt 时，选择最小化支出或最大化 reasoning 深度。

它适合企业使用吗？

Anthropic 将其认定为迄今为止对齐效果最稳健的模型，具有极高的抗 prompt injection 能力。

Claude Opus 4.5

Claude Opus 4.5 是 Anthropic 最强大的 frontier model，提供破纪录的 80.9% SWE-bench 性能以及高级的自主编程 agency 能力。

anthropicClaude 42025年11月24日

上下文

200Ktokens

最大输出

64Ktokens

输入价格

$5.00/ 1M

输出价格

$25.00/ 1M

模态:TextImage

能力:视觉工具流式传输推理

基准测试

GPQA

87%

MMLU

90.8%

MMLU Pro

80%

IFEval

90%

AIME 2025

37%

MATH

85%

GSM8k

95%

MGSM

92%

MathVista

72%

SWE-Bench

80.9%

HumanEval

90%

LiveCodeBench

75%

MMMU

80.7%

MMMU Pro

60%

ChartQA

90%

DocVQA

94%

Terminal-Bench

59.3%

ARC-AGI

37.6%

查看API文档

关于 Claude Opus 4.5

了解 Claude Opus 4.5 的功能、特性以及它如何帮助您获得更好的效果。

Claude Opus 4.5 是 Anthropic 在 2025 年底发布的旗舰模型。它专为复杂的软件工程和高风险 reasoning 而设计。该模型在 SWE-bench Verified benchmark 上取得了 80.9% 的破纪录成绩，使其成为自主调试和系统重构的首选。它引入了一种强调外交式诚实和细致助人精神的 refined 人格设定。

Multimodal 与 Agentic 优化

该架构支持 200,000 个 token 的 context window 和 64,000 个 token 的输出限制。开发者可以使用专门的 effort 参数来根据计算成本权衡 reasoning 深度。这种灵活性使得它既能胜任高强度的逻辑任务，也能进行更快、更经济的创意起草。该模型是 multimodal 的，擅长解读架构图和密集的 UI 布局。

工程与工具使用

针对 agentic 工作流进行了优化，它通过 Claude Code 导航终端环境，执行全系统审计。与之前的旗舰迭代相比，它显著降低了输入和输出定价。它在长期任务中保持连贯性的能力，使其成为专业工程团队和复杂数据分析的可靠合作伙伴。

Claude Opus 4.5 的使用案例

发现使用 Claude Opus 4.5 获得出色效果的不同方式。

自主软件工程

利用破纪录的 80.9% SWE-bench 得分，实现端到端的自动化调试和全系统重构。

Agentic 研究工作流

利用 200k 的 context window，将海量的技术数据合成为可执行的商业战略。

高保真 UI/UX 视觉

将复杂的 Figma 设计稿和架构图转化为具有像素级精度的生产级前端代码。

多 Agent 编排

担任子 Agent 团队的中央大脑，管理跨越多个不同代码库的长期项目。

高级数据分析

以高精度和深度的 reasoning 能力，实现复杂财务建模和 Excel 工作流的自动化。

文学与创意写作

产出符合特定文风偏好和复杂以人为本设计原则的细致文案。

优势

局限性

顶尖的编程性能: 首个在 SWE-bench Verified 上突破 80% 障碍（80.9%）的模型，超越了所有其他 frontier model。

数学 benchmark 差距: 虽然在编程方面表现顶尖，但在博士级别的数学任务上，它略微落后于专业模型。

灵活的 Reasoning 控制: effort 参数为开发者提供了针对特定工作流的计算成本与 reasoning 深度之间的精细化控制。

规划延迟: 将 effort 参数设置为高可能会导致在输出第一个 token 前出现显著的更长思考阶段。

自然的对话细微差别: 以精致的人格设定著称，能够处理模糊性，并在没有机械式引导的情况下遵循复杂的背景设置。

Context Token 上限: System prompts 和工具定义可能会在开始处理前消耗掉 window 的大部分空间。

显著的成本效率: $5/$25 的定价使得 Opus 级别的智能能够在大规模的企业生产中得到应用。

事实检索缺失: 在 SimpleQA 等专业准确性测试中，与搜索密集型竞争对手相比，它偶尔仍会编造细节。

API快速入门

anthropic/claude-opus-4.5

查看文档

anthropic SDK

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-opus-4-5-20251101',
  max_tokens: 4096,
  effort: 'high',
  messages: [{ role: 'user', content: 'Analyze this system architecture for race conditions.' }],
});

console.log(msg.content[0].text);

安装SDK并在几分钟内开始进行API调用。

人们对 Claude Opus 4.5 的评价

看看社区对 Claude Opus 4.5 的看法

“Claude Opus 4.5 感觉不像一个无状态的助手，更像一个持久的队友。它能以一种明显更强的方式追溯跨多个文件的假设。”

— Federal-Piano8695

“看着你的 AI Agent 开发出一种以无法解释的方式与真实人类产生共鸣的社交媒体人格。基础设施比 prompts 更重要。”

— auxten

twitter

“Opus 是这方面表现最好的模型。它的讨论最自然，并且在讨论中真正地与你保持同步。”

— ArchMeta1868

“Opus 4.5 捕捉到了最细微的差别。它是唯一一个在第一轮尝试中成功包含内联 trailer 机制的模型。”

— Matt Berman

youtube

“80.9% 的 SWE-bench 得分可能是真实的，但也有些误导性。要持续达到这些数字，需要清晰的环境设置。”

— testingcatalog

twitter

“SWE-bench Verified: 80.9% (Opus 4.5) vs 71.3% (Claude 3-Opus)。这是现实世界可靠性的一次巨大飞跃。”

— Daniel Garcia

medium

关于 Claude Opus 4.5 的视频

观看关于 Claude Opus 4.5 的教程、评测和讨论

“Opus 4.5 捕捉到了最细微的差别”

“它是唯一一个在第一轮尝试中成功包含内联 trailer 机制的模型”

“由 Agent 驱动的代码评估证实了这种主观感受，Opus 在功能完整性方面得分为 7/10”

“在处理极端情况时，其 reasoning 比之前的版本更合乎逻辑”

“它能在 30 分钟的会话中保持代码库的一致性”

“价格现在便宜了三倍。每百万输入 tokens 仅需 5 美元”

“每百万 tokens 输入价格为 5 美元，输出价格为 25 美元”

“Opus 4.5 在 Anthropic 自己的带回作业考试中的得分超过了任何人类候选人”

“这是第一个在 SWE-bench 上突破 80% 障碍的模型”

“它无需人工干预即可处理 30 分钟的自主编程会话”

“将 Claude Opus 4.5 视为一层说服力层和一个绝对的 agentic 怪兽”

“它是一个绝对的 agentic 编程怪兽”

“工程师们最终更喜欢与 Claude Opus 4.5 合作，因为他们能获得那种紧密的反馈循环”

“Reasoning effort 参数是开发者最突出的功能”

“在长篇讨论中，它感觉更像是一个合作者而不是一个工具”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

Claude Opus 4.5专业提示

专家提示助您充分利用Claude Opus 4.5。

切换 Reasoning Effort

针对复杂的逻辑或编程任务，将 effort 参数设置为高；对于常规的创意写作，将其设置为中等。

原生视觉设计

上传 UI Bug 的高分辨率截图，因为该模型经过专门调优，能够识别文本描述所遗漏的视觉偏差。

结构化 System Prompts

在 system prompts 中定义清晰的 agentic 角色和 effort 水平，以防止模型对简单的流程性任务过度思考。

Context 压缩

在长期运行的会话中总结历史记录，以确保 200k 的 context window 始终聚焦于最相关的信息。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.