anthropic

Claude Opus 4.7

Claude Opus 4.7 是 Anthropic 的旗舰模型,拥有 100 万 token 的 context window、自适应推理和 3.3 倍视觉分辨率,专为企业级 agent 设计。

Frontier ModelAgentic AICoding AssistantLarge ContextAnthropic
anthropic logoanthropicClaude2026年4月16日
上下文
1.0Mtokens
最大输出
128Ktokens
输入价格
$5.00/ 1M
输出价格
$25.00/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
94.2%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Claude Opus 4.7 在此基准测试中得分 94.2%。
HLE
54.7%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Claude Opus 4.7 在此基准测试中得分 54.7%。
MMLU
89.8%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Claude Opus 4.7 在此基准测试中得分 89.8%。
MMLU Pro
89.9%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Claude Opus 4.7 在此基准测试中得分 89.9%。
SimpleQA
31.6%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Claude Opus 4.7 在此基准测试中得分 31.6%。
IFEval
91.2%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Claude Opus 4.7 在此基准测试中得分 91.2%。
AIME 2025
100%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Claude Opus 4.7 在此基准测试中得分 100%。
MATH
94.1%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Claude Opus 4.7 在此基准测试中得分 94.1%。
GSM8k
98.4%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Claude Opus 4.7 在此基准测试中得分 98.4%。
MGSM
94.1%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Claude Opus 4.7 在此基准测试中得分 94.1%。
MathVista
78%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Claude Opus 4.7 在此基准测试中得分 78%。
SWE-Bench
87.6%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Claude Opus 4.7 在此基准测试中得分 87.6%。
HumanEval
92.4%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Claude Opus 4.7 在此基准测试中得分 92.4%。
LiveCodeBench
78.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Claude Opus 4.7 在此基准测试中得分 78.5%。
MMMU
80.7%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Claude Opus 4.7 在此基准测试中得分 80.7%。
MMMU Pro
85.6%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Claude Opus 4.7 在此基准测试中得分 85.6%。
ChartQA
79.5%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Claude Opus 4.7 在此基准测试中得分 79.5%。
DocVQA
92.5%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Claude Opus 4.7 在此基准测试中得分 92.5%。
Terminal-Bench
59.3%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Claude Opus 4.7 在此基准测试中得分 59.3%。
ARC-AGI
68.8%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Claude Opus 4.7 在此基准测试中得分 68.8%。

关于 Claude Opus 4.7

了解 Claude Opus 4.7 的功能、特性以及它如何帮助您获得更好的效果。

模型概述

Claude Opus 4.7 是 Claude 4 架构系列中的旗舰模型。它使用了一种 Adaptive Thinking 框架,允许模型根据感知到的任务难度来扩展其认知努力。这取代了固定的推理预算,采用了动态逻辑层级。开发者现在可以通过 API effort 参数控制内部推理深度,从而在延迟和逻辑严谨性之间取得更好的平衡。该模型专为高风险的企业工作流和自主 agentic 循环而调优。

Context 和 multimodal 能力

该模型提供了 100 万 token 的 context window,且没有任何长 context 溢价。它包括 128,000 token 的输出限制,支持在单次响应中生成海量技术文档或完整代码仓库。视觉分辨率比之前的迭代版本高出 3.3 倍。这实现了 像素级的 UI 理解 和最高 2576 像素图像的 1:1 坐标映射。这些改进使其成为文档分析和视觉审计任务的可靠选择。

Agentic 工程与安全

架构更新针对长期任务和软件工程。它在 SWE-bench Verified 排行榜上得分 87.6%,目前在解决真实的 GitHub issue 方面处于领先地位。该模型引入了任务预算,以帮助管理跨多轮 agent 会话的 token 消耗。Anthropic 已将实时网络安全防护集成到核心架构中,以防止模型参与恶意攻击,同时保持对安全研究人员的实用性。

Claude Opus 4.7

Claude Opus 4.7 的使用案例

发现使用 Claude Opus 4.7 获得出色效果的不同方式。

Agentic 软件工程

利用高 effort 等级自主重构代码仓库并解决复杂的跨文件依赖关系。

大规模代码仓库整合

处理 100 万 token 的源代码以绘制架构流程图并生成技术文档。

高分辨率视觉分析

分析密集图表和像素级 UI 截图,精度比之前的 frontier model 提高 3.3 倍。

网络安全漏洞研究

在已验证的安全边界内进行深入的安全审计和零日漏洞分析。

企业知识提取

从海量技术库中提取结构化数据,并进行复杂的跨文档修订比对。

交互式 3D 原型设计

根据自然语言描述生成功能性的 3D 环境和游戏逻辑。

优势

局限性

业界领先的 coding 精度: 在 SWE-bench Verified 上达到 87.6%,优于目前所有公开发布的软件工程模型。
更高的 token 消耗: 与之前的 Claude 版本相比,新的 tokenizer 导致处理相同文本时 token 使用量增加约 35%。
海量 context 稳定性: 在 1M token 的 context window 内保持 100% 的准确性,且无需支付长 context 溢价。
固定的采样参数: 移除了 temperature 和 top-p 控制,限制了非确定性用例的创意灵活性。
卓越的视觉敏锐度: 支持最高 2576px 的图像,实现 1:1 像素映射,从而进行精确的文档和 UI 分析。
最高 effort 模式下的高延迟: 在 'xhigh' effort 等级下生成响应会导致复杂任务的等待时间显著增加。
动态推理控制: 允许开发者通过 Adaptive Thinking 框架切换 effort 等级,以实现自定义的延迟与逻辑平衡。
严格的安全拒绝: 实时网络安全过滤器可能会导致对合法的安全研究产生误报拒绝。

API快速入门

anthropic/claude-opus-4-7

查看文档
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-opus-4-7",
  max_tokens: 4096,
  thinking: { type: "adaptive" },
  messages: [{ role: "user", content: "Analyze this architecture for concurrency bugs." }],
});

console.log(msg.content[0].text);

安装SDK并在几分钟内开始进行API调用。

人们对 Claude Opus 4.7 的评价

看看社区对 Claude Opus 4.7 的看法

Claude Opus 4.7 在 SWE-bench 和 agentic 推理方面处于领先地位,击败了 GPT-5.4 和 Gemini 3.1 Pro。
zarfet
twitter
它能一次性生成程序化 3D 滑板游戏,这证明了该模型的逻辑密度。
jrandolph
hackernews
Opus 4.7 刚发布。cursorbench 从 58% 跳升到 70%。XBOW 视觉敏锐度为 98.5%,而 opus 4.6 为 54.5%。
hirenthakore
twitter
Claude 倾向于过度设计:你要求一个简单的功能,却得到一个未来十年都能扩展的架构。
Ok_Today5649
reddit
对 Claude Opus 4.7 的早期反馈指出其 token 使用量更高,且对 prompt 的要求更严格。
kimmonismus
twitter
X-High 推理努力等级是我们复杂 agentic 工作流所缺失的中间地带。
Bijan Bowen
youtube

关于 Claude Opus 4.7 的视频

观看关于 Claude Opus 4.7 的教程、评测和讨论

Claude 一直以来都是目前最好的引用模型。

它实际上价格与以前相同,但他们给了你更多对其推理的控制权。

这运行得非常完美,它选择了我会自己选择的工具。

当你不用最高思考等级时,模型感觉明显更快。

你可以在它写下哪怕一行代码之前,看到它正在思考边界情况。

这个模型的运行成本高得多……你要为 Opus 4.7 多付 35% 的费用。

仅视觉升级就值得了……它可以处理分辨率比以前高三倍的图像而无需裁剪。

如果你使用 API,预计比以前多付 35% 的费用。

如果不小心的话,tokenization 的改变是你 API 账单的“隐形杀手”。

它处理深度 context 的能力比 Opus 4 的早期版本好得多。

该模型的视觉能力有了实质性的提升。

X-High 推理努力等级是我们复杂 agentic 工作流所缺失的中间地带。

这绝对百分之百配得上“疯狂”这个标题,它真的让我震惊了。

它正确识别了我遗留代码库中的一个 bug,而其他三个模型都漏掉了。

agent 循环中的自主程度是它与 GPT-5 的区别所在。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Claude Opus 4.7专业提示

专家提示助您充分利用Claude Opus 4.7。

激活 Adaptive Thinking

在 API 调用中显式启用 Adaptive Thinking 模式,以确保 Claude 选择最佳的推理深度。

为 Agent 使用 X-High 设置

将 effort 参数设置为 xhigh 以用于 agentic 循环,从而最大化自我验证和逻辑精确度。

移除辅助提示(Scaffolding)

移除像“仔细检查你的工作”这类陈旧的 prompt,因为该模型已针对内部自我纠错进行了优化。

监控 token 消耗

使用新的 tokenizer 追踪功能来管理对于相同文本输入增加 35% 的 token 计数。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

关于Claude Opus 4.7的常见问题

查找关于Claude Opus 4.7的常见问题答案