anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet 是 Anthropic 推出的首款 hybrid reasoning model,提供 state-of-the-art 的 coding 能力、200k context window 以及可见的 thinking 过程。

anthropic logoanthropicClaude 32025年2月24日
上下文
200Ktokens
最大输出
128Ktokens
输入价格
$3.00/ 1M
输出价格
$15.00/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
84.8%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Claude 3.7 Sonnet 在此基准测试中得分 84.8%。
HLE
34%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Claude 3.7 Sonnet 在此基准测试中得分 34%。
MMLU
89%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Claude 3.7 Sonnet 在此基准测试中得分 89%。
MMLU Pro
74%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Claude 3.7 Sonnet 在此基准测试中得分 74%。
SimpleQA
42%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Claude 3.7 Sonnet 在此基准测试中得分 42%。
IFEval
93.2%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Claude 3.7 Sonnet 在此基准测试中得分 93.2%。
AIME 2025
54.8%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Claude 3.7 Sonnet 在此基准测试中得分 54.8%。
MATH
96.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Claude 3.7 Sonnet 在此基准测试中得分 96.2%。
GSM8k
97%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Claude 3.7 Sonnet 在此基准测试中得分 97%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Claude 3.7 Sonnet 在此基准测试中得分 92%。
MathVista
70%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Claude 3.7 Sonnet 在此基准测试中得分 70%。
SWE-Bench
70.3%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Claude 3.7 Sonnet 在此基准测试中得分 70.3%。
HumanEval
94%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Claude 3.7 Sonnet 在此基准测试中得分 94%。
LiveCodeBench
65%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Claude 3.7 Sonnet 在此基准测试中得分 65%。
MMMU
75%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Claude 3.7 Sonnet 在此基准测试中得分 75%。
MMMU Pro
55%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Claude 3.7 Sonnet 在此基准测试中得分 55%。
ChartQA
89%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Claude 3.7 Sonnet 在此基准测试中得分 89%。
DocVQA
94%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Claude 3.7 Sonnet 在此基准测试中得分 94%。
Terminal-Bench
35.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Claude 3.7 Sonnet 在此基准测试中得分 35.2%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Claude 3.7 Sonnet 在此基准测试中得分 12%。

免费试用 Claude 3.7 Sonnet

免费与 Claude 3.7 Sonnet 对话。测试其功能,提问并探索此AI模型能做什么。

提示词
回复
anthropic/claude-3-7-sonnet-20250219

您的AI回复将显示在此处

关于 Claude 3.7 Sonnet

了解 Claude 3.7 Sonnet 的功能、特性以及它如何帮助您获得更好的效果。

混合推理与透明度

Claude 3.7 Sonnet 作为 Anthropic 的首款“hybrid reasoning”模型,代表了 LLM 架构的里程碑式转变。它独特地允许用户在标准低延迟响应和显示其内部 chain-of-thought 的“extended thinking”模式之间进行切换。这种透明度为用户提供了洞察 model 逻辑的清晰窗口,使其在复杂的故障排除和高风险推理任务中尤为有效。

软件工程大师

该 model 在设计时高度关注软件工程和生产就绪的输出,在 SWE-Bench Verified 等 benchmark 上树立了新的行业标准。它在“vibe coding”方面表现出色,开发人员只需描述高层意图,model 即可处理跨多个文件的实现。它能以超越以往 frontier model 的精准度处理复杂的重构和架构决策。

海量上下文与智能体工具

凭借巨大的 200,000 token context window 和名为 Claude Code 的 agentic 工具集,它从一个简单的聊天机器人转变为一个协作技术伙伴。它能够管理整个项目生命周期,从最初的文档审查到自动化的 git 工作流和测试执行,确保开发过程保持高效且无 bug。

Claude 3.7 Sonnet

Claude 3.7 Sonnet 的使用案例

发现使用 Claude 3.7 Sonnet 获得出色效果的不同方式。

Vibe Coding

:通过自然语言描述意图,从零开始构建功能性软件。

高级 Debugging

:利用 extended thinking 分析复杂的日志并提供精准的一次性修复。

大上下文分析

:在单个 prompt 中审查和重构整个代码库或冗长的技术文档。

Agentic 开发

:驱动像 Claude Code 这样的终端工具,自动化 git 工作流和测试执行。

前端 UI 生成

:创建优雅、易于维护且具有内置设计感的 React 和 Svelte 组件。

事实研究

:以高准确率和低幻觉率分析海量 PDF 文档和数据集。

优势

局限性

行业领先的 Coding 能力: :在 SWE-bench Verified 上取得了 70.3% 的 state-of-the-art 成绩,以前所未有的准确率解决真实的 GitHub 问题。
响应延迟: :与标准 model 响应相比,启用“extended thinking”模式会显著增加首个 token 的生成时间。
可见的推理过程: :首个提供用户可控且可见的“extended thinking”模式的 model,用于处理复杂且关键的决策问题。
溢价定价: :每百万 token $15 的输出成本仍远高于大多数“mini”或开源权重替代方案。
Agentic 集成: :通过 Claude Code 智能体框架针对 tool-use 和 CLI 交互进行了专门优化,实现端到端任务自动化。
无原生音视频支持: :与 GPT-4o 或 Gemini 2.0 不同,它缺乏原生的音频和视频输入处理能力。
卓越的设计审美: :与其他 frontier model 相比,生成的 UI 代码通常更优雅、更易访问且更易维护。
计算成本: :在进行大规模代码库重构时,深度 reasoning 环节可能会迅速消耗 token 预算和 context 限制。

API快速入门

anthropic/claude-3-7-sonnet-20250219

查看文档
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

安装SDK并在几分钟内开始进行API调用。

人们对 Claude 3.7 Sonnet 的评价

看看社区对 Claude 3.7 Sonnet 的看法

"Claude 3.7 Sonnet 是世界上最好的编程 AI model;它在处理挑战性任务时让我大开眼界。"
rawcell4772
reddit
"只需一个 prompt,它就在一个复杂的 TypeScript 项目中完美搞定了一切。"
rawcell4772
reddit
"配合 Sonnet 3.7 的 Claude Code 比 Cline 好得多,是目前最好的工具。"
peterkrueck
reddit
"像 3.7 这样顶级 model 的质量飞跃彻底改变了我对未来的看法。"
lurking_horrors
reddit
"Claude 3.7 简直绝了,体验完全不同…… 妥妥的顶流,不接受反驳"
Fireship
youtube
"Claude 3.7 的 reasoning 模式是逻辑调试范式的彻底转变。"
DevLead99
x

关于 Claude 3.7 Sonnet 的视频

观看关于 Claude 3.7 Sonnet 的教程、评测和讨论

新的 3.7 model 绝对碾压了所有其他 model……现在能够解决 70.3% 的 GitHub 问题

使用强类型语言和 TDD 是 AI 验证其编写的代码是否真正有效的手段

该 model 在遵循指令方面表现得极其聪明

在 SWE-bench 上的表现简直疯狂

可见的 reasoning 过程是提高透明度的游戏规则改变者

Claude 3.7 Sonnet……它可能是目前最好的代码生成 LLM

如果你使用 API,你可以一次性输出 128,000 个 tokens

128k 的输出限制是一个巨大的升级

它在前端组件上的设计审美是无与伦比的

Tool use 和 agentic 能力是这个 model 的核心

Reasoning 应该是 frontier model 的集成能力,而不是一个完全独立的 model

Claude 3.7 的表现相当大幅度地超越了那些 model [DeepSeek, o3]

在 reasoning 模式下,延迟略高一些

它在多项指令遵循任务上击败了 DeepSeek R1

Anthropic 真正专注于生产就绪的输出结果

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流
观看演示视频

专业技巧

专家提示帮助您充分利用此模型并获得更好的效果。

思考预算:专门针对复杂的逻辑或架构规划使用“extended thinking”模式,以获得更高质量的结果。

上下文控制:定期使用 /clear 或重启对话,以节省 context 成本并防止 model 变得迟钝。

验证:要求 Claude 使用 Claude Code 工具为其自身代码编写并运行测试,以确保生产环境的稳定性。

Markdown 规范:在结构化的 Markdown 文件中提供功能需求,以便在大项目中实现更好的指令遵循。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

常见问题

查找有关此模型的常见问题答案