anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet은 Anthropic의 첫 번째 hybrid reasoning model로, 최첨단 coding capabilities, 200k context window 및 시각화된 thinking을 제공합니다.

anthropic logoanthropicClaude 32025년 2월 24일
컨텍스트
200K토큰
최대 출력
128K토큰
입력 가격
$3.00/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
84.8%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude 3.7 Sonnet이 이 벤치마크에서 84.8%점을 기록했습니다.
HLE
34%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 34%점을 기록했습니다.
MMLU
89%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 89%점을 기록했습니다.
MMLU Pro
74%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude 3.7 Sonnet이 이 벤치마크에서 74%점을 기록했습니다.
SimpleQA
42%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 42%점을 기록했습니다.
IFEval
93.2%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude 3.7 Sonnet이 이 벤치마크에서 93.2%점을 기록했습니다.
AIME 2025
54.8%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude 3.7 Sonnet이 이 벤치마크에서 54.8%점을 기록했습니다.
MATH
96.2%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 96.2%점을 기록했습니다.
GSM8k
97%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude 3.7 Sonnet이 이 벤치마크에서 97%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude 3.7 Sonnet이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
70%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 70%점을 기록했습니다.
SWE-Bench
70.3%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude 3.7 Sonnet이 이 벤치마크에서 70.3%점을 기록했습니다.
HumanEval
94%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude 3.7 Sonnet이 이 벤치마크에서 94%점을 기록했습니다.
LiveCodeBench
65%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 65%점을 기록했습니다.
MMMU
75%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 75%점을 기록했습니다.
MMMU Pro
55%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude 3.7 Sonnet이 이 벤치마크에서 55%점을 기록했습니다.
ChartQA
89%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 89%점을 기록했습니다.
DocVQA
94%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 94%점을 기록했습니다.
Terminal-Bench
35.2%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 35.2%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 12%점을 기록했습니다.

Claude 3.7 Sonnet 무료 체험

Claude 3.7 Sonnet과 무료로 채팅하세요. 기능을 테스트하고, 질문하고, 이 AI 모델이 할 수 있는 것을 탐색하세요.

프롬프트
응답
anthropic/claude-3-7-sonnet-20250219

AI 응답이 여기에 표시됩니다

Claude 3.7 Sonnet 소개

Claude 3.7 Sonnet의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Hybrid Reasoning 및 투명성

Claude 3.7 Sonnet은 Anthropic의 첫 번째 'hybrid reasoning' model로서 LLM 아키텍처의 획기적인 변화를 상징합니다. 사용자는 표준의 저지연(low-latency) 응답과 내부적인 chain-of-thought를 보여주는 'extended thinking' 모드 사이를 고유하게 전환할 수 있습니다. 이러한 투명성은 사용자에게 model의 로직을 명확하게 보여주어, 복잡한 트러블슈팅과 중요한 reasoning 작업에 특히 효과적입니다.

소프트웨어 엔지니어링 마스터리

소프트웨어 엔지니어링과 프로덕션 준비가 된 결과물에 중점을 두고 설계된 이 model은 SWE-Bench Verified와 같은 benchmark에서 새로운 업계 표준을 세웠습니다. 개발자가 상위 수준의 의도를 설명하고 model이 여러 파일에 걸쳐 구현을 처리하는 'vibe coding'에서 탁월한 성능을 발휘합니다. 이전의 frontier model들을 능가하는 정밀함으로 복잡한 리팩토링과 아키텍처 결정을 처리합니다.

대규모 Context 및 Agentic 도구

200,000 tokens에 달하는 방대한 context window와 Claude Code라는 agentic 도구 세트를 통해 단순한 챗봇에서 협업 기술 파트너로 변모합니다. 초기 문서 검토부터 자동화된 git 워크플로우 및 테스트 실행에 이르기까지 전체 프로젝트 라이프사이클을 관리할 수 있어 개발 속도를 높이고 버그 없는 상태를 유지할 수 있습니다.

Claude 3.7 Sonnet

Claude 3.7 Sonnet 사용 사례

Claude 3.7 Sonnet을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

Vibe Coding

자연어로 의도를 설명하여 처음부터 바로 작동하는 소프트웨어를 구축합니다.

Advanced Debugging

extended thinking을 활용하여 복잡한 로그를 분석하고 정확한 원샷 수정을 제공합니다.

Large Context Analysis

단일 prompt 내에서 전체 코드베이스나 긴 기술 문서를 검토하고 리팩토링합니다.

Agentic Development

git 워크플로우 및 테스트 실행을 자동화하는 Claude Code와 같은 터미널 기반 도구에 동력을 제공합니다.

Frontend UI Generation

디자인 감각이 내장된 우아하고 유지 관리가 쉬운 React 및 Svelte 컴포넌트를 생성합니다.

Factual Research

방대한 PDF 문서와 데이터셋을 높은 정확도와 낮은 환각률로 분석합니다.

강점

제한

업계 최고의 코딩 성능: SWE-bench Verified에서 state-of-the-art인 70.3%를 기록하며, 전례 없는 정확도로 실제 GitHub 이슈를 해결합니다.
응답 지연 시간: 'extended thinking' 모드를 활성화하면 표준 model 응답에 비해 첫 번째 token 생성까지의 latency가 크게 증가합니다.
Visible Reasoning: 복잡하고 중요한 문제 해결을 위해 시각화되고 사용자가 제어 가능한 'extended thinking'을 제공하는 최초의 model입니다.
프리미엄 가격: 100만 tokens당 $15의 output 비용은 대부분의 'mini' 또는 open-weights 대안 모델보다 상당히 높습니다.
Agentic 통합: 엔드 투 엔드 작업 자동화를 위해 Claude Code 에이전트 프레임워크를 통한 도구 사용 및 CLI 상호 작용에 최적화되어 있습니다.
네이티브 오디오/비디오 미지원: GPT-4o나 Gemini 2.0과 달리 네이티브 오디오 및 비디오 입력 처리 기능이 부족합니다.
탁월한 디자인 감각: 다른 frontier model에 비해 일관되게 더 우아하고 접근성이 높으며 유지 관리가 용이한 UI 코드를 생성합니다.
컴퓨팅 비용: 심층적인 reasoning 세션은 대규모 코드베이스 리팩토링 중에 token 예산과 context 제한을 빠르게 소모할 수 있습니다.

API 빠른 시작

anthropic/claude-3-7-sonnet-20250219

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude 3.7 Sonnet에 대한 사람들의 의견

커뮤니티가 Claude 3.7 Sonnet에 대해 어떻게 생각하는지 확인하세요

"Claude 3.7 Sonnet은 세계 최고의 코딩 AI model입니다. 어려운 작업에서 저를 깜짝 놀라게 했습니다."
rawcell4772
reddit
"단 하나의 prompt만으로 복잡한 TypeScript 프로젝트의 모든 것을 완벽하게 해냈습니다."
rawcell4772
reddit
"Sonnet 3.7이 탑재된 Claude Code는 Cline보다 훨씬 뛰어나며 현재 최고의 도구입니다."
peterkrueck
reddit
"3.7과 같은 최상위 model들의 품질 향상은 제 전망을 완전히 바꾸어 놓았습니다."
lurking_horrors
reddit
"Claude 3.7은 진짜 대박입니다... 차원이 달라요. 역대급입니다."
Fireship
youtube
"Claude 3.7의 reasoning 모드는 로직 디버깅의 패러다임을 완전히 바꿨습니다."
DevLead99
x

Claude 3.7 Sonnet에 대한 동영상

Claude 3.7 Sonnet에 대한 튜토리얼, 리뷰 및 토론 시청

새로운 3.7 model은 다른 모든 model을 완전히 압도했습니다... 이제 GitHub 이슈의 70.3%를 해결할 수 있습니다

TDD와 함께 강력한 타입 언어를 사용하는 것은 AI가 작성한 코드가 실제로 유효한지 검증하는 방법입니다

이 model은 지침을 따르는 능력이 믿기지 않을 정도로 뛰어납니다

SWE-bench에서의 성능은 정말 경이롭습니다

Visible reasoning은 투명성 측면에서 게임 체인저입니다

Claude 3.7 Sonnet은... 아마도 코드 생성을 위한 최고의 LLM일 것입니다

API를 사용하면 한 번에 128,000 tokens를 출력할 수 있습니다

128k output 제한은 엄청난 업그레이드입니다

프론트엔드 컴포넌트에 대한 디자인 감각은 타의 추종을 불허합니다

도구 사용과 agentic 능력은 이 model의 핵심입니다

Reasoning은 별개의 model이 아니라 Frontier model의 통합된 기능이어야 합니다

Claude 3.7은 [DeepSeek, o3]와 같은 model들을 상당히 큰 차이로 앞지릅니다

reasoning 모드에서는 latency가 약간 더 높습니다

여러 지침 준수 작업에서 DeepSeek R1을 능가합니다

Anthropic은 프로덕션에 즉시 사용 가능한 결과물에 진심으로 집중했습니다

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로
데모 영상 보기

전문가 팁

이 모델을 최대한 활용하고 더 나은 결과를 얻기 위한 전문가 팁.

Thinking Budget

복잡한 로직이나 아키텍처 설계 시 더 높은 품질의 결과를 얻으려면 'extended thinking' 모드를 전용으로 사용하세요.

Context Control

context 비용을 절감하고 model이 느려지는 것을 방지하기 위해 정기적으로 /clear 명령어를 사용하거나 대화를 새로 시작하세요.

Verification

프로덕션 안정성을 보장하기 위해 Claude Code 도구를 사용하여 Claude에게 직접 작성한 코드에 대한 테스트를 작성하고 실행하도록 요청하세요.

Markdown Specs

대규모 프로젝트 진행 시 지침 준수 성능을 높이려면 구조화된 Markdown 파일로 기능 요구 사항을 제공하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

자주 묻는 질문

이 모델에 대한 일반적인 질문의 답변 찾기