anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet은 Anthropic의 첫 번째 하이브리드 reasoning model로, state-of-the-art 코딩 성능, 200k context window 및 가시적인 사고 과정을 제공합니다.

anthropic logoanthropicClaude 32025년 2월 24일
컨텍스트
200K토큰
최대 출력
128K토큰
입력 가격
$3.00/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
84.8%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude 3.7 Sonnet이 이 벤치마크에서 84.8%점을 기록했습니다.
HLE
34%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 34%점을 기록했습니다.
MMLU
89%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 89%점을 기록했습니다.
MMLU Pro
74%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude 3.7 Sonnet이 이 벤치마크에서 74%점을 기록했습니다.
SimpleQA
42%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 42%점을 기록했습니다.
IFEval
93.2%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude 3.7 Sonnet이 이 벤치마크에서 93.2%점을 기록했습니다.
AIME 2025
54.8%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude 3.7 Sonnet이 이 벤치마크에서 54.8%점을 기록했습니다.
MATH
96.2%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 96.2%점을 기록했습니다.
GSM8k
97%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude 3.7 Sonnet이 이 벤치마크에서 97%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude 3.7 Sonnet이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
70%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 70%점을 기록했습니다.
SWE-Bench
70.3%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude 3.7 Sonnet이 이 벤치마크에서 70.3%점을 기록했습니다.
HumanEval
94%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude 3.7 Sonnet이 이 벤치마크에서 94%점을 기록했습니다.
LiveCodeBench
65%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 65%점을 기록했습니다.
MMMU
75%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 75%점을 기록했습니다.
MMMU Pro
55%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude 3.7 Sonnet이 이 벤치마크에서 55%점을 기록했습니다.
ChartQA
89%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 89%점을 기록했습니다.
DocVQA
94%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude 3.7 Sonnet이 이 벤치마크에서 94%점을 기록했습니다.
Terminal-Bench
35.2%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 35.2%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude 3.7 Sonnet이 이 벤치마크에서 12%점을 기록했습니다.

Claude 3.7 Sonnet 소개

Claude 3.7 Sonnet의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

하이브리드 Reasoning 설계

Claude 3.7 Sonnet은 사용자가 속도와 깊이 사이에서 선택할 수 있도록 하는 새로운 아키텍처를 사용합니다. extended thinking 토글을 제공하는 최초의 model로서, 시스템이 답변을 제공하기 전에 복잡한 논리를 거쳐 사고할 수 있게 합니다. 이러한 투명성을 통해 개발자는 model이 어떻게 결론에 도달했는지 정확히 확인할 수 있어 기술적 작업에서 발생할 수 있는 숨겨진 오류의 가능성을 줄여줍니다.

기술적 문제 해결

이 model은 수준 높은 소프트웨어 엔지니어를 위해 제작되었습니다. SWE-bench Verified benchmark에서 62.1%의 점수를 기록하며 실제 GitHub 이슈를 해결하는 강력한 능력을 보여줍니다. Claude Code와 같은 도구와 함께 사용하면 대규모 저장소 전체에서 파일 편집 및 명령 실행을 관리할 수 있습니다. 또한 수학과 코딩 task를 현재 최상위 reasoning model과 대등하거나 그 이상의 정밀도로 처리합니다.

방대한 Context 용량

200,000 token의 context window를 통해 대규모 문서 집합이나 코드베이스를 한 번에 처리합니다. thinking 모드가 활성화되었을 때 최대 128,000 token의 출력을 지원하여 긴 스크립트나 상세한 보고서를 생성하는 데 유용합니다. 또한 multimodal 기능을 갖추고 있어 텍스트와 함께 차트 및 도표를 해석할 수 있습니다.

Claude 3.7 Sonnet

Claude 3.7 Sonnet 사용 사례

Claude 3.7 Sonnet을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

Agentic 소프트웨어 엔지니어링

터미널 도구를 사용하여 방대한 파일 구조 전체에서 버그를 수정하고 코드를 리팩토링합니다.

수학 증명 검증

model이 논리적 단계를 거쳐 생각하게 함으로써 어려운 수학 문제를 해결합니다.

저장소(Repository) 분석

한 번의 prompt로 전체 기술 코드베이스에서 데이터를 추출하고 패턴을 식별합니다.

시각적 데이터 파싱

복잡한 차트, 순서도 및 기술 도표를 구조화된 JSON 데이터로 변환합니다.

시스템 아키텍처 설계

확장된 thinking 모드를 사용하여 상세한 논리 검증과 함께 소프트웨어 시스템을 설계합니다.

자동화된 Git 워크플로우

agentic 도구 활용을 통해 커밋 메시지, 코드 리뷰 및 테스트 실행을 관리합니다.

강점

제한

하이브리드 Reasoning 옵션: 사용자가 빠른 표준 응답과 심층적인 reasoning 모드 사이를 전환할 수 있게 해주는 최초의 model입니다.
Reasoning Latency: thinking 모드를 활성화하면 model이 응답하는 데 걸리는 시간이 크게 증가합니다.
최고의 코딩 Agent: SWE-bench Verified에서 프로덕션 이슈 해결 점수 62.1%를 기록한 최상위 성능의 model입니다.
Thinking 비용: 내부 reasoning token은 100만 token당 15달러의 출력 요율로 청구되므로 긴 task 수행 시 비용이 누적될 수 있습니다.
압도적인 출력 용량: 단일 응답에서 최대 128,000 token을 생성하여 대규모 코드 및 문서 생성을 원활하게 합니다.
비디오 지원 불가: 일부 경쟁사와 달리 API를 통해 원시 비디오 파일을 직접 입력하거나 분석할 수 없습니다.
투명한 논리: 외부화된 chain-of-thought를 통해 사용자가 model의 내부 reasoning 과정을 감사하고 디버깅할 수 있습니다.
지식 컷오프: 학습 데이터가 2024년 10월까지로 제한되어 있어 최근 산업 발전 사항은 반영되지 않았습니다.

API 빠른 시작

anthropic/claude-3-7-sonnet

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyze this architectural flaw..." }],
});

console.log(message.content);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude 3.7 Sonnet에 대한 사람들의 의견

커뮤니티가 Claude 3.7 Sonnet에 대해 어떻게 생각하는지 확인하세요

Claude Code와 3.7 Sonnet의 조합은 터미널에 주니어 개발자를 한 명 더 둔 것과 다름없습니다. agentic AI가 실제로 체감된 것은 이번이 처음입니다.
dev_guru_99
reddit
하이브리드 reasoning은 대규모 업데이트입니다. 항상 30초 동안 고민할 필요는 없지만, 디버깅할 때는 정말 놀라운 성능을 보여줍니다.
TechLead_X
twitter
Anthropic은 일상적인 대화에서도 유용하면서 수학 문제에서는 o1과 경쟁할 수 있는 model을 만들어냈습니다.
logic_fanatic
hackernews
Claude는 인용문이 포함된 포괄적이고 아름답게 서식화된 보고서를 5분 안에 작성합니다.
ThinkingDeeplyAI_mod
reddit
128k 출력 제한은 숨겨진 보석 같은 기능입니다. 긴 스크립트 작성 중간에 끊기지 않는 model을 드디어 만났습니다.
code_monk_42
reddit
Claude 3.7 + MCP는 지금 현존하는 Jarvis와 가장 유사합니다. 로컬 도구들을 실제로 올바르게 사용합니다.
julie_codes_it
twitter

Claude 3.7 Sonnet에 대한 동영상

Claude 3.7 Sonnet에 대한 튜토리얼, 리뷰 및 토론 시청

Claude 3.7은 정말 최고입니다. 새로운 기본 model은 스스로를 뛰어넘어 프로그래밍 능력이 더욱 향상되었습니다.

새로운 3.7 model은 OpenAI o3 mini를 포함한 모든 다른 model을 압도했습니다.

GitHub 이슈의 70%를 해결할 수 있습니다.

확장된 thinking 기능을 통해 model이 코드를 출력하기 전에 문제를 깊이 고민할 수 있습니다.

개발자 경험 측면에서 엄청난 승리입니다.

챗봇은 조언을 주지만, Claude Code는 행동을 취합니다. 파일을 생성하고 웹사이트를 구축하며 패키지를 설치할 수 있습니다.

확장된 thinking이란 Claude가 실제로 행동을 취하기 전에 논리적으로 추론하는 과정을 말합니다.

이 도구는 터미널 환경에 최적화되어 있습니다.

MCP 연결성이야말로 이 도구를 기존 ChatGPT와 차별화하는 핵심입니다.

model은 모호한 터미널 명령어 뒤에 숨겨진 의도까지 이해합니다.

Claude Code를 통한 터미널 통합은 우리가 지금까지 보지 못한 수준의 agentic 능력을 보여줍니다.

Claude 3.7 Sonnet이 사고 과정을 보여주는 능력은 경쟁사보다 훨씬 투명합니다.

SWE-bench Verified에서 놀라운 62%를 기록했습니다.

하이브리드 reasoning 덕분에 필요하지 않을 때는 latency 페널티를 지불할 필요가 없습니다.

이전 Claude model들의 고품질 작문 스타일을 그대로 유지하고 있습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Claude 3.7 Sonnet 프로 팁

Claude 3.7 Sonnet을 최대한 활용하기 위한 전문가 팁.

Reasoning 예산 설정

API thinking 매개변수를 사용하여 비용을 관리하기 위해 reasoning token 수를 제한하십시오.

사고 과정(Thought Blocks) 검토

응답 내의 내부 chain-of-thought를 확인하여 복잡한 답변의 논리를 검증하십시오.

MCP 커넥터 사용

실시간 프로젝트 context를 위해 model을 로컬 데이터베이스 및 클라우드 스토리지에 연결하십시오.

Context 새로고침

긴 agentic 루프에서 요약 명령을 사용하여 context window가 관련 데이터에 집중되도록 유지하십시오.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Claude 3.7 Sonnet에 대한 자주 묻는 질문

Claude 3.7 Sonnet에 대한 일반적인 질문에 대한 답변 찾기