anthropic

Claude Sonnet 4.5

Anthropic의 Claude Sonnet 4.5는 세계 최고 수준의 코딩 성능(SWE-bench 77.2%)과 200K context window를 제공하며, 차세대 autonomous agents에 최적화되어 있습니다.

AI CodingAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 42025년 9월 29일
컨텍스트
200K토큰
최대 출력
64K토큰
입력 가격
$3.00/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
83%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude Sonnet 4.5이 이 벤치마크에서 83%점을 기록했습니다.
HLE
34%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 34%점을 기록했습니다.
MMLU
89%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 89%점을 기록했습니다.
MMLU Pro
78%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude Sonnet 4.5이 이 벤치마크에서 78%점을 기록했습니다.
SimpleQA
52%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 52%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude Sonnet 4.5이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
87%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude Sonnet 4.5이 이 벤치마크에서 87%점을 기록했습니다.
MATH
87%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 87%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude Sonnet 4.5이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude Sonnet 4.5이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
72%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 72%점을 기록했습니다.
SWE-Bench
77%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude Sonnet 4.5이 이 벤치마크에서 77%점을 기록했습니다.
HumanEval
94%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude Sonnet 4.5이 이 벤치마크에서 94%점을 기록했습니다.
LiveCodeBench
68%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 68%점을 기록했습니다.
MMMU
78%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 78%점을 기록했습니다.
MMMU Pro
55%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude Sonnet 4.5이 이 벤치마크에서 55%점을 기록했습니다.
ChartQA
89%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 89%점을 기록했습니다.
DocVQA
92%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 92%점을 기록했습니다.
Terminal-Bench
50%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 50%점을 기록했습니다.
ARC-AGI
14%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 14%점을 기록했습니다.

Claude Sonnet 4.5 무료 체험

Claude Sonnet 4.5과 무료로 채팅하세요. 기능을 테스트하고, 질문하고, 이 AI 모델이 할 수 있는 것을 탐색하세요.

프롬프트
응답
Claude Sonnet 4.5

AI 응답이 여기에 표시됩니다

Claude Sonnet 4.5 소개

Claude Sonnet 4.5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

**Agentic Intelligence의 최전선**

Claude Sonnet 4.5는 Anthropic의 'frontier intelligence'에서 가장 중요한 도약을 의미하며, 특히 autonomous AI agents 시대에 최적화되었습니다. 2025년 하반기에 출시된 이 모델은 업계 최초의 진정한 'hybrid reasoning' 모델로, 개발자가 루틴한 작업을 위한 고속 실행 모드와 복잡한 논리적 도전을 위한 extended thinking 모드 사이를 자유롭게 전환할 수 있게 해줍니다. 특히 computer use 및 도구 오케스트레이션 분야에서 이전 benchmark를 압도하며, 터미널 기반 agent 및 다중 파일 소프트웨어 엔지니어링을 위한 선호 엔진으로 자리 잡았습니다.

**정밀도 향상 및 할루시네이션 감소**

이 모델은 '두 번 측정하고 한 번 자르기(measure twice, cut once)' 원칙을 우선시하는 아키텍처를 기반으로 설계되어, 3.5 시리즈에서 나타났던 sycophancy 및 할루시네이션 현상을 유의미하게 줄였습니다. 64,000 token output limit200,000 token input window를 통해 전체 repository를 분석하면서 동시에 완성된 형태의 애플리케이션 파일을 한 번에 생성할 수 있습니다. 또한 agentic 워크플로우를 위한 네이티브 'checkpoints' 기능을 도입하여, agent가 스스로의 실수를 자율적으로 파악하고 수정할 수 있도록 지원합니다.

**Multimodal 및 Reasoning 역량**

코딩 성능을 넘어, Sonnet 4.5는 multimodal 문서 분석 및 복잡한 금융 모델링에서도 독보적인 위치를 차지합니다. 내부 로직은 아키텍처 컨텍스트를 우선하도록 훈련되어 대규모 codebase를 그 어떤 전작보다 정교하게 매핑할 수 있습니다. 수기 메모를 처리하든 전체 Stripe 결제 연동을 구현하든, Sonnet 4.5는 매우 높은 수준의 사실적 정확도와 지시 이행 능력을 유지합니다.

Claude Sonnet 4.5

Claude Sonnet 4.5 사용 사례

Claude Sonnet 4.5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

Claude Sonnet 4.5를 사용하여 복잡한 codebase를 탐색하고, 여러 파일에 걸쳐 기능을 구현하며, 독립적으로 테스트를 실행할 수 있습니다.

Computer-Use 에이전트

모델을 배포하여 데스크톱 및 웹 브라우저를 제어함으로써 데이터 추출, 레거시 시스템 탐색 또는 반복적인 행정 업무를 수행합니다.

기업용 Agentic Search

다단계 검색 쿼리를 오케스트레이션하고 내부 문서와 실시간 웹의 이질적인 정보를 종합합니다.

복잡한 금융 모델링

87%에 달하는 AIME 점수를 바탕으로 재무 보고서 및 시장 데이터에 대한 심도 있는 논리적 추론을 수행합니다.

기술 콘텐츠 정제

상위 수준의 요구사항을 전문적인 PRD, 기술 사양서 및 즉시 복사하여 사용할 수 있는 codebase로 변환합니다.

Multimodal 문서 분석

state-of-the-art 비전 역량을 통해 차트, 수기 메모, 기술 도면이 포함된 수천 페이지의 문서를 처리합니다.

강점

제한

Agentic 코딩 파워: 실제 GitHub 이슈 해결 능력을 측정하는 SWE-bench Verified에서 77.2%의 성공률로 세계 기록을 보유하고 있습니다.
사용량 제한: Pro 플랜($20/월) 이용 시 주간 사용량 제한에 빠르게 도달한다는 사용자 보고가 많습니다.
압도적인 속도: 초당 40-60 token을 생성하여, 이전의 frontier model들보다 인터랙티브한 사용 환경에서 확연히 빠른 속도를 보여줍니다.
검색 Latency: 에이전틱 웹 브라우징(BrowseComp) 성능은 전문 검색 모델과 비교했을 때 여전히 개선의 여지가 있습니다.
Hybrid Reasoning 유연성: 복잡한 논리 체인을 위한 'extended thinking'과 '빠른 채팅' 모드 사이의 균형을 효과적으로 맞춘 첫 번째 모델입니다.
특정 분야 지식 공백: 특정 스케이트보드 기술 식별(SkateBench 정확도 29%)과 같이 매우 전문적인 시각적 작업에서는 어려움을 겪습니다.
방대한 출력 윈도우: 64K의 출력 token 제한을 통해 단 한 번의 API 호출로 여러 파일에 걸친 전체 기능을 생성할 수 있습니다.
Agentic 비용: 터미널 모드에서 자율적으로 모델을 실행할 경우, 복잡한 앱 구축 세션 한 번에 $50-$100 상당의 token 비용이 발생할 수 있습니다.

API 빠른 시작

anthropic/claude-sonnet-4.5

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude Sonnet 4.5에 대한 사람들의 의견

커뮤니티가 Claude Sonnet 4.5에 대해 어떻게 생각하는지 확인하세요

"Claude Sonnet 4.5는 AI 코딩의 새로운 왕입니다... 정말, 정말 성능이 좋아 보이네요"
James Montemagno
youtube
"Sonnet 4.5는 정말 일을 잘합니다... 훨씬 빠르고 성능도 상당히 개선되었습니다"
Cole Medin
youtube
"Sonnet 4.5에 완전히 매료되었습니다... 정말 멋진 페이지들을 디자인하고 있네요"
Savage Reviews
youtube
"터미널 기반 agent는 마치 '터미널 안에 상주하는 개발자' 같습니다... 스스로 codebase를 읽고 테스트를 실행할 수 있습니다"
DevUser_99
reddit
"가격은 3.5와 동일하지만, 'Checkpoints' 기능 덕분에 전문적인 워크플로우에서의 가치는 10배 더 높아졌습니다"
AgentArchitect
x
"SWE-bench에서 77.2%를 기록한 이 모델은 실제로 시니어 엔지니어처럼 느껴지는 최초의 모델입니다"
HackerNewsReader
hackernews

Claude Sonnet 4.5에 대한 동영상

Claude Sonnet 4.5에 대한 튜토리얼, 리뷰 및 토론 시청

Anthropic은 이 모델이 reasoning, 수학, computer use 능력이 대폭 향상된 '세계 최고의 코딩 모델'이라고 주장합니다.

GPT-5가 고차원적인 계획 수립에 더 좋을 수 있지만, 구현 작업에 있어서는 현재 Claude 4.5 Sonnet이 가장 사용하기 '쾌적한' 모델입니다.

속도가 정말 놀랍습니다. 인터랙티브한 코딩 경험이 훨씬 더 매끄럽게 느껴집니다.

이전에는 볼 수 없었던 수준의 정밀함으로 다중 파일 수정을 처리합니다.

할루시네이션의 감소로 인해 프로덕션 코드를 작성할 때 신뢰할 수 있는 파트너가 되었습니다.

Claude Sonnet 4.5는 GPT-5 Codex보다 훨씬 빠르고 상당히 더 뛰어난 성능을 보여주었습니다.

Stripe 연동 전체 과정을 15분 만에 끝냈습니다... 이는 Opus 4.1보다 두 배 이상 빠른 속도입니다.

복잡한 tool-calling 지시를 따르는 능력이 이 모델의 핵심 비결입니다.

모델이 사용자의 잘못된 의견에 무조건 동의하는 '아첨(sycophancy)' 문제가 줄어든 것이 보입니다.

터미널 기반 agent를 감독 없이 실행해도 되겠다고 신뢰할 수 있는 첫 번째 모델입니다.

프롬프트 하나로 만들어진 랜딩 페이지 중 역대 최고라고 할 수 있을 정도로 훌륭합니다.

정말 압도적입니다... 아주 멋진 디자인과 훌륭한 코드로 페이지를 설계하고 있습니다.

UI 디자인을 해석하는 비전 능력이 크게 업그레이드되었습니다.

기술적인 요구사항뿐만 아니라 미적인 요구사항까지 이해하고 있는 것처럼 느껴집니다.

Sonnet 4.5는 공식적으로 창의적인 프론트엔드 엔지니어링의 새로운 benchmark가 되었습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로
데모 영상 보기

전문가 팁

이 모델을 최대한 활용하고 더 나은 결과를 얻기 위한 전문가 팁.

CLAUDE.md 활용

repository 루트에 CLAUDE.md 파일을 생성하여 모델에게 짧은 요약과 가이드라인을 제공하세요. 이를 통해 token 낭비를 30% 줄일 수 있습니다.

Hybrid Reasoning 토글

루틴한 작업에서는 latency와 비용을 절약하고, 논리 집약적인 작업에서만 API 호출 시 'thinking' parameter를 활성화하세요.

.claude/context 폴더 활용

아키텍처 결정 사항을 저장하기 위해 .claude/context.md 파일을 만드세요. 이 모델은 codebase 매핑 시 해당 경로를 우선하도록 특별히 훈련되었습니다.

Prompt Caching

정적 문서나 대규모 codebase에 대해 prompt caching을 활성화하면 반복적인 쿼리에 대한 input 비용을 최대 90%까지 절감할 수 있습니다.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

자주 묻는 질문

이 모델에 대한 일반적인 질문의 답변 찾기