anthropic

Claude Sonnet 4.5

Anthropic의 Claude Sonnet 4.5는 세계 최고 수준의 코딩 성능(SWE-bench 77.2%)과 200K context window를 제공하며, 차세대 자율 agent를 위해 최적화되었습니다.

AI 코딩Agentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude2025년 9월 29일
컨텍스트
200K토큰
최대 출력
64K토큰
입력 가격
$3.00/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
83%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude Sonnet 4.5이 이 벤치마크에서 83%점을 기록했습니다.
HLE
34%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 34%점을 기록했습니다.
MMLU
89%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 89%점을 기록했습니다.
MMLU Pro
78%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude Sonnet 4.5이 이 벤치마크에서 78%점을 기록했습니다.
SimpleQA
52%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 52%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude Sonnet 4.5이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
87%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude Sonnet 4.5이 이 벤치마크에서 87%점을 기록했습니다.
MATH
87%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 87%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude Sonnet 4.5이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude Sonnet 4.5이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
72%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 72%점을 기록했습니다.
SWE-Bench
77%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude Sonnet 4.5이 이 벤치마크에서 77%점을 기록했습니다.
HumanEval
94%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude Sonnet 4.5이 이 벤치마크에서 94%점을 기록했습니다.
LiveCodeBench
68%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 68%점을 기록했습니다.
MMMU
78%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 78%점을 기록했습니다.
MMMU Pro
55%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude Sonnet 4.5이 이 벤치마크에서 55%점을 기록했습니다.
ChartQA
89%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 89%점을 기록했습니다.
DocVQA
92%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude Sonnet 4.5이 이 벤치마크에서 92%점을 기록했습니다.
Terminal-Bench
50%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 50%점을 기록했습니다.
ARC-AGI
14%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude Sonnet 4.5이 이 벤치마크에서 14%점을 기록했습니다.

Claude Sonnet 4.5 소개

Claude Sonnet 4.5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

**Agentic 지능의 최전선**

Claude 4.5 Sonnet은 자율 AI agent 시대를 위해 최적화된 frontier 지능의 주요 진전을 보여줍니다. 2025년 하반기에 출시된 이 모델은 일상적인 작업을 위한 고속 실행 모드와 복잡한 논리적 도전을 위한 Extended Thinking 모드 사이를 전환할 수 있는 hybrid reasoning 모델입니다. 이 모델은 computer use 및 도구 오케스트레이션 benchmark를 선도하며, 터미널 기반 agent 및 다중 파일 소프트웨어 엔지니어를 위한 엔진으로 선호되고 있습니다.

**정밀도와 환각 현상의 감소**

모델 아키텍처는 논리와 정밀도를 최우선으로 하여, 이전 시리즈에서 관찰되었던 아첨(sycophancy)과 환각 현상을 줄였습니다. 64,000 token의 출력 제한200,000 token의 입력 window를 통해 전체 저장소를 처리하고 한 번에 완전한 애플리케이션 파일을 생성할 수 있습니다. 또한, agentic 워크플로우를 위한 기본 체크포인트를 도입하여 시스템이 인간의 개입 없이 자율적으로 실수를 되돌리고 수정할 수 있게 합니다.

**Multimodal 및 Reasoning 역량**

소프트웨어 개발 외에도 Sonnet 4.5는 multimodal 문서 분석과 금융 모델링에 뛰어납니다. 내부 논리는 아키텍처 context를 우선순위에 두어, 이전 모델보다 대규모 시스템을 더 효과적으로 매핑합니다. 손글씨 노트를 처리하거나 API 통합을 구현하는 등, 장기 프로젝트 전반에 걸쳐 높은 사실 정확도와 엄격한 지시 이행 능력을 유지합니다.

Claude Sonnet 4.5

Claude Sonnet 4.5 사용 사례

Claude Sonnet 4.5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

터미널 인터페이스를 사용하여 초기 요구사항부터 자동 커밋까지 전반적인 개발 과정을 관리합니다.

GUI 기반 자동화

기본적인 computer use 기능을 사용하여 웹 브라우징과 기존 애플리케이션의 데이터 입력을 자동화합니다.

Multi-Agent 오케스트레이션

중앙 계획 루프 내에서 리뷰어, 빌더와 같은 하위 agent에게 전문적인 작업을 위임합니다.

복잡한 코드 리팩토링

200,000 token의 활성 context 내에서 일관성을 유지하며 다중 파일 코드베이스를 재설계합니다.

정교한 금융 분석

비전 기능을 사용하여 분기별 보고서와 스프레드시트를 분석하고, 불일치 항목과 투자 인사이트를 찾아냅니다.

인터랙티브 데이터 시각화

내장된 코드 실행과 실시간 빌딩 기능을 사용하여 복잡한 데이터셋으로부터 동적 차트를 생성합니다.

강점

제한

네이티브 Computer Use: 커서 이동 및 GUI 조작을 통해 61.4%의 정확도로 운영 체제와 상호작용합니다.
네이티브 오디오 입력 미지원: 음성 파일을 직접 처리할 수 없으며 별도의 전사 도구가 필요합니다.
최고 수준의 코딩 성능: SWE-bench Verified에서 77.2%를 달성하여 GitHub 이슈 해결 능력에서 모든 모델을 앞서고 있습니다.
Reasoning token 비용: 내부적인 Extended Thinking 과정에서 사용되는 token은 출력 token으로 과금되어 복잡한 쿼리 시 비용이 증가합니다.
30시간 작업 지속성: 아키텍처 덕분에 상태와 집중력을 유지하며 30시간 동안 연속적인 자율 작업이 가능합니다.
Thinking 모드의 Latency: Extended Thinking 활성화 시, 복잡한 아키텍처 계획을 처리하는 데 수 분이 소요될 수 있습니다.
64K 출력 제한: 방대한 출력 용량으로 단일 API 호출만으로 전체 애플리케이션 아키텍처를 생성할 수 있습니다.
경쟁적 수학 문제의 편차: 코딩 분야에서는 선두를 달리고 있으나, 특정 프로그래밍 대회 benchmark에서는 전문 reasoning 모델보다 뒤처지기도 합니다.

API 빠른 시작

anthropic/claude-4-5-sonnet

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude Sonnet 4.5에 대한 사람들의 의견

커뮤니티가 Claude Sonnet 4.5에 대해 어떻게 생각하는지 확인하세요

Claude 4.5 Sonnet을 오늘 어디서나 사용할 수 있습니다. 세계 최고의 코딩 모델입니다.
ClaudeOfficial
reddit
이 기능은 MCP 설정의 가장 고통스러운 확장 문제 중 하나를 해결합니다. 실제 작업을 시작하기도 전에 context가 증발하는 것을 지켜보곤 했습니다.
Simon Willison
twitter
Claude Code-Sonnet 4.5는 복잡한 Docker 기반 리팩토링 작업에서 Gemini 3.0 Pro를 크게 앞섭니다.
Comfortable-Friend96
reddit
패턴: 실수는 문서화가 됩니다. CLAUDE.md에 규칙을 추가하면 같은 실수가 다시는 반복되지 않습니다.
Boris Cherny
twitter
Hybrid reasoning 모드는 일반 모델이 반복 루프에 빠지는 복잡한 비동기 로직 디버깅에 큰 도움이 됩니다.
AsyncDev
hackernews
3.5 Sonnet과 동일한 가격 정책 덕분에 모든 프로덕션 agent 파이프라인에서 쉽게 업그레이드할 수 있습니다.
StartupFounder2025
reddit

Claude Sonnet 4.5에 대한 동영상

Claude Sonnet 4.5에 대한 튜토리얼, 리뷰 및 토론 시청

이 새로운 4.5 Sonnet 모델은 Swaybench verified 테스트에서 Opus 4.1을 능가합니다

복잡한 다단계 작업에서 30시간 이상 집중력을 유지할 수 있었습니다

61.4%의 점수로 OS world computer use benchmark에서 선두를 차지했습니다

내부 reasoning 엔진은 3.5 버전보다 Python 환경을 훨씬 더 안정적으로 처리합니다

터미널 통합 기능이 훨씬 긴밀해져, 환각적인 셸 명령어가 거의 없습니다

Sonnet 4.5는 이제 agentic tool 사용에서 선두를 달리고 있으며... 20%의 점프는 매우 고무적입니다

Sonnet 4.5를 탑재한 Claude Code는 전체 Stripe 구현을 15분 만에 완료했습니다

Claude Sonnet 4.5는 훨씬 빠르고 성능 또한 상당히 개선되었습니다

Thinking 토글을 사용하면 특정 코드 블록에 더 많은 컴퓨팅 자원을 투입할 수 있습니다

대규모 프로젝트에서 150,000 token 깊이로 들어가도 context를 완벽하게 유지합니다

컴퓨터를 제어할 때 역대 최고의 성능을 보여주는 모델입니다

코딩 오류율이 9%에서 사실상 0으로 감소했습니다

Claude imagine은 가장 멋진 기능일 수 있습니다... 실시간 앱 빌딩 경험을 제공합니다

MCP 통합을 통해 prompt context를 낭비하지 않고도 도구를 검색할 수 있습니다

복잡한 UI 레이아웃 분석 시 비전 latency가 현저히 감소했습니다

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Claude Sonnet 4.5 프로 팁

Claude Sonnet 4.5을 최대한 활용하기 위한 전문가 팁.

MCP Tool Search 활성화

Model Context Protocol Tool Search를 사용하여 context 사용량을 85% 줄이고 활성 파일을 위한 공간을 확보하세요.

Agentic 체크포인트 활용

터미널 인터페이스에서 /checkpoint 명령어를 사용하여 대규모 리팩토링 전 작업 상황을 저장하고 즉시 롤백하세요.

Context 예산 관리

관련 없는 작업 사이에는 기록을 지워 context 오염을 방지하고 높은 논리적 정확도를 유지하세요.

System Prompt 계층 구조

모델 페르소나와 엄격한 출력 제약 조건을 별도의 설정 파일에 정의하여 agent 간 일관성을 유지하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Claude Sonnet 4.5에 대한 자주 묻는 질문

Claude Sonnet 4.5에 대한 일반적인 질문에 대한 답변 찾기

Claude 4.5 Sonnet: 30시간의 집중력을 갖춘 최고의 Agentic AI