anthropic

Claude Opus 4.5

Claude Opus 4.5는 Anthropic의 가장 강력한 frontier model로, 역대 최고인 80.9%의 SWE-bench 성능과 코딩을 위한 고도의 자율적인 agentic 기능을 제공합니다.

anthropic logoanthropicClaude2025년 11월 24일
컨텍스트
200K토큰
최대 출력
64K토큰
입력 가격
$5.00/ 1M
출력 가격
$25.00/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
87%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude Opus 4.5이 이 벤치마크에서 87%점을 기록했습니다.
MMLU
90.8%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude Opus 4.5이 이 벤치마크에서 90.8%점을 기록했습니다.
MMLU Pro
80%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude Opus 4.5이 이 벤치마크에서 80%점을 기록했습니다.
IFEval
90%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude Opus 4.5이 이 벤치마크에서 90%점을 기록했습니다.
AIME 2025
37%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude Opus 4.5이 이 벤치마크에서 37%점을 기록했습니다.
MATH
85%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude Opus 4.5이 이 벤치마크에서 85%점을 기록했습니다.
GSM8k
95%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude Opus 4.5이 이 벤치마크에서 95%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude Opus 4.5이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
72%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude Opus 4.5이 이 벤치마크에서 72%점을 기록했습니다.
SWE-Bench
80.9%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude Opus 4.5이 이 벤치마크에서 80.9%점을 기록했습니다.
HumanEval
90%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude Opus 4.5이 이 벤치마크에서 90%점을 기록했습니다.
LiveCodeBench
75%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude Opus 4.5이 이 벤치마크에서 75%점을 기록했습니다.
MMMU
80.7%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude Opus 4.5이 이 벤치마크에서 80.7%점을 기록했습니다.
MMMU Pro
60%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude Opus 4.5이 이 벤치마크에서 60%점을 기록했습니다.
ChartQA
90%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude Opus 4.5이 이 벤치마크에서 90%점을 기록했습니다.
DocVQA
94%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude Opus 4.5이 이 벤치마크에서 94%점을 기록했습니다.
Terminal-Bench
59.3%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude Opus 4.5이 이 벤치마크에서 59.3%점을 기록했습니다.
ARC-AGI
37.6%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude Opus 4.5이 이 벤치마크에서 37.6%점을 기록했습니다.

Claude Opus 4.5 소개

Claude Opus 4.5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

자율 Agency의 정점

Claude Opus 4.5는 Anthropic의 frontier 지능에서 가장 중요한 도약을 의미하며, 특히 소프트웨어 엔지니어링 및 자율 운영의 가장 복잡한 작업을 위해 설계되었습니다. 2025년 말에 출시된 이 model은 SWE-bench Verified benchmark에서 80.9%의 점수로 기록을 경신하며, 인간의 개입을 최소화하면서 대규모 디버깅 및 시스템 리팩토링을 효과적으로 자동화한 최초의 model이 되었습니다.

영혼이 있는 지능

기술적 기량을 넘어, Opus 4.5는 Anthropic의 "soul document"에 따라 정제된 페르소나를 도입하여 외교적인 정직함과 미묘한 도움을 강조합니다. 이 덕분에 model은 문학적 취향과 인간 중심의 디자인을 이해하는 독보적인 능력을 갖추게 되었습니다. 또한 200,000-token context window와 개발자가 연산 비용에 맞춰 reasoning depth를 조절할 수 있는 특화된 "effort parameter"를 갖추고 있어 agentic workflows에 최적화되어 있습니다.

탁월한 Multimodal 성능

multimodal 강자로서 Opus 4.5는 조밀한 아키텍처 다이어그램 분석부터 복잡한 문서 레이아웃의 데이터 추출에 이르기까지 vision 기반 작업에서 탁월한 성능을 발휘합니다. Claude Code를 통해 터미널 네이티브 환경을 탐색하는 능력은 시스템 전반의 감사 및 보안 패치를 수행할 수 있게 하며, 전문 엔지니어링 팀을 위한 지속적이고 유능한 파트너로서의 입지를 굳건히 합니다.

Claude Opus 4.5

Claude Opus 4.5 사용 사례

Claude Opus 4.5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 엔지니어링

재현, 디버깅, 테스트를 포함한 GitHub 이슈의 전체 수명 주기를 자동화합니다.

시스템 관리

직접적인 터미널 상호작용을 통해 자율적인 서버 감사 및 보안 패치를 수행합니다.

아키텍처 리팩토링

대규모 리포지토리를 분석하여 시스템 전반의 보안 강화 방안을 제안하고 구현합니다.

복잡한 문서 합성

수백 페이지의 PDF를 구조화된 금융 모델이나 데이터 시각화 자료로 변환합니다.

창의적 게임 개발

단일 prompt만으로 물리 엔진이 작동하는 기능적인 3D 환경을 생성합니다.

지속형 리서치 어시스턴트

방대한 데이터셋을 교차 참조하여 법률 또는 기술 문서에서 명확하지 않은 모순점을 찾아냅니다.

강점

제한

기록적인 코딩 성능: SWE-bench Verified에서 80.9%를 기록하며 복잡한 소프트웨어 엔지니어링 과제를 자동화합니다.
프리미엄 가격 모델: 100만 tokens당 $5/$25로, 중급 model들에 비해 비용이 상당히 높습니다.
우수한 Token 효율성: 유사한 로직 수행 시 Sonnet 대비 최대 76% 적은 tokens를 사용하면서도 frontier 지능을 구현합니다.
수학 Benchmark 격차: AIME 테스트와 같은 경진대회 수준의 수학 분야에서는 전문 reasoning model들에 비해 뒤처집니다.
거대한 200K Context: 대규모 문서 세트와 리포지토리를 높은 retrieval 정확도로 처리합니다.
기본 오디오/비디오 미지원: 현재 전처리 없이는 오디오나 비디오 스트림을 직접 처리하는 기능이 부족합니다.
자율 Agent 로직: 터미널 네이티브 도구와 stop hooks를 통해 장시간 실행되는 자율 세션에 최적화되어 있습니다.
높은 실행 Latency: 깊은 reasoning 작업은 상당한 시간이 소요될 수 있으며, agent 사용 시 몇 시간의 세션이 필요할 수도 있습니다.

API 빠른 시작

anthropic/claude-4.5-opus

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude Opus 4.5에 대한 사람들의 의견

커뮤니티가 Claude Opus 4.5에 대해 어떻게 생각하는지 확인하세요

"제 프로덕션 코드의 모든 라인은 Opus 4.5에서 실행되는 Claude Code가 생성했습니다."
Boris Cherny
x
"Opus 4.5는 문학적 취향과 인간처럼 들리는 방식에 대해 고민해야 할 수준에 도달했습니다."
Nate B Jones
youtube
"지능이 드디어 저렴해지고 있습니다. 이 model은 이전 Opus보다 3배나 저렴합니다."
BuildwithVignesh
reddit
"Claude Opus 4.5는 너무 영리하게 허점을 이용하는 바람에 benchmark 하나를 망가뜨려 버렸습니다."
MetaKnowing
reddit
"reasoning depth와 코딩 능력은 다른 어떤 것과 비교해도 차원이 다릅니다."
Santosh Gupta
x
"Claude Code를 통한 터미널 상의 agentic 기능은 데브옵스 분야에서 압도적입니다."
hn_user_alpha
hackernews

Claude Opus 4.5에 대한 동영상

Claude Opus 4.5에 대한 튜토리얼, 리뷰 및 토론 시청

가격이 3배 더 저렴해졌습니다... 100만 input tokens당 $5입니다.

이 단일 prompt 마인크래프트 테스트에서 model로부터 받은 결과 중 최고입니다.

Opus 4.5는 이 과제 전형에서 그 어떤 인간 지원자보다 높은 점수를 기록했습니다.

여기서의 reasoning은 단순히 지시를 따르는 것이 아니라, 의도를 파악하는 것입니다.

복잡한 아키텍처 작업을 수행한다면, 이를 안정적으로 처리할 수 있는 유일한 model입니다.

SWE-bench verified 80.9% 달성... 그러면서도 Sonnet보다 tokens를 50% 적게 사용합니다.

Opus 4.5는 취미로 코딩하는 사람이 아닌, 전문 소프트웨어 엔지니어링을 정조준하고 있습니다.

SWE-bench 외에도 Terminal Bench에서 Sonnet 대비 15%의 향상을 보여줍니다.

이 model은 몇 시간 동안 지속되는 장시간 자율 세션이 가능합니다.

밀집된 기술 다이어그램을 분석할 때 vision 성능이 눈에 띄게 상세해졌습니다.

Claude Opus 4.5를 설득의 레이어이자 완벽한 agentic 괴물이라고 생각하세요.

많은 엔지니어들이 사용성(ergonomics)과 harness 때문에 결국 Opus 4.5를 선호하게 됩니다.

이 model은 문맥 밖에서도 자신의 soul spec을 인지하고 있습니다.

Opus 4.5는 GPT-5.2가 놓치고 있는 수준 높은 문학적 취향을 보여줍니다.

작업에 따라 지능을 확장하기 위해 동적인 effort parameter를 사용합니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로
데모 영상 보기

Claude Opus 4.5 프로 팁

Claude Opus 4.5을 최대한 활용하기 위한 전문가 팁.

로직 작업 시 High Effort 사용

복잡한 아키텍처 작업 시 'effort' parameter를 'high'로 설정하여 최대 reasoning depth를 확보하세요.

Stop Hooks 배포

agentic workflows에서 전문화된 stop hooks를 활용하여 model이 몇 시간 동안 스스로 실행되고 오류를 수정할 수 있도록 하세요.

Claude Code 활용

model을 Claude Code CLI 도구와 결합하여 터미널 네이티브 시스템 작업의 잠재력을 최대한 끌어올리세요.

Token 사용 최적화

Opus 4.5는 Sonnet보다 최대 76% 적은 tokens로 동등한 품질의 로직을 생성하므로, 고도의 reasoning이 필요한 작업에 집중적으로 사용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Claude Opus 4.5에 대한 자주 묻는 질문

Claude Opus 4.5에 대한 일반적인 질문에 대한 답변 찾기