anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6은 100만 tokens당 단 3달러의 비용으로 코딩 및 Computer Use를 위한 프런티어급 성능과 거대한 1M token context window를 제공합니다.

에이전트 AI멀티모달코딩컴퓨터 사용롱 컨텍스트
anthropic logoanthropicClaude2026년 2월 17일
컨텍스트
1.0M토큰
최대 출력
64K토큰
입력 가격
$3.00/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
89.9%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Claude Sonnet 4.6이 이 벤치마크에서 89.9%점을 기록했습니다.
HLE
49%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 49%점을 기록했습니다.
MMLU
89.3%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Claude Sonnet 4.6이 이 벤치마크에서 89.3%점을 기록했습니다.
MMLU Pro
79.2%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Claude Sonnet 4.6이 이 벤치마크에서 79.2%점을 기록했습니다.
SimpleQA
48.5%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 48.5%점을 기록했습니다.
IFEval
89.5%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Claude Sonnet 4.6이 이 벤치마크에서 89.5%점을 기록했습니다.
AIME 2025
83%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Claude Sonnet 4.6이 이 벤치마크에서 83%점을 기록했습니다.
MATH
85.3%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Claude Sonnet 4.6이 이 벤치마크에서 85.3%점을 기록했습니다.
GSM8k
96.4%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Claude Sonnet 4.6이 이 벤치마크에서 96.4%점을 기록했습니다.
MGSM
92.8%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Claude Sonnet 4.6이 이 벤치마크에서 92.8%점을 기록했습니다.
MathVista
68.7%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 68.7%점을 기록했습니다.
SWE-Bench
79.6%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Claude Sonnet 4.6이 이 벤치마크에서 79.6%점을 기록했습니다.
HumanEval
92.1%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Claude Sonnet 4.6이 이 벤치마크에서 92.1%점을 기록했습니다.
LiveCodeBench
72.4%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 72.4%점을 기록했습니다.
MMMU
74.2%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Claude Sonnet 4.6이 이 벤치마크에서 74.2%점을 기록했습니다.
MMMU Pro
75.6%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Claude Sonnet 4.6이 이 벤치마크에서 75.6%점을 기록했습니다.
ChartQA
88.1%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 88.1%점을 기록했습니다.
DocVQA
93.4%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Claude Sonnet 4.6이 이 벤치마크에서 93.4%점을 기록했습니다.
Terminal-Bench
59.1%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 59.1%점을 기록했습니다.
ARC-AGI
58.3%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Claude Sonnet 4.6이 이 벤치마크에서 58.3%점을 기록했습니다.

Claude Sonnet 4.6 소개

Claude Sonnet 4.6의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

지능의 세대적 도약

Claude Sonnet 4.6은 Anthropic이 지금까지 개발한 모델 중 가장 유능하고 다재다능한 model로, 복잡한 기업용 및 개발자 워크플로우를 위한 고성능 워크호스 역할을 수행하도록 설계되었습니다. 2026년 2월 17일에 출시된 이 모델은 4.5 시리즈를 뛰어넘는 중대한 세대적 도약을 보여주며, 베타 버전으로 제공되는 인간 수준의 Computer Use 능력과 거대한 100만 token context window를 도입했습니다. 이 model은 agentic 작업에 최적화되어 있어, 단순한 텍스트 처리를 넘어 다양한 소프트웨어 환경에서 다단계 작업을 자율적으로 계획하고 실행할 수 있습니다.

기술적 정교함과 멀티모달리티

기술적으로 Sonnet 4.6은 중급 모델의 속도와 Opus 클래스의 깊은 reasoning 사이의 간극을 메웁니다. 적응형 Thinking(Adaptive Thinking) 기능을 갖추어 작업의 복잡도에 따라 내부 reasoning 노력을 확장할 수 있습니다. 이 model은 이제 Claude 무료 및 Pro 사용자의 새로운 기본 모델이 되었으며, 코딩, 금융 분석, 문서 이해 분야에서 flagship급 지능을 제공합니다. 텍스트, 이미지, 오디오 및 비디오 입력을 지원하는 진정한 네이티브 multimodal로, 다양한 미디어 처리 작업을 state-of-the-art 수준의 정확도로 처리합니다.

AI 에이전트를 위한 새로운 업계 표준

압도적인 가성비를 자랑하는 Sonnet 4.6은 AI 에이전트의 주력 엔진으로 자리매김하고 있습니다. SWE-bench Verified(79.6%)OSWorld-Verified(72.5%)에서 업계 선도적인 점수를 획득하며, 실제 소프트웨어 엔지니어링 문제와 복잡한 운영 체제 작업을 수행하는 탁월한 능력을 입증했습니다. Opus에 근접한 지능을 훨씬 낮은 비용으로 제공함으로써, 개발자들이 이전에는 계산적 또는 경제적 비용 때문에 불가능했던 자율 시스템을 구축할 수 있도록 지원합니다.

Claude Sonnet 4.6

Claude Sonnet 4.6 사용 사례

Claude Sonnet 4.6을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

Claude Code를 사용하여 전체 레포지토리를 리팩토링하고 전체 컨텍스트를 파악한 상태에서 복잡한 기능을 구현합니다.

인간 수준의 Computer Use

화면을 보고 가상 마우스와 키보드로 상호작용하여 기존 소프트웨어 및 웹 워크플로우를 자동화합니다.

금융 문서 이해

수천 페이지의 공시 자료와 표를 분석하여 복잡한 투자 전략이나 리스크를 추론합니다.

실시간 비즈니스 시뮬레이션

model이 가상 비즈니스를 관리하고 수익성을 최적화하는 agentic 시뮬레이션을 실행합니다.

다국어 기술 문서 작성

완벽한 아키텍처 사양을 준수하면서 수십 개의 언어로 기술 문서를 생성합니다.

프론트엔드 UI/UX 생성

타이포그래피, 색상 이론, 반응형 레이아웃에 집중하여 세련되고 현대적인 대시보드 인터페이스를 제작합니다.

강점

제한

업계 선도적인 코딩 능력: SWE-bench Verified에서 state-of-the-art인 79.6%를 기록하며 실제 GitHub 이슈 해결 능력에서 경쟁 모델을 압도합니다.
Thinking 모드 시의 Latency: thinking token 예산을 높게 잡으면 첫 번째 token 생성 시간(time-to-first-token)이 길어져 실시간 채팅에는 부적합할 수 있습니다.
압도적인 가성비(Performance-to-Cost): Opus급의 지능을 5배 낮은 비용으로 제공하여 대규모 자동화를 위한 가장 경제적인 선택지입니다.
Rate Limiting 마찰: 무료 및 Pro 사용자는 집중적인 세션 동안 엄격한 메시지 제한에 걸릴 수 있어 API 전환이 필요할 수 있습니다.
인간 수준의 컴퓨터 내비게이션: OSWorld-Verified에서 72.5%를 기록하며 API 없이도 복잡한 소프트웨어를 조작하는 능력이 크게 향상되었습니다.
150k 이상에서의 컨텍스트 저하: 1M context window에도 불구하고, 매우 긴 prompt의 중간 부분에 있는 특정 세부 정보를 가끔 놓칠 수 있습니다.
적응형 Reasoning 파워: 확장 가능한 Thinking 모드를 통해 개발자가 어려운 논리 문제에 맞춰 reasoning 노력을 조절할 수 있습니다.
Prompt Injection 취약성: Computer Use 기능 사용 시, 악성 웹사이트가 model의 가상 브라우저 세션을 탈취하려 시도할 위험이 있습니다.

API 빠른 시작

anthropic/claude-sonnet-4-6

문서 보기
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Claude Sonnet 4.6에 대한 사람들의 의견

커뮤니티가 Claude Sonnet 4.6에 대해 어떻게 생각하는지 확인하세요

Claude Sonnet 4.6은 보험 benchmark에서 94%를 기록했습니다. 우리가 테스트한 computer use 모델 중 가장 뛰어난 성능입니다.
Swami Sivasubramanian
twitter
소문이 사실이네요. 단언컨대 제가 써본 LLM 중 최고이자 가장 재미있습니다! 지금까지 본 것들보다 한 수 위입니다.
WolframRavenwolf
reddit
Claude Sonnet 4.6은 단순히 '가끔 웃긴' 수준이 아니라 정말 유쾌합니다. 전반적으로 따뜻하고 정직하며 친사회적이에요.
Anton P.
twitter
코딩 작업에서 Sonnet 4.6은 Cline보다 훨씬 뛰어납니다. 이제 더 이상 파일을 직접 열어보지도 않아요.
semibaron
hackernews
1M context window는 코드베이스 마이그레이션의 판도를 바꿨습니다. 제 레거시 스택 전체를 그냥 업로드해버렸어요.
DevOpsDan
reddit
복잡한 스프레드시트와 웹 양식을 놀라울 정도로 정확하게 처리합니다. Computer Use 베타가 드디어 실전 투입 준비를 마쳤네요.
AI_Insights_Daily
youtube

Claude Sonnet 4.6에 대한 동영상

Claude Sonnet 4.6에 대한 튜토리얼, 리뷰 및 토론 시청

Sonnet 4.6은 실제 세계의 의미 있는 작업들을 측정하는 GDP val에서 더 높은 점수를 기록했습니다.

이제 이 모델들이 CBRN 관련 능력을 갖추었는지조차 파악하기 어려워지고 있습니다.

지능 대비 속도 비율은 시장의 그 어떤 다른 model과 비교해도 타의 추종을 불허합니다.

Anthropic은 이번 릴리스를 통해 확실히 에이전트 측면에 집중하고 있습니다.

이 비용 구조는 대량의 API를 사용하는 개발자들에게 새로운 표준이 될 것입니다.

이 model은 지난달의 opus 모델과 비교했을 때 약 두 배 정도 빠릅니다.

결론적으로, 엔터프라이즈 코딩에 있어서 최고의 가성비를 자랑하는 모델입니다.

복잡한 아키텍처 다이어그램을 해석하는 vision 능력이 크게 개선되었습니다.

50개의 파일을 입력했는데 전체 라우팅 로직을 완벽하게 리팩토링했습니다.

GPT-4o와 비교했을 때 커뮤니케이션 스타일이 훨씬 인간적으로 느껴집니다.

가격은 40% 저렴하면서도 일부 영역에서는 실제로 Opus 4.6을 앞지르고 있습니다.

context window를 채우다 보면 약 150,000 tokens 근처에서 효율이 떨어지는 경향이 있습니다.

적응형 reasoning 기능을 통해 속도와 깊은 논리 사이를 자유롭게 전환할 수 있습니다.

이번 출시는 Anthropic이 내놓은 최초의 진정한 '에이전트 우선' model처럼 느껴집니다.

최고 수준의 창의적 글쓰기를 제외한 모든 작업에 이 모델을 사용할 것 같습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Claude Sonnet 4.6 프로 팁

Claude Sonnet 4.6을 최대한 활용하기 위한 전문가 팁.

Context Compaction 활용

API의 Compaction 기능을 활성화하여 긴 세션의 이전 대화 기록을 자동으로 요약하세요.

Thinking Tokens의 전략적 사용

수학이나 복잡한 로직의 경우, thinking tokens 예산을 높게 설정하여 model이 다양한 reasoning 경로를 탐색할 수 있도록 하세요.

SPEC 준수 프롬프팅

model이 최신 도구들을 자연스럽게 활용하므로, 현대적인 아키텍처 베스트 프랙티스를 따르도록 명시적으로 요청하세요.

UI를 위한 Artifacts 활용

UI Artifacts를 사용하여 코드 생성물을 채팅창과 분리하고 실시간으로 반복 수정할 수 있도록 유도하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Claude Sonnet 4.6에 대한 자주 묻는 질문

Claude Sonnet 4.6에 대한 일반적인 질문에 대한 답변 찾기