anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 tilbyder førende ydeevne inden for coding og computer use med et massivt context window på 1M tokens til kun $3/1M tokens.

Agentic AIMultimodalCodingComputer UseLong Context
anthropic logoanthropicClaude 417. februar 2026
Kontekst
1.0Mtokens
Maks output
64Ktokens
Input-pris
$3.00/ 1M
Output-pris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
89.9%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Claude Sonnet 4.6 scorede 89.9% på denne benchmark.
HLE
49%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Claude Sonnet 4.6 scorede 49% på denne benchmark.
MMLU
89.3%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Claude Sonnet 4.6 scorede 89.3% på denne benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Claude Sonnet 4.6 scorede 79.2% på denne benchmark.
SimpleQA
48.5%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Claude Sonnet 4.6 scorede 48.5% på denne benchmark.
IFEval
89.5%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Claude Sonnet 4.6 scorede 89.5% på denne benchmark.
AIME 2025
83%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Claude Sonnet 4.6 scorede 83% på denne benchmark.
MATH
85.3%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Claude Sonnet 4.6 scorede 85.3% på denne benchmark.
GSM8k
96.4%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Claude Sonnet 4.6 scorede 96.4% på denne benchmark.
MGSM
92.8%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Claude Sonnet 4.6 scorede 92.8% på denne benchmark.
MathVista
68.7%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Claude Sonnet 4.6 scorede 68.7% på denne benchmark.
SWE-Bench
79.6%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Claude Sonnet 4.6 scorede 79.6% på denne benchmark.
HumanEval
92.1%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Claude Sonnet 4.6 scorede 92.1% på denne benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Claude Sonnet 4.6 scorede 72.4% på denne benchmark.
MMMU
74.2%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Claude Sonnet 4.6 scorede 74.2% på denne benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Claude Sonnet 4.6 scorede 75.6% på denne benchmark.
ChartQA
88.1%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Claude Sonnet 4.6 scorede 88.1% på denne benchmark.
DocVQA
93.4%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Claude Sonnet 4.6 scorede 93.4% på denne benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Claude Sonnet 4.6 scorede 59.1% på denne benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Claude Sonnet 4.6 scorede 58.3% på denne benchmark.

Om Claude Sonnet 4.6

Lær om Claude Sonnet 4.6s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

High-Performance Agentic Intelligence

Claude Sonnet 4.6 er Anthropic's mest alsidige model, designet til at fungere som den primære motor for komplekse virksomheds-workflows og autonome agenter. Udgivet den 17. februar 2026 introducerer den computer use-kapabiliteter på menneskeligt niveau og et context window på 1 million tokens. Modelarkitekturen balancerer hastigheden fra mid-tier systemer med den reasoning-dybde, der typisk er reserveret til Opus-klassen, hvilket gør den til et bæredygtigt valg til produktionsmiljøer med høj volumen.

Adaptive Thinking og multimodality

I sin tekniske kerne benytter Sonnet 4.6 en Adaptive Thinking-mekanisme. Dette giver udviklere mulighed for at skalere den interne reasoning-indsats baseret på de specifikke krav til en opgave, optimeret til enten sub-sekund latency eller dyb logisk verifikation. Modellen er nativt multimodal og tilbyder state-of-the-art ydeevne i behandlingen af tekst, højopløselige billeder og lydfiler. Den er fremragende til at fortolke tæt teknisk dokumentation og komplekse visuelle data, såsom arkitekttegninger eller finansielle grafer.

Industristandarden for coding

Med en rekordbrydende score på 79,6 % på SWE-bench Verified, er Sonnet 4.6 blevet standardvalget til automatisering af softwareudvikling. Dens evne til at resonnere på tværs af massive codebases inden for dens 1M context window gør den i stand til at løse fejl på tværs af filer og planlægge arkitektoniske refactors med minimal menneskelig indgriben. Ved at tilbyde intelligens tæt på Opus-niveau til $3 pr. million input-tokens, fjerner den de økonomiske barrierer, der tidligere var forbundet med implementering af reelt autonome AI-systemer.

Claude Sonnet 4.6

Anvendelser for Claude Sonnet 4.6

Opdag de forskellige måder, du kan bruge Claude Sonnet 4.6 til at opnå gode resultater.

Autonom softwareudvikling

Løsning af komplekse GitHub-issues på tværs af flere filer og udførelse af refactoring af hele repositories ved brug af dens 79,6 % SWE-bench-nøjagtighed.

Computer use på menneskeligt niveau

Direkte navigation i desktop-software og web-interfaces for at udføre administrative opgaver i flere trin uden custom API-integrationer.

Dokumentanalyse i stor skala

Gennemgang af tusindvis af sider med juridiske kontrakter eller forskningsartikler samtidigt inden for et context window på 1 million tokens.

Finansiel intelligens og prognoser

Behandling af earnings calls og kvartalsrapporter for at identificere subtile markedsanomalier ved brug af high-effort adaptive reasoning.

Multimodal teknisk support

Fortolkning af komplekse tekniske diagrammer, billeder af printplader og lydoptagelser for at give præcise trin til fejlfinding.

Agentic forretningsstrategi

Planlægning og udførelse af langsigtede operationer ved at udnytte top-tier scores på strategi- og logikbaserede benchmarks.

Styrker

Begrænsninger

Elite-nøjagtighed i coding: Sætter industristandarden med 79,6 % på SWE-bench Verified og overgår alle andre mid-tier og de fleste flagship-modeller.
Mangler native video-input: Kræver manuel frame extraction til visuel behandling af videofiler, hvilket øger kompleksiteten i medie-arbejdsgange.
Uovertruffen context-kapacitet: Vinduet på 1 million tokens tillader indlæsning af hele tekniske biblioteker eller massive codebases uden forringelse af ydeevnen.
Øget reasoning-latency: Brug af high-effort adaptive reasoning øger 'time-to-first-token' markant sammenlignet med standard inference.
Autonom computer use: Opnår en score på 72,5 % på OSWorld, hvilket gør det muligt for model at navigere i komplekse GUI'er og softwareværktøjer som en virtuel operatør.
Høje omkostninger ved output-reasoning: Selvom prisen for input er konkurrencedygtig, kan reasoning-opgaver med maksimal indsats forbruge store mængder output tokens, hvilket øger omkostningerne.
Optimeret pris-ydelse: Leverer intelligens på næsten Opus-niveau til 1/5 af prisen, hvilket gør det til det mest økonomiske valg til agent-deployment i stor skala.
Støj i context retrieval: Ved grænsen på 1M tokens kan model lejlighedsvis lide under nedsat fokus, hvis context window er fyldt med irrelevant data.

API hurtig start

anthropic/claude-sonnet-4-6

Se dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Claude Sonnet 4.6

Se hvad fællesskabet mener om Claude Sonnet 4.6

Context er støj. Større token-vinduer er en fælde. Giv agenter kun det smalle, kuraterede signal, de har brug for.
Logical-Storm-1180
reddit
Dette er Claude Sonnet 4.6: vores mest kapable Sonnet-model til dato. Det er en fuld opgradering på tværs af coding, computer use og agent-planlægning.
Claude
twitter
Forholdet mellem ydeevne og omkostninger for Claude Sonnet 4.6 er ekstraordinært; det er svært at overvurdere, hvor hurtigt disse modeller udvikler sig.
Replit
youtube
Sonnet 4.6 er nu live i Claude Code. Den er billigere end Opus 4.6 og nærmer sig intelligens på Opus-niveau.
Boris Cherny
twitter
Claude 4.6 er den nye leder inden for agentic-ydeevne, en smule foran Opus 4.6 på virkelige vidensopgaver.
Artificial Analysis
twitter
Det faktum, at denne model kan navigere i en computer-grænseflade med 72 % nøjagtighed, gør i bund og grund behovet for de fleste skræddersyede API'er overflødigt.
DevOpsGuru
hackernews

Videoer om Claude Sonnet 4.6

Se vejledninger, anmeldelser og diskussioner om Claude Sonnet 4.6

Sonnet 4.6 er her, og den kan erstatte Opus til 90 % af alt, hvad du gør til daglig.

Men det bedste er, at den er 40 % billigere end at bruge Opus 4.6.

SWE-bench-resultaterne er faktisk utrolige for en mid-tier model.

Du kan effektivt give den et helt codebase, og den mister ikke overblikket.

Adaptive thinking-indsats giver dig mulighed for at bytte hastighed for dybere logik.

Tidlige brugere rapporterer faktisk, at den er i stand til næsten menneskelignende ydeevne i kompleks håndtering af regneark.

Denne model er omkring dobbelt så hurtig sammenlignet med Opus.

Context window på 1 million tokens er i øjeblikket i beta, men fungerer rigtig godt.

Den navigerer i software-interfaces uden behov for specifikke API-integrationer.

Coding-kapaciteten i Python og JavaScript er stort set ved loftet.

Anthropic siger, at det nye context window er stort nok til at rumme hele codebases og resonnere effektivt på tværs af al den context.

Opus 4.6 er 'atomvåben-muligheden'... men nu har vi endelig en skalpel, hvilket er fantastiske nyheder.

Computer use er den vigtigste funktion her, hvor den faktisk flytter musen og skriver.

Finansielle analytikere kommer til at elske dybden i reasoning til dokumentgennemgang.

Det er første gang, at en 'Sonnet'-model har føltes som den absolut bedste i klassen.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til Claude Sonnet 4.6

Eksperttips til at hjælpe dig med at få mest muligt ud af Claude Sonnet 4.6 og opnå bedre resultater.

Optimer Thinking-indsats

Brug 'adaptive' thinking-mode for at spare omkostninger på simple forespørgsler, mens du reserverer 'max' indsats til matematik- og logikopgaver.

Implementer Context Compaction

Aktiver prompt caching og compaction-funktioner for at håndtere 1M token-vinduet effektivt uden unødige omkostninger.

Struktureret adfærdsmæssig forankring

Brug en central projekt-markdown-fil til at opretholde en vedvarende 'source of truth' for model'ens arkitektoniske beslutninger.

Video Frame Extraction

Da native video ikke er understøttet, bør du udtrække nøgleframes ved 1fps for den mest præcise visuelle analyse af videoindhold.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Ofte stillede spørgsmål om Claude Sonnet 4.6

Find svar på almindelige spørgsmål om Claude Sonnet 4.6