anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 tilbyder frontier-ydeevne til kodning og computer use med et massivt 1M token context window for kun $3/1M tokens.

Agentic AIMultimodalKodningComputer UseLang context
anthropic logoanthropicClaudeFebruary 17, 2026
Kontekst
1.0Mtokens
Maks output
64Ktokens
Input-pris
$3.00/ 1M
Output-pris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
89.9%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Claude Sonnet 4.6 scorede 89.9% på denne benchmark.
HLE
49%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Claude Sonnet 4.6 scorede 49% på denne benchmark.
MMLU
89.3%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Claude Sonnet 4.6 scorede 89.3% på denne benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Claude Sonnet 4.6 scorede 79.2% på denne benchmark.
SimpleQA
48.5%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Claude Sonnet 4.6 scorede 48.5% på denne benchmark.
IFEval
89.5%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Claude Sonnet 4.6 scorede 89.5% på denne benchmark.
AIME 2025
83%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Claude Sonnet 4.6 scorede 83% på denne benchmark.
MATH
85.3%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Claude Sonnet 4.6 scorede 85.3% på denne benchmark.
GSM8k
96.4%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Claude Sonnet 4.6 scorede 96.4% på denne benchmark.
MGSM
92.8%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Claude Sonnet 4.6 scorede 92.8% på denne benchmark.
MathVista
68.7%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Claude Sonnet 4.6 scorede 68.7% på denne benchmark.
SWE-Bench
79.6%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Claude Sonnet 4.6 scorede 79.6% på denne benchmark.
HumanEval
92.1%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Claude Sonnet 4.6 scorede 92.1% på denne benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Claude Sonnet 4.6 scorede 72.4% på denne benchmark.
MMMU
74.2%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Claude Sonnet 4.6 scorede 74.2% på denne benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Claude Sonnet 4.6 scorede 75.6% på denne benchmark.
ChartQA
88.1%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Claude Sonnet 4.6 scorede 88.1% på denne benchmark.
DocVQA
93.4%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Claude Sonnet 4.6 scorede 93.4% på denne benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Claude Sonnet 4.6 scorede 59.1% på denne benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Claude Sonnet 4.6 scorede 58.3% på denne benchmark.

Om Claude Sonnet 4.6

Lær om Claude Sonnet 4.6s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Et generationsspring i intelligens

Claude Sonnet 4.6 er Anthropic's hidtil mest kapable og alsidige model, designet til at fungere som en højtydende arbejdshest til komplekse enterprise- og udvikler-workflows. Den blev udgivet den 17. februar 2026 og repræsenterer et stort generationsspring over 4.5-serien ved at introducere computer use-kapaciteter på menneskeligt niveau og et massivt 1-million-token context window i beta. Modellen er optimeret til agentic opgaver, hvilket betyder, at den ikke kun behandler tekst, men autonomt kan planlægge og udføre operationer i flere trin på tværs af forskellige softwaremiljøer.

Teknisk sofistikering og multimodalitet

Teknisk set bygger Sonnet 4.6 bro mellem hastigheden i modeller på mellemniveau og den dybe reasoning i Opus-klassen. Den indeholder Adaptive Thinking, som gør det muligt for den at skalere sin interne reasoning-indsats baseret på opgavens kompleksitet. Denne model er blevet den nye standard for Claude Free- og Pro-brugere og tilbyder flagship-intelligens inden for kodning, finansiel analyse og dokumentforståelse. Den er ægte nativ multimodal og understøtter input af tekst, billeder, lyd og video for at håndtere en række mediebehandlingsopgaver med state-of-the-art nøjagtighed.

Den nye branchestandard for agenter

Med sit elite ydeevne-til-pris-forhold er Sonnet 4.6 positioneret som den primære motor for AI-agenter. Den opnår brancheførende scores på SWE-bench Verified (79,6 %) og OSWorld-Verified (72,5 %), hvilket demonstrerer dens overlegne evne til at navigere i reelle softwareudviklingsproblemer og komplekse operativsystemopgaver. Ved at tilbyde intelligens tæt på Opus til en brøkdel af prisen gør den det muligt for udviklere at bygge autonome systemer, der tidligere var beregningsmæssigt eller økonomisk uoverkommelige.

Claude Sonnet 4.6

Anvendelser for Claude Sonnet 4.6

Opdag de forskellige måder, du kan bruge Claude Sonnet 4.6 til at opnå gode resultater.

Autonom softwareudvikling

Brug af Claude Code til at refactorere hele repositories og implementere komplekse funktioner med context fra hele arkivet.

Computer Use på menneskeligt niveau

Automatisering af ældre software og web-workflows ved at se skærmen og interagere via virtuel mus og tastatur.

Forståelse af finansielle dokumenter

Analyse af tusindvis af sider med indberetninger og tabeller for at ræsonnere gennem komplekse investeringsstrategier eller risici.

Business-simulering i realtid

Afvikling af agentic simuleringer, hvor modellen styrer en virtuel virksomhed og optimerer for profitabilitet.

Flersproget teknisk skrivning

Generering af teknisk dokumentation på tværs af snesevis af sprog, mens perfekt overholdelse af arkitektoniske specifikationer opretholdes.

Generering af frontend UI/UX

Skabelse af polerede, moderne dashboard-interfaces med fokus på typografi, farveteori og responsivt layout.

Styrker

Begrænsninger

Brancheførende kodning: Opnår state-of-the-art 79,6 % på SWE-bench Verified og udkonkurrerer konkurrenter i løsning af reelle GitHub-issues.
Latency i Thinking-tilstand: Høje budgetter til thinking tokens øger tiden til første token, hvilket gør den mindre ideel til øjeblikkelig realtids-chat.
Elite ydeevne-til-pris-forhold: Leverer intelligensniveauer tæt på Opus til en 5x lavere pris, hvilket gør den til det mest økonomiske valg for omfattende automatisering.
Friktion ved rate limiting: Free- og Pro-brugere rammer aggressive beskedgrænser under intensive sessioner, hvilket nødvendiggør skift til API'en.
Computer-navigation på menneskeligt niveau: Scorer 72,5 % på OSWorld-Verified, hvilket viser massive forbedringer i at navigere i kompleks software uden API'er.
Context-nedbrydning over 150k: På trods af 1M-vinduet kan modellen stadig lejlighedsvis miste specifikke detaljer fra midten af meget store prompts.
Adaptiv reasoning-kraft: Har en skalerbar Thinking-tilstand, der gør det muligt for udviklere at skalere reasoning-indsatsen op til svære logiske problemer.
Sårbarhed over for prompt-injection: Computer Use-funktionen udgør en risiko, hvor ondsindede websteder kan forsøge at kapre modellens virtuelle browser-session.

API hurtig start

anthropic/claude-sonnet-4-6

Se dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyse this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Claude Sonnet 4.6

Se hvad fællesskabet mener om Claude Sonnet 4.6

Claude Sonnet 4.6 ramte 94 % på vores forsikrings-benchmark, hvilket gør den til den bedst præsterende model, vi har testet til computer use.
Swami Sivasubramanian
twitter
Hypen er reel, dette er uden tvivl den bedste (og sjoveste) LLM, jeg nogensinde har brugt! Langt overlegen i forhold til hvad jeg har set indtil nu.
WolframRavenwolf
reddit
Claude Sonnet 4.6 er hylende morsom, ikke bare 'sjov indimellem'. Generelt varm, ærlig og prosocial.
Anton P.
twitter
Sonnet 4.6 er så meget bedre end Cline til kodningsopgaver. Jeg åbner ikke engang filer manuelt længere.
semibaron
hackernews
Det 1M context window er en game changer for migration af kodebaser. Jeg uploadede bare hele min legacy-stack.
DevOpsDan
reddit
Den håndterer komplekse regneark og webformularer med næsten uhyggelig præcision. Computer Use betaen er endelig klar.
AI_Insights_Daily
youtube

Videoer om Claude Sonnet 4.6

Se vejledninger, anmeldelser og diskussioner om Claude Sonnet 4.6

Sonnet 4.6 opnåede en højere score på GDP val, som måler meningsfulde opgaver i den virkelige verden.

Det bliver sværere overhovedet at vide, om disse modeller er i stand til CBRN-ting.

Forholdet mellem hastighed og intelligens er her i det væsentlige uovertruffet af nogen anden model på markedet.

Anthropic fokuserer tydeligvis på den agentic side af sagen med denne udgivelse.

Prisstrukturen gør dette til den nye standard for enhver udvikler med høj API-volumen.

Denne model er omkring dobbelt så hurtig sammenlignet med Opus-modellen fra sidste måned.

Konklusionen er, folkens, at denne model giver mest værdi for pengene til enterprise-kodning.

Vision-evnerne til at fortolke komplekse arkitekturdiagrammer er markant forbedret.

Jeg kunne give den 50 filer, og den refactorerede hele routing-logikken perfekt.

Den føles meget mere menneskelig i sin kommunikationsstil sammenlignet med GPT-4o.

Den slår faktisk Opus 4.6 på visse områder, samtidig med at den ligger på et 40 % lavere prispunkt.

Når vi fylder context window op, og vi når omkring 150.000 tokens, har effektiviteten tendens til at falde.

Den adaptive reasoning-funktion giver dig mulighed for stort set at skifte mellem hastighed og dyb logik.

Denne udgivelse føles som den første ægte 'agent-first' model fra Anthropic.

Jeg ville bruge denne til alt, undtagen måske til kreativ skrivning på det absolut højeste niveau.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til Claude Sonnet 4.6

Eksperttips til at hjælpe dig med at få mest muligt ud af Claude Sonnet 4.6 og opnå bedre resultater.

Udnyt Context Compaction

Aktivér Compaction-funktionen i API'en for automatisk at opsummere ældre historik i lange sessioner.

Brug Thinking tokens strategisk

Til matematik eller kompleks logik bør du afsætte et højere budget til thinking tokens, så modellen kan udforske flere reasoning-stier.

Prompt for SPEC-overholdelse

Bed eksplicit modellen om at følge moderne arkitektoniske best practices, da den naturligt søger mod opdaterede værktøjer.

Brug Artifacts til UI

Opmuntr modellen til at bruge UI Artifacts for at adskille kodegenerering fra chat-tråden for realtids-iteration.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Ofte stillede spørgsmål om Claude Sonnet 4.6

Find svar på almindelige spørgsmål om Claude Sonnet 4.6