anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 erbjuder frontier-prestanda för coding och computer use med ett massivt 1M token context window för endast $3/1M tokens.

Agentic AIMultimodalCodingComputer UseLång kontext
anthropic logoanthropicClaude17 februari 2026
Kontext
1.0Mtokens
Max utdata
64Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
89.9%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude Sonnet 4.6 fick 89.9% pa detta benchmark.
HLE
49%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude Sonnet 4.6 fick 49% pa detta benchmark.
MMLU
89.3%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude Sonnet 4.6 fick 89.3% pa detta benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude Sonnet 4.6 fick 79.2% pa detta benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude Sonnet 4.6 fick 48.5% pa detta benchmark.
IFEval
89.5%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude Sonnet 4.6 fick 89.5% pa detta benchmark.
AIME 2025
83%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude Sonnet 4.6 fick 83% pa detta benchmark.
MATH
85.3%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude Sonnet 4.6 fick 85.3% pa detta benchmark.
GSM8k
96.4%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude Sonnet 4.6 fick 96.4% pa detta benchmark.
MGSM
92.8%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude Sonnet 4.6 fick 92.8% pa detta benchmark.
MathVista
68.7%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude Sonnet 4.6 fick 68.7% pa detta benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude Sonnet 4.6 fick 79.6% pa detta benchmark.
HumanEval
92.1%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude Sonnet 4.6 fick 92.1% pa detta benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude Sonnet 4.6 fick 72.4% pa detta benchmark.
MMMU
74.2%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude Sonnet 4.6 fick 74.2% pa detta benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude Sonnet 4.6 fick 75.6% pa detta benchmark.
ChartQA
88.1%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude Sonnet 4.6 fick 88.1% pa detta benchmark.
DocVQA
93.4%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude Sonnet 4.6 fick 93.4% pa detta benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude Sonnet 4.6 fick 59.1% pa detta benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude Sonnet 4.6 fick 58.3% pa detta benchmark.

Om Claude Sonnet 4.6

Lar dig om Claude Sonnet 4.6s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Ett generationssprång inom intelligens

Claude Sonnet 4.6 är Anthropic:s mest kapabla och mångsidiga model hittills, utformad för att fungera som en högpresterande arbetshäst för komplexa enterprise- och utvecklararbetsflöden. Den släpptes den 17 februari 2026 och representerar ett stort generationssprång över 4.5-serien, med introduktion av computer use-funktioner på mänsklig nivå och ett massivt 1-miljon-token context window i beta. Model är optimerad för agentic-uppgifter, vilket innebär att den inte bara bearbetar text utan självständigt kan planera och utföra operationer i flera steg i olika mjukvarumiljöer.

Teknisk sofistikering och multimodalitet

Tekniskt sett överbryggar Sonnet 4.6 klyftan mellan hastigheten hos modeller i mellanklassen och djup reasoning i Opus-klassen. Den har Adaptive Thinking, vilket gör att den kan skala sin interna reasoning-insats baserat på uppgiftens komplexitet. Denna model har blivit den nya standarden för Claude Free- och Pro-användare och erbjuder flagship-nivå av intelligens inom coding, finansiell analys och dokumentförståelse. Den är genuint nativ multimodal och stöder input av text, bilder, ljud och video för att hantera en mängd olika mediebearbetningsuppgifter med state-of-the-art-noggrannhet.

Den nya branschstandarden för agenter

Med sitt elitnivå-förhållande mellan prestanda och kostnad är Sonnet 4.6 positionerad som den primära motorn för AI-agenter. Den uppnår branschledande poäng på SWE-bench Verified (79.6%) och OSWorld-Verified (72.5%), vilket visar dess överlägsna förmåga att navigera i verkliga mjukvaruutvecklingsproblem och komplexa operativsystemsuppgifter. Genom att tillhandahålla intelligens nära Opus-nivå till en bråkdel av kostnaden, ger den utvecklare möjlighet att bygga autonoma system som tidigare var beräkningsmässigt eller ekonomiskt oöverkomliga.

Claude Sonnet 4.6

Anvandningsfall for Claude Sonnet 4.6

Upptack de olika satten du kan anvanda Claude Sonnet 4.6 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Använda Claude Code för att refaktorera hela arkiv och implementera komplexa funktioner med kontext över hela arkivet.

Computer Use på mänsklig nivå

Automatisera äldre programvara och webbarbetsflöden genom att se skärmen och interagera via virtuell mus och tangentbord.

Förståelse av finansiella dokument

Analysera tusentals sidor av ansökningar och tabeller för att resonera kring komplexa investeringsstrategier eller risker.

Affärssimulering i realtid

Köra agentic-simuleringar där model hanterar ett virtuellt företag och optimerar för lönsamhet.

Flerspråkigt tekniskt skrivande

Generera teknisk dokumentation på dussintals språk samtidigt som perfekt SPEC-efterlevnad bibehålls.

Generering av frontend-UI/UX

Skapa polerade, moderna instrumentpaneler med fokus på typografi, färglära och responsiv layout.

Styrkor

Begransningar

Branschledande coding: Uppnår state-of-the-art 79.6% på SWE-bench Verified, och överträffar konkurrenter i att lösa verkliga GitHub-problem.
Latency i Thinking-läge: Höga budgetar för thinking tokens ökar time-to-first-token, vilket gör den mindre idealisk för omedelbar realtids-chat.
Elitnivå på prestanda i förhållande till kostnad: Levererar intelligensnivåer nära Opus till en 5x lägre kostnad, vilket gör den till det mest ekonomiska valet för omfattande automatisering.
Friktion vid rate limiting: Gratis- och Pro-användare når aggressiva meddelandetak under intensiva sessioner, vilket nödvändiggör ett byte till API.
Datornavigering på mänsklig nivå: Scorar 72.5% på OSWorld-Verified, vilket visar på massiva förbättringar i att navigera komplex mjukvara utan API:er.
Context-försämring över 150k: Trots 1M-fönstret kan model fortfarande emellanåt tappa specifika detaljer från mitten av mycket stora prompts.
Adaptiv reasoning-kraft: Har ett skalbart Thinking-läge som gör det möjligt för utvecklare att skala upp reasoning-insatsen för svåra logiska problem.
Sårbarhet för prompt injection: Computer Use-funktionen innebär risker där skadliga webbplatser kan försöka kapa model-instansens virtuella webbläsarsession.

API snabbstart

anthropic/claude-sonnet-4-6

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analysera denna källkod för säkerhetsbrister.' }
  ],
});

console.log(msg.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude Sonnet 4.6

Se vad communityt tycker om Claude Sonnet 4.6

Claude Sonnet 4.6 nådde 94 % på vårt försäkrings-benchmark, vilket gör den till den mest högpresterande model vi har testat för computer use.
Swami Sivasubramanian
twitter
Hypen är verklig, det här är utan tvekan den bästa (och roligaste) LLM jag någonsin använt! Milsvida före vad jag har sett hittills.
WolframRavenwolf
reddit
Claude Sonnet 4.6 är hysteriskt rolig, inte bara 'kul ibland'. Genomgående varm, ärlig och prosocial.
Anton P.
twitter
Sonnet 4.6 är så mycket bättre än Cline för coding-uppgifter. Jag öppnar inte ens filer manuellt längre.
semibaron
hackernews
Ett 1M context window förändrar allt för migrering av källkod. Jag laddade precis upp hela min gamla stack.
DevOpsDan
reddit
Den hanterar komplexa kalkylblad och webbformulär med en nästan kuslig precision. Beta-versionen av Computer Use är äntligen redo.
AI_Insights_Daily
youtube

Videor om Claude Sonnet 4.6

Se handledningar, recensioner och diskussioner om Claude Sonnet 4.6

Sonnet 4.6 fick ett högre resultat på GDP val, som mäter meningsfulla uppgifter i den verkliga världen.

Det blir allt svårare att ens veta om dessa modeller är kapabla till CBRN-saker.

Förhållandet mellan hastighet och intelligens här är i princip oöverträffat av någon annan model på marknaden.

Anthropic fokuserar tydligt på den agentic sidan av verksamheten med denna release.

Kostnadsstrukturen gör detta till den nya standarden för alla API-utvecklare med hög volym.

Denna model är ungefär dubbelt så snabb jämfört med Opus-modellen från förra månaden.

Sammanfattningsvis, hörni, så ger denna model mest valuta för pengarna för enterprise-coding.

Vision-förmågan för att tolka komplexa arkitekturdiagram har förbättrats avsevärt.

Jag kunde ge den 50 filer och den refaktorerade hela routing-logiken perfekt.

Den känns mycket mer mänsklig i sin kommunikationsstil jämfört med GPT-4o.

Den slår faktiskt Opus 4.6 på vissa områden trots att den ligger 40 % lägre i pris.

När vi fyller upp context window och når cirka 150 000 tokens tenderar effektiviteten att sjunka.

Funktionen för adaptiv reasoning låter dig i princip växla mellan hastighet och djup logik.

Denna release känns som den första sanna 'agent-first'-model från Anthropic.

Jag skulle använda denna till allt förutom kanske absolut högsta nivån av kreativt skrivande.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Claude Sonnet 4.6

Experttips for att hjalpa dig fa ut det mesta av Claude Sonnet 4.6 och uppna battre resultat.

Utnyttja Context Compaction

Aktivera Compaction-funktionen i API:et för att automatiskt sammanfatta äldre konversationshistorik under långa sessioner.

Använd thinking tokens strategiskt

För matematik eller komplex logik, ställ in en högre budget för thinking tokens så att model kan utforska flera reasoning-vägar.

Prompt för SPEC-efterlevnad

Be uttryckligen model att följa moderna arkitektoniska best practices, då den naturligt söker efter uppdaterade verktyg.

Använd Artifacts för UI

Uppmuntra model att använda UI Artifacts för att separera kodgenereringar från chatttråden för iteration i realtid.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Vanliga fragor om Claude Sonnet 4.6

Hitta svar pa vanliga fragor om Claude Sonnet 4.6