anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 erbjuder frontier-prestanda för kodning och computer use med ett massivt 1M token context window för endast $3/1M tokens.

Agentic AIMultimodalKodningComputer UseLong Context
anthropic logoanthropicClaude 417 februari 2026
Kontext
1.0Mtokens
Max utdata
64Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
89.9%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude Sonnet 4.6 fick 89.9% pa detta benchmark.
HLE
49%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude Sonnet 4.6 fick 49% pa detta benchmark.
MMLU
89.3%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude Sonnet 4.6 fick 89.3% pa detta benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude Sonnet 4.6 fick 79.2% pa detta benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude Sonnet 4.6 fick 48.5% pa detta benchmark.
IFEval
89.5%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude Sonnet 4.6 fick 89.5% pa detta benchmark.
AIME 2025
83%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude Sonnet 4.6 fick 83% pa detta benchmark.
MATH
85.3%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude Sonnet 4.6 fick 85.3% pa detta benchmark.
GSM8k
96.4%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude Sonnet 4.6 fick 96.4% pa detta benchmark.
MGSM
92.8%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude Sonnet 4.6 fick 92.8% pa detta benchmark.
MathVista
68.7%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude Sonnet 4.6 fick 68.7% pa detta benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude Sonnet 4.6 fick 79.6% pa detta benchmark.
HumanEval
92.1%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude Sonnet 4.6 fick 92.1% pa detta benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude Sonnet 4.6 fick 72.4% pa detta benchmark.
MMMU
74.2%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude Sonnet 4.6 fick 74.2% pa detta benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude Sonnet 4.6 fick 75.6% pa detta benchmark.
ChartQA
88.1%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude Sonnet 4.6 fick 88.1% pa detta benchmark.
DocVQA
93.4%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude Sonnet 4.6 fick 93.4% pa detta benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude Sonnet 4.6 fick 59.1% pa detta benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude Sonnet 4.6 fick 58.3% pa detta benchmark.

Om Claude Sonnet 4.6

Lar dig om Claude Sonnet 4.6s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Agentic-intelligens med hög prestanda

Claude Sonnet 4.6 är Anthropics mest mångsidiga model, utformad för att fungera som en primär motor för komplexa företagsarbetsflöden och autonoma agenter. Den släpptes den 17 februari 2026 och introducerar computer use-kapacitet på mänsklig nivå samt ett context window på 1 miljon tokens. Modellarkitekturen balanserar hastigheten hos system i mellansegmentet med det reasoning-djup som vanligtvis är reserverat för Opus-klassen, vilket gör den till ett hållbart val för produktionsmiljöer med hög belastning.

Adaptiv thinking och multimodalt stöd

I sin tekniska kärna använder Sonnet 4.6 en Adaptive Thinking-mekanism. Detta gör att utvecklare kan skala den interna reasoning-ansträngningen baserat på specifika krav för en uppgift, optimerat för antingen sub-sekunds-latency eller djup logisk verifiering. Modellen är inbyggt multimodal och erbjuder state-of-the-art-prestanda vid bearbetning av text, högupplösta bilder och ljudfiler. Den är expert på att tolka tät teknisk dokumentation och komplex visuell data, såsom arkitektritningar eller finansiella diagram.

Branschstandard för kodning

Med ett rekordresultat på 79,6 % på SWE-bench Verified har Sonnet 4.6 blivit standardvalet för automatisering av mjukvaruutveckling. Dess förmåga att resonera kring omfattande kodbaser inom sitt 1M context window gör att den kan lösa buggar i flera filer och planera arkitektoniska refaktoriseringar med minimal mänsklig inblandning. Genom att erbjuda intelligens nära Opus-nivå för $3 per miljon input tokens tar den bort de finansiella barriärer som tidigare förknippats med att distribuera verkligt autonoma AI-system.

Claude Sonnet 4.6

Anvandningsfall for Claude Sonnet 4.6

Upptack de olika satten du kan anvanda Claude Sonnet 4.6 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Lösa komplexa GitHub-ärenden som spänner över flera filer och utföra refaktorisering av hela repositorier med dess 79,6 % SWE-bench-noggrannhet.

Computer use på mänsklig nivå

Navigera direkt i skrivbordsprogram och webbgränssnitt för att slutföra administrativa uppgifter i flera steg utan anpassade API-integrationer.

Storskalig dokumentanalys

Granska tusentals sidor juridiska kontrakt eller forskningsrapporter samtidigt inom ett context window på 1 miljon tokens.

Finansiell intelligens och prognostisering

Bearbeta kvartalsrapporter och ekonomiska analyser för att identifiera subtila marknadsavvikelser med hjälp av adaptiv reasoning med hög ansträngning.

Multimodal teknisk support

Tolka komplexa tekniska diagram, foton på kretskort och ljudinspelningar för att ge exakta felsökningssteg.

Agentic affärsstrategi

Planera och utföra långsiktiga operationer genom att dra nytta av förstklassiga resultat på strategiska och logikbaserade benchmarks.

Styrkor

Begransningar

Överlägsen kodningsnoggrannhet: Sätter branschstandard med 79,6 % på SWE-bench Verified och överträffar alla andra modeller i mellansegmentet och de flesta frontier models.
Brist på inbyggd videoinmatning: Kräver manuell extrahering av bildrutor för visuell bearbetning av videofiler, vilket ökar komplexiteten i arbetsflöden.
Oöverträffad context-kapacitet: Fönstret på 1 miljon tokens möjliggör inläsning av hela tekniska bibliotek eller enorma kodbaser utan prestandaförlust.
Ökad latency vid reasoning: Att använda adaptiv reasoning med hög ansträngning ökar avsevärt tiden till första token (time-to-first-token) jämfört med standard-inference.
Autonom computer use: Uppnår 72,5 % på OSWorld, vilket gör att modellen kan navigera i komplexa GUI:n och mjukvaruverktyg som en virtuell operatör.
Höga kostnader för output-reasoning: Även om priset för input är konkurrenskraftigt, kan reasoning-uppgifter med maximal ansträngning förbruka stora mängder output tokens, vilket ökar kostnaderna.
Optimerad pris-prestanda: Levererar intelligens i klass med Opus till en femtedel av kostnaden, vilket gör det till det mest ekonomiska valet för storskaliga agent-distributioner.
Brus i context-hämtning: Vid gränsen på 1M tokens kan modellen ibland drabbas av minskat fokus om kontexten är fylld med irrelevant data.

API snabbstart

anthropic/claude-sonnet-4-6

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analysera detta repositorium efter arkitektoniska flaskhalsar." }
  ],
});

console.log(response.content[0].text);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude Sonnet 4.6

Se vad communityt tycker om Claude Sonnet 4.6

Kontext är brus. Större token-fönster är en fälla. Ge agenter bara den smala, kurerade signal de behöver.
Logical-Storm-1180
reddit
Det här är Claude Sonnet 4.6: vår mest kapabla Sonnet-model hittills. Det är en fullständig uppgradering inom kodning, computer use och agent-planering.
Claude
twitter
Förhållandet mellan prestanda och kostnad för Claude Sonnet 4.6 är extraordinärt; det är svårt att överskatta hur snabbt dessa modeller utvecklas.
Replit
youtube
Sonnet 4.6 är nu live i Claude Code. Den är billigare än Opus 4.6 och närmar sig Opus-nivå i intelligens.
Boris Cherny
twitter
Claude 4.6 är den nya ledaren inom agentic-prestanda, något före Opus 4.6 på praktiska kunskapsarbetsuppgifter.
Artificial Analysis
twitter
Det faktum att denna model kan navigera i ett datorgränssnitt med 72 % noggrannhet gör i princip att behovet av de flesta skräddarsydda API:er försvinner.
DevOpsGuru
hackernews

Videor om Claude Sonnet 4.6

Se handledningar, recensioner och diskussioner om Claude Sonnet 4.6

Sonnet 4.6 är här och den kan komma att ersätta Opus för 90 % av det du gör dagligen.

Men det bästa är att den är 40 % billigare än att använda Opus 4.6.

SWE-bench-resultaten är faktiskt otroliga för en model i mellansegmentet.

Du kan effektivt mata in en hel kodbas och den tappar inte tråden.

Adaptiv thinking-ansträngning låter dig byta hastighet mot djupare logik.

Tidiga användare rapporterar faktiskt att den är kapabel till nästan mänsklig prestanda vid komplex kalkylbladsmanipulering.

Denna model är ungefär dubbelt så snabb jämfört med Opus.

Context window på 1 miljon tokens är för närvarande i beta men fungerar mycket bra.

Den navigerar i programvarugränssnitt utan att behöva specifika API-integrationer.

Kodningsförmågan i Python och JavaScript är i princip på maxnivå.

Anthropic säger att det nya context window är stort nog att rymma hela kodbaser och resonera effektivt genom all den kontexten.

Opus 4.6 är alternativet 'kärnvapen'... men nu har vi äntligen en skalpell, vilket är fantastiska nyheter.

Computer use är den utmärkande funktionen här, att faktiskt flytta musen och skriva.

Finansanalytiker kommer att älska reasoning-djupet för dokumentgranskning.

Det är första gången en 'Sonnet'-model har känts som den absoluta bäst-i-klassen.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Claude Sonnet 4.6

Experttips for att hjalpa dig fa ut det mesta av Claude Sonnet 4.6 och uppna battre resultat.

Optimera thinking-ansträngning

Använd det 'adaptiva' thinking-läget för att spara kostnader på enkla frågor, och reservera 'max'-ansträngning för matematik- och logikuppgifter.

Implementera context compaction

Aktivera prompt caching och compaction-funktioner för att hantera 1M token-fönstret effektivt utan onödiga kostnader.

Strukturerad beteendeförankring

Använd en central markdown-fil för projektet för att bibehålla en permanent källa till sanning för modellens arkitektoniska beslut.

Extrahering av videorutor

Eftersom inbyggt videostöd saknas, extrahera nyckelrutor med 1 fps för den mest exakta visuella analysen av videoinnehåll.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Vanliga fragor om Claude Sonnet 4.6

Hitta svar pa vanliga fragor om Claude Sonnet 4.6