anthropic

Claude Sonnet 4.5

Anthropics Claude Sonnet 4.5 levererar världsledande kodning (77,2 % SWE-bench) och ett 200K context window, optimerat för nästa generation av autonoma agenter.

AI-kodningAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 429 september 2025
Kontext
200Ktokens
Max utdata
64Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
83%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude Sonnet 4.5 fick 83% pa detta benchmark.
HLE
34%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude Sonnet 4.5 fick 34% pa detta benchmark.
MMLU
89%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude Sonnet 4.5 fick 89% pa detta benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude Sonnet 4.5 fick 78% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude Sonnet 4.5 fick 52% pa detta benchmark.
IFEval
88%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude Sonnet 4.5 fick 88% pa detta benchmark.
AIME 2025
87%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude Sonnet 4.5 fick 87% pa detta benchmark.
MATH
87%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude Sonnet 4.5 fick 87% pa detta benchmark.
GSM8k
98%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude Sonnet 4.5 fick 98% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude Sonnet 4.5 fick 92% pa detta benchmark.
MathVista
72%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude Sonnet 4.5 fick 72% pa detta benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude Sonnet 4.5 fick 77% pa detta benchmark.
HumanEval
94%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude Sonnet 4.5 fick 94% pa detta benchmark.
LiveCodeBench
68%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude Sonnet 4.5 fick 68% pa detta benchmark.
MMMU
78%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude Sonnet 4.5 fick 78% pa detta benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude Sonnet 4.5 fick 55% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude Sonnet 4.5 fick 89% pa detta benchmark.
DocVQA
92%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude Sonnet 4.5 fick 92% pa detta benchmark.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude Sonnet 4.5 fick 50% pa detta benchmark.
ARC-AGI
14%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude Sonnet 4.5 fick 14% pa detta benchmark.

Prova Claude Sonnet 4.5 gratis

Chatta med Claude Sonnet 4.5 gratis. Testa kapaciteterna, stall fragor och utforska vad denna AI-modell kan gora.

Prompt
Svar
Claude Sonnet 4.5

Ditt AI-svar kommer att visas har

Om Claude Sonnet 4.5

Lar dig om Claude Sonnet 4.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

**Frontlinjen för Agentic Intelligence**

Claude Sonnet 4.5 representerar Anthropics mest betydande språng inom "frontier intelligence", specifikt optimerad för eran av autonoma AI-agenter. Släppt i slutet av 2025 är det branschens första äkta "hybrid reasoning"-modell, som låter utvecklare växla mellan höghastighetsexekvering för rutinuppgifter och extended thinking för komplexa logiska utmaningar. Den överträffade märkbart tidigare benchmarks inom computer use och verktygsorkestrering, vilket gör den till den föredragna motorn för terminal-baserade agenter och mjukvaruutveckling i flera filer.

**Precision och minskade hallucinationer**

Modellen är byggd på en arkitektur som prioriterar "measure twice, cut once"-logik, vilket avsevärt minskar den inställsamhet (sycophancy) och de hallucinationer som sågs i 3.5-serien. Med en massiv output-gräns på 64 000 tokens och ett input-fönster på 200 000 tokens kan den läsa in hela repositories samtidigt som den genererar applikationsfiler i full längd i ett enda steg. Den introducerar också nativa "checkpoints" för agentic-arbetsflöden, vilket gör det möjligt för agenter att rulla tillbaka och korrigera sina egna misstag autonomt.

**Multimodal och reasoning-styrka**

Utöver kodning dominerar Sonnet 4.5 inom multimodal dokumentanalys och komplex finansiell modellering. Dess interna logik är tränad att prioritera arkitektonisk kontext, vilket gör att den kan mappa upp storskaliga kodbaser bättre än någon föregångare. Oavsett om det gäller att bearbeta handskrivna anteckningar eller implementera en fullständig Stripe-integration, bibehåller Sonnet 4.5 en hög nivå av faktamässig noggrannhet och förmåga att följa instruktioner.

Claude Sonnet 4.5

Anvandningsfall for Claude Sonnet 4.5

Upptack de olika satten du kan anvanda Claude Sonnet 4.5 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Använd Claude Sonnet 4.5 för att navigera i komplexa kodbaser, implementera funktioner i flera filer och köra tester självständigt.

Computer-Use-agenter

Driftsätt modellen för att styra skrivbord och webbläsare för dataextraktion, navigering i äldre system eller repetitiva administrativa uppgifter.

Agentic Search för företag

Orkestrera sökfrågor i flera steg och sammanställ spridd information från intern dokumentation och den levande webben.

Komplex finansiell modellering

Dra nytta av dess 87 % AIME-resultat för att utföra djupa logiska deduktioner på finansiella rapporter och marknadsdata.

Förfining av tekniskt innehåll

Omvandla krav på hög nivå till professionella PRD:er, tekniska specifikationer och kodbaser redo att kopieras och klistras in.

Multimodal dokumentanalys

Bearbeta tusentals sidor med diagram, handskrivna anteckningar och tekniska ritningar med state-of-the-art vision-förmågor.

Styrkor

Begransningar

Agentic kodningskraft: Nuvarande världsrekordhållare på SWE-bench Verified med en framgångsgrad på 77,2 % på riktiga GitHub-issues.
Användningsbegränsningar: Professionella användare rapporterar ofta att de snabbt når veckovisa användningsgränser på Pro-planen för $20/månad.
Otrolig hastighet: Opererar med 40–60 tokens per sekund, vilket gör den betydligt snabbare än tidigare frontier modeller för interaktiv användning.
Sök-latency: Agentic webbsökning (BrowseComp) förblir en svag punkt jämfört med specialiserade sökmodeller.
Hybrid Reasoning-flexibilitet: Den första modell som effektivt balanserar "fast chat"-läge med "extended thinking" för komplexa logiska kedjor.
Nischade kunskapsluckor: Kämpar med mycket specialiserade visuella uppgifter, som att identifiera specifika skateboarding-trick (29 % träffsäkerhet på SkateBench).
Massivt output-fönster: En gräns på 64K output tokens gör det möjligt att generera hela funktioner omfattande flera filer i ett enda API-anrop.
Agentic-kostnader: Att köra modellen autonomt i terminalläge kan förbruka $50–$100 i tokens för en enda komplex app-byggarsession.

API snabbstart

anthropic/claude-sonnet-4.5

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude Sonnet 4.5

Se vad communityt tycker om Claude Sonnet 4.5

"Claude Sonnet 4.5 är den nya kungen av AI-kodning... den ser riktigt, riktigt bra ut"
James Montemagno
youtube
"Sonnet 4.5 gör ett riktigt bra jobb... den var mycket snabbare och en hel del bättre"
Cole Medin
youtube
"Jag är helt tagen av Sonnet 4.5... den här designar några helt fantastiska sidor"
Savage Reviews
youtube
"Den terminal-baserade agenten är en 'utvecklare som bor i din terminal'... den kan läsa kodbaser och köra tester autonomt"
DevUser_99
reddit
"Prissättningen förblir densamma som för 3.5, men funktionen 'Checkpoints' gör den värd 10x mer för professionella arbetsflöden"
AgentArchitect
x
"Med 77,2 % på SWE-bench är detta den första modell som faktiskt känns som en Senior Engineer"
HackerNewsReader
hackernews

Videor om Claude Sonnet 4.5

Se handledningar, recensioner och diskussioner om Claude Sonnet 4.5

Anthropic hävdar att detta är 'världens bästa kodmodell' med betydande framsteg inom reasoning, matematik och computer use.

Medan GPT-5 kanske är bättre för planering på hög nivå, är Claude 4.5 Sonnet för närvarande den 'trevligaste' modellen att använda för implementation.

Hastigheten är helt otrolig, vilket får interaktiv kodning att kännas mycket mer flytande.

Den hanterar redigeringar i flera filer med en precisionsnivå vi inte har sett tidigare.

Minskningen av hallucinationer gör den till en pålitlig partner för produktionskod.

Claude Sonnet 4.5 var mycket snabbare och en hel del bättre än GPT-5 Codex.

Den gjorde hela Stripe-implementationen på 15 minuter... mer än två gånger snabbare än Opus 4.1.

Förmågan att följa komplexa instruktioner för tool-calling är dess hemliga recept.

Jag ser färre problem med 'sycophancy' där modellen bara håller med om mina dåliga idéer.

Detta är den första modell jag faktiskt skulle lita på för att köra en terminal-baserad agent utan tillsyn.

Detta är en av de bästa landningssidorna, om inte DEN bästa, jag någonsin sett skapas från en prompt.

Den är ett absolut monster... den designar några helt fantastiska sidor med riktigt, riktigt snygg kod.

Vision-kapaciteten för att tolka UI-design har uppgraderats avsevärt.

Det känns som att den förstår de estetiska kraven, inte bara de tekniska.

Sonnet 4.5 är officiellt det nya riktmärket för kreativ front-end engineering.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips

Experttips for att hjalpa dig fa ut det mesta av denna modell och uppna battre resultat.

Utnyttja CLAUDE.md

Använd en CLAUDE.md-fil i roten av ditt repository för att ge modellen korta sammanfattningar och anvisningar; detta minskar slöseri med tokens med 30 %.

Hybrid Reasoning-reglage

Använd 'thinking'-parametern i dina API-anrop endast för logiktunga uppgifter för att spara latency och kostnader under rutinarbete.

Mappen .claude/context

Skapa en .claude/context.md-fil för att lagra arkitektoniska beslut; modellen är specifikt tränad att prioritera denna sökväg för mappning av kodbasen.

Prompt Caching

Aktivera prompt caching för statisk dokumentation eller stora kodbaser för att spara upp till 90 % av input-kostnaderna för upprepade frågor.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Vanliga fragor

Hitta svar pa vanliga fragor om denna modell