anthropic

Claude Sonnet 4.5

Anthropics Claude 4.5 Sonnet leverer verdensførende kodning (77,2% SWE-bench) og et 200K context window, optimeret til næste generation af autonome agenter.

AI-kodningAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 429. september 2025
Kontekst
200Ktokens
Maks output
64Ktokens
Input-pris
$3.00/ 1M
Output-pris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
83%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Claude Sonnet 4.5 scorede 83% på denne benchmark.
HLE
34%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Claude Sonnet 4.5 scorede 34% på denne benchmark.
MMLU
89%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Claude Sonnet 4.5 scorede 89% på denne benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Claude Sonnet 4.5 scorede 78% på denne benchmark.
SimpleQA
52%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Claude Sonnet 4.5 scorede 52% på denne benchmark.
IFEval
88%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Claude Sonnet 4.5 scorede 88% på denne benchmark.
AIME 2025
87%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Claude Sonnet 4.5 scorede 87% på denne benchmark.
MATH
87%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Claude Sonnet 4.5 scorede 87% på denne benchmark.
GSM8k
98%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Claude Sonnet 4.5 scorede 98% på denne benchmark.
MGSM
92%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Claude Sonnet 4.5 scorede 92% på denne benchmark.
MathVista
72%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Claude Sonnet 4.5 scorede 72% på denne benchmark.
SWE-Bench
77%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Claude Sonnet 4.5 scorede 77% på denne benchmark.
HumanEval
94%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Claude Sonnet 4.5 scorede 94% på denne benchmark.
LiveCodeBench
68%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Claude Sonnet 4.5 scorede 68% på denne benchmark.
MMMU
78%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Claude Sonnet 4.5 scorede 78% på denne benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Claude Sonnet 4.5 scorede 55% på denne benchmark.
ChartQA
89%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Claude Sonnet 4.5 scorede 89% på denne benchmark.
DocVQA
92%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Claude Sonnet 4.5 scorede 92% på denne benchmark.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Claude Sonnet 4.5 scorede 50% på denne benchmark.
ARC-AGI
14%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Claude Sonnet 4.5 scorede 14% på denne benchmark.

Prøv Claude Sonnet 4.5 gratis

Chat med Claude Sonnet 4.5 gratis. Test dens muligheder, stil spørgsmål og udforsk, hvad denne AI-model kan.

Prompt
Svar
Claude Sonnet 4.5

Dit AI-svar vil vises her

Om Claude Sonnet 4.5

Lær om Claude Sonnet 4.5s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

**Frontieren for Agentic Intelligence**

Claude Sonnet 4.5 repræsenterer Anthropics mest betydningsfulde spring i "frontier intelligence", specifikt optimeret til æraen for autonome AI-agenter. Udgivet i slutningen af 2025, er det branchens første ægte "hybrid reasoning"-model, der giver udviklere mulighed for at skifte mellem højhastighedseksekvering til rutineopgaver og extended thinking til komplekse logiske udfordringer. Den overgik især tidligere benchmarks inden for computer-use og tool-orkestrering, hvilket gør den til den foretrukne motor til terminal-baserede agenter og softwareudvikling over flere filer.

**Præcision og færre hallucinationer**

Modellen er bygget på en arkitektur, der prioriterer "mål to gange, klip én gang"-logik, hvilket reducerer sycophancy og hallucinationer betydeligt i forhold til 3.5-serien. Med en massiv 64.000-token output-grænse og et 200.000-token input-vindue kan den indlæse hele repositories, mens den genererer applikationsfiler i fuld længde i én arbejdsgang. Den introducerer også indfødte "checkpoints" til agentic-workflows, hvilket giver agenter mulighed for at rulle tilbage og rette deres egne fejl autonomt.

**Multimodal og Reasoning-styrke**

Udover kodning dominerer Sonnet 4.5 inden for multimodal dokumentanalyse og kompleks finansiel modellering. Dens interne logik er trænet til at prioritere arkitektonisk kontekst, hvilket gør det muligt for den at kortlægge store codebases bedre end nogen forgænger. Uanset om det drejer sig om behandling af håndskrevne noter eller implementering af en fuld Stripe-integration, opretholder Sonnet 4.5 et højt niveau af faktuel nøjagtighed og instruktionsfølgelse.

Claude Sonnet 4.5

Anvendelser for Claude Sonnet 4.5

Opdag de forskellige måder, du kan bruge Claude Sonnet 4.5 til at opnå gode resultater.

Autonom softwareudvikling

Brug Claude Sonnet 4.5 til at navigere i komplekse codebases, implementere funktioner på tværs af flere filer og køre test uafhængigt.

Computer-Use-agenter

Implementer modellen til at styre skriveborde og webbrowsere til dataudtrækning, navigation i legacy-systemer eller gentagne administrative opgaver.

Enterprise Agentic Search

Orkestrer søgeforespørgsler i flere trin og syntetisér uensartede oplysninger fra intern dokumentation og det live web.

Kompleks finansiel modellering

Udnyt dens 87% AIME-score til at udføre dybe logiske deduktioner på finansielle rapporter og markedsdata.

Forfinelse af teknisk indhold

Konverter krav på højt niveau til professionelle PRD'er, tekniske specifikationer og codebases, der er klar til brug.

Multimodal dokumentanalyse

Behandl tusindvis af sider med diagrammer, håndskrevne noter og tekniske tegninger med state-of-the-art vision-funktioner.

Styrker

Begrænsninger

Agentic kodningskraft: Har i øjeblikket verdensrekorden på SWE-bench Verified med en succesrate på 77,2% på reelle GitHub-issues.
Forbrugsbegrænsninger: Professionelle brugere rapporterer ofte, at de hurtigt når de ugentlige forbrugsgrænser på $20/måned Pro-planen.
Utrolig hastighed: Opererer med 40-60 tokens i sekundet, hvilket gør den betydeligt hurtigere end tidligere frontier-modeller til interaktiv brug.
Søgelatens: Agentic webbrowsing (BrowseComp) er fortsat et svagt punkt sammenlignet med specialiserede søgemodeller.
Hybrid Reasoning-fleksibilitet: Den første model, der effektivt balancerer "fast chat"-tilstand med "extended thinking" til komplekse logiske kæder.
Mangler i nicheviden: Har udfordringer med højt specialiserede visuelle opgaver, såsom at identificere specifikke skateboard-tricks (29% nøjagtighed på SkateBench).
Massivt output-vindue: En grænse på 64K output tokens tillader generering af hele funktioner over flere filer i et enkelt API-kald.
Agentic-omkostninger: At køre modellen autonomt i terminal-tilstand kan forbruge for $50-$100 i tokens for en enkelt kompleks app-opbygningssession.

API hurtig start

anthropic/claude-sonnet-4.5

Se dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Claude Sonnet 4.5

Se hvad fællesskabet mener om Claude Sonnet 4.5

"Claude Sonnet 4.5 er den nye konge af AI-kodning... det ser virkelig, virkelig godt ud"
James Montemagno
youtube
"Sonnet 4.5 gør et rigtig godt stykke arbejde... den var meget hurtigere og en god del bedre"
Cole Medin
youtube
"Jeg er blæst bagover af Sonnet 4.5... denne her designer nogle helt fantastiske sider"
Savage Reviews
youtube
"Den terminal-baserede agent er en 'udvikler, der bor i din terminal'... den kan læse codebases og køre test autonomt"
DevUser_99
reddit
"Prisen er den samme som 3.5, men 'Checkpoints'-funktionen gør den 10 gange mere værd til professionelle workflows"
AgentArchitect
x
"Med 77,2% på SWE-bench er dette den første model, der faktisk føles som en Senior Engineer"
HackerNewsReader
hackernews

Videoer om Claude Sonnet 4.5

Se vejledninger, anmeldelser og diskussioner om Claude Sonnet 4.5

Anthropic hævder, at dette er 'den bedste kodemodel i verden' med betydelige fremskridt inden for reasoning, matematik og computer-use.

Mens GPT-5 måske er bedre til planlægning på højt niveau, er Claude 4.5 Sonnet i øjeblikket den 'bedste' model at bruge til implementering.

Hastigheden er bare utrolig, hvilket får interaktiv kodning til at føles meget mere flydende.

Den håndterer redigeringer i flere filer med et præcisionsniveau, vi ikke har set før.

Reduktionen i hallucinationer gør den til en pålidelig partner til produktionskode.

Claude Sonnet 4.5 var meget hurtigere og en god del bedre end GPT-5 Codex.

Den lavede hele Stripe-implementeringen på 15 minutter... mere end dobbelt så hurtigt som Opus 4.1.

Evnen til at følge komplekse tool-calling-instruktioner er dens hemmelige ingrediens.

Jeg ser færre 'sycophancy'-problemer, hvor modellen blot giver mig ret i mine dårlige idéer.

Dette er den første model, jeg faktisk ville stole på til at køre en terminal-baseret agent uden opsyn.

Dette er en af de bedste landing pages, hvis ikke DEN bedste landing page, jeg nogensinde har set skabt ud fra et prompt.

Det er et absolut monster... den designer nogle helt fantastiske sider med virkelig, virkelig lækker kode.

Vision-funktionerne til fortolkning af UI-design er betydeligt opgraderet.

Det føles som om den forstår de æstetiske krav, ikke kun de tekniske.

Sonnet 4.5 er officielt det nye benchmark for kreativ front-end engineering.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange
Se demovideo

Pro-tips

Eksperttips til at hjælpe dig med at få mest muligt ud af denne model og opnå bedre resultater.

Udnyt CLAUDE.md

Brug en CLAUDE.md-fil i din repository-rod for at give modellen korte resuméer og henvisninger; dette reducerer token-spild med 30%.

Hybrid Reasoning-skift

Brug 'thinking'-parameteren i dine API-kald kun til logiktunge opgaver for at spare på latency og omkostninger under rutineoperationer.

Mappen .claude/context

Opret en .claude/context.md-fil til at gemme arkitektoniske beslutninger; modellen er specifikt trænet til at prioritere denne sti til kortlægning af codebase.

Prompt Caching

Aktivér prompt caching for statisk dokumentation eller store codebases for at spare op til 90% på input-omkostninger ved gentagne forespørgsler.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Ofte stillede spørgsmål

Find svar på almindelige spørgsmål om denne model