anthropic

Claude Sonnet 4.5

Anthropic's Claude Sonnet 4.5 biedt toonaangevende coding-prestaties (77,2% SWE-bench) en een 200K context window, geoptimaliseerd voor de volgende generatie...

AI CodingAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29 september 2025
Context
200Ktokens
Max output
64Ktokens
Invoerprijs
$3.00/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImageAudioVideo
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
83%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Claude Sonnet 4.5 scoorde 83% op deze benchmark.
HLE
34%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Claude Sonnet 4.5 scoorde 34% op deze benchmark.
MMLU
89%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Claude Sonnet 4.5 scoorde 89% op deze benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Claude Sonnet 4.5 scoorde 78% op deze benchmark.
SimpleQA
52%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Claude Sonnet 4.5 scoorde 52% op deze benchmark.
IFEval
88%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Claude Sonnet 4.5 scoorde 88% op deze benchmark.
AIME 2025
87%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Claude Sonnet 4.5 scoorde 87% op deze benchmark.
MATH
87%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Claude Sonnet 4.5 scoorde 87% op deze benchmark.
GSM8k
98%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Claude Sonnet 4.5 scoorde 98% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Claude Sonnet 4.5 scoorde 92% op deze benchmark.
MathVista
72%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Claude Sonnet 4.5 scoorde 72% op deze benchmark.
SWE-Bench
77%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Claude Sonnet 4.5 scoorde 77% op deze benchmark.
HumanEval
94%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Claude Sonnet 4.5 scoorde 94% op deze benchmark.
LiveCodeBench
68%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Claude Sonnet 4.5 scoorde 68% op deze benchmark.
MMMU
78%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Claude Sonnet 4.5 scoorde 78% op deze benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Claude Sonnet 4.5 scoorde 55% op deze benchmark.
ChartQA
89%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Claude Sonnet 4.5 scoorde 89% op deze benchmark.
DocVQA
92%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Claude Sonnet 4.5 scoorde 92% op deze benchmark.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Claude Sonnet 4.5 scoorde 50% op deze benchmark.
ARC-AGI
14%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Claude Sonnet 4.5 scoorde 14% op deze benchmark.

Over Claude Sonnet 4.5

Leer over de mogelijkheden van Claude Sonnet 4.5, functies en hoe het je kan helpen betere resultaten te behalen.

**De grens van Agentic Intelligence**

Claude 4.5 Sonnet vertegenwoordigt een grote vooruitgang in frontier intelligence, geoptimaliseerd voor het tijdperk van autonome AI-agents. Het model is uitgebracht eind 2025 en is een hybrid reasoning-model waarmee ontwikkelaars kunnen schakelen tussen snelle uitvoering voor routinetaken en extended thinking voor complexe logische uitdagingen. Het leidt de benchmarks in computer use en tool-orkestratie, waardoor het een favoriete engine is voor terminal-gebaseerde agents en software engineering met meerdere bestanden.

**Precisie en verminderde hallucinaties**

De modelarchitectuur geeft prioriteit aan logica en precisie, waardoor de vleierij en hallucinaties die in eerdere series werden waargenomen, worden verminderd. Met een outputlimiet van 64.000 token en een input window van 200.000 token, kan het volledige repositories verwerken en tegelijkertijd complete applicatiebestanden genereren in één pass. Het introduceert native checkpoints voor agentic workflows, waardoor systemen fouten autonoom kunnen terugdraaien en corrigeren zonder menselijke tussenkomst.

**Multimodale en reasoning-kracht**

Naast softwareontwikkeling blinkt Sonnet 4.5 uit in multimodale documentanalyse en financiële modellering. De interne logica geeft prioriteit aan architecturale context, waardoor het in staat is om grootschalige systemen effectiever in kaart te brengen dan zijn voorgangers. Of het nu gaat om het verwerken van handgeschreven notities of het implementeren van API-integraties, het model behoudt een hoge feitelijke nauwkeurigheid en strikte naleving van instructies tijdens langlopende taken.

Claude Sonnet 4.5

Gebruikscases voor Claude Sonnet 4.5

Ontdek de verschillende manieren waarop je Claude Sonnet 4.5 kunt gebruiken voor geweldige resultaten.

Autonome Software Engineering

Het beheren van end-to-end ontwikkeling, van initiële vereisten tot geautomatiseerde commits via terminal-interfaces.

GUI-gebaseerde automatisering

Het automatiseren van webbrowsing en gegevensinvoer in legacy-applicaties met behulp van native computer use-mogelijkheden.

Multi-agent orkestratie

Het delegeren van gespecialiseerde taken aan sub-agents, zoals reviewers en builders, binnen een centrale planningslus.

Complexe code refactoring

Het herontwerpen van codebases met meerdere bestanden, waarbij consistentie behouden blijft over 200.000 tokens aan actieve context.

Genuanceerde financiële analyse

Het analyseren van kwartaalrapporten en spreadsheets met vision om discrepanties en investeringsinzichten te identificeren.

Interactieve datavisualisatie

Het genereren van dynamische grafieken uit complexe datasets met behulp van embedded code-executie en real-time opbouw.

Sterke punten

Beperkingen

Native Computer Use: Het model communiceert met besturingssystemen via cursorbewegingen en GUI-manipulatie met een nauwkeurigheid van 61,4 procent.
Geen native audio-input: Het model kan audiobestanden niet direct als een native modaliteit verwerken en vereist externe transcriptietools.
Elite prestaties bij coderen: Het behaalt 77,2 procent op SWE-bench Verified en presteert hiermee beter dan alle andere modellen bij het oplossen van GitHub-issues.
Kosten voor reasoning tokens: Tokens die worden gebruikt tijdens interne extended thinking worden gefactureerd als output tokens, wat de kosten voor complexe zoekopdrachten verhoogt.
Taakhorizon van 30 uur: De architectuur maakt 30 uur aan continu autonoom werk mogelijk met behoud van state en focus.
Latentie in Thinking Mode: Wanneer extended thinking is ingeschakeld, kan het model er enkele minuten over doen om complexe architecturale plannen te verwerken.
64K Outputlimiet: De enorme outputcapaciteit maakt het genereren van volledige applicatiearchitecturen in één API-aanroep mogelijk.
Variantie in competitieve wiskunde: Hoewel het toonaangevend is in coderen, loopt het soms achter op gespecialiseerde reasoning-modellen in specifieke benchmarks voor competitief programmeren.

API snelstart

anthropic/claude-4-5-sonnet

Bekijk documentatie
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Claude Sonnet 4.5

Bekijk wat de community denkt over Claude Sonnet 4.5

Claude 4.5 Sonnet is vandaag overal beschikbaar, het beste coding model ter wereld.
ClaudeOfficial
reddit
Dit lost een van de meest pijnlijke schaalproblemen op met MCP-setups. Ik zag de context verdampen voordat het eigenlijke werk begon.
Simon Willison
twitter
Claude Code-Sonnet 4.5 loopt ver voor op Gemini 3.0 Pro voor complexe Dockerized refactoring-taken.
Comfortable-Friend96
reddit
Het patroon: Fouten worden documentatie. Je voegt een regel toe aan CLAUDE.md en het gebeurt nooit meer.
Boris Cherny
twitter
De hybrid reasoning-modus is een levensredder voor het debuggen van complexe async-logica waar normale modellen blijven hangen.
AsyncDev
hackernews
Prijsgelijkheid met 3.5 Sonnet maakt dit een eenvoudige upgrade voor al onze productie-agent-pijplijnen.
StartupFounder2025
reddit

Video's over Claude Sonnet 4.5

Bekijk tutorials, reviews en discussies over Claude Sonnet 4.5

Dit nieuwe 4.5 Sonnet model presteert zelfs beter dan Opus 4.1 op de SWE-bench verified test

Het was in staat om 30 uur lang de focus te behouden op complexe taken met meerdere stappen

Het voert de OSWorld computer use benchmark aan met een score van 61,4 procent

De interne reasoning engine verwerkt Python-omgevingen veel stabieler dan 3.5

De terminal-integratie voelt veel strakker aan met bijna nul gehallucineerde shell-commando's

Sonnet 4.5 is nu toonaangevend in agentic tool use... een sprong van 20 procent, wat erg opwindend is

Claude code met Sonnet 4.5 voltooide de volledige Stripe-implementatie in 15 minuten

Claude Sonnet 4.5 was veel sneller en aanzienlijk beter

De thinking-toggle stelt je in staat om meer rekenkracht in te zetten voor specifieke codeblokken

Het behoudt context perfect, zelfs als je 150.000 tokens diep in een massief project zit

Het is het best presterende model ooit wanneer het je computer bestuurt

Daling in foutenpercentages voor coderen van 9 procent naar vrijwel nul

Claude imagine is misschien wel de gaafste functie... een real-time app-bouwervaring

De MCP-integratie stelt het in staat om tools te doorzoeken zonder je prompt-context op te eten

De latentie van vision is aanzienlijk verminderd bij het analyseren van complexe UI-lay-outs

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Claude Sonnet 4.5

Experttips om je te helpen het maximale uit Claude Sonnet 4.5 te halen en betere resultaten te behalen.

Schakel MCP Tool Search in

Gebruik Model Context Protocol Tool Search om het contextgebruik met 85 procent te verminderen en ruimte over te laten voor actieve bestanden.

Benut Agentic Checkpoints

Gebruik het /checkpoint-commando in terminal-interfaces om de voortgang op te slaan vóór grote refactors voor een onmiddellijke rollback.

Context Budgeting

Wis de geschiedenis tussen ongerelateerde taken om 'context rot' te voorkomen en een hoge logische nauwkeurigheid te behouden.

System Prompt Hiërarchie

Definieer de model-persona en strikte outputbeperkingen in een specifiek configuratiebestand voor consistentie tussen verschillende agents.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Veelgestelde vragen over Claude Sonnet 4.5

Vind antwoorden op veelvoorkomende vragen over Claude Sonnet 4.5