anthropic

Claude Opus 4.5

Claude Opus 4.5 is het krachtigste frontier model van Anthropic, met recordbrekende SWE-bench-prestaties van 80,9% en geavanceerde autonome agency voor coding.

anthropic logoanthropicClaudeNovember 24, 2025
Context
200Ktokens
Max output
64Ktokens
Invoerprijs
$5.00/ 1M
Uitvoerprijs
$25.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
87%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Claude Opus 4.5 scoorde 87% op deze benchmark.
MMLU
90.8%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Claude Opus 4.5 scoorde 90.8% op deze benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Claude Opus 4.5 scoorde 80% op deze benchmark.
IFEval
90%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Claude Opus 4.5 scoorde 90% op deze benchmark.
AIME 2025
37%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Claude Opus 4.5 scoorde 37% op deze benchmark.
MATH
85%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Claude Opus 4.5 scoorde 85% op deze benchmark.
GSM8k
95%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Claude Opus 4.5 scoorde 95% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Claude Opus 4.5 scoorde 92% op deze benchmark.
MathVista
72%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Claude Opus 4.5 scoorde 72% op deze benchmark.
SWE-Bench
80.9%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Claude Opus 4.5 scoorde 80.9% op deze benchmark.
HumanEval
90%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Claude Opus 4.5 scoorde 90% op deze benchmark.
LiveCodeBench
75%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Claude Opus 4.5 scoorde 75% op deze benchmark.
MMMU
80.7%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Claude Opus 4.5 scoorde 80.7% op deze benchmark.
MMMU Pro
60%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Claude Opus 4.5 scoorde 60% op deze benchmark.
ChartQA
90%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Claude Opus 4.5 scoorde 90% op deze benchmark.
DocVQA
94%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Claude Opus 4.5 scoorde 94% op deze benchmark.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Claude Opus 4.5 scoorde 59.3% op deze benchmark.
ARC-AGI
37.6%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Claude Opus 4.5 scoorde 37.6% op deze benchmark.

Over Claude Opus 4.5

Leer over de mogelijkheden van Claude Opus 4.5, functies en hoe het je kan helpen betere resultaten te behalen.

Het hoogtepunt van autonome agency

Claude Opus 4.5 vertegenwoordigt Anthropic's meest significante sprong in frontier-intelligentie, specifiek ontworpen voor de meest complexe taken in software engineering en autonome operaties. Uitgebracht eind 2025, verbrijzelde het records op de SWE-bench Verified benchmark met een score van 80,9%, waarmee het het eerste model is dat effectief grootschalige debugging en systeem-refactoring automatiseert met minimale menselijke tussenkomst.

Intelligentie met een ziel

Naast de technische kracht introduceert Opus 4.5 een verfijnde persona geleid door Anthropic’s "soul document," met de nadruk op diplomatieke eerlijkheid en genuanceerde behulpzaamheid. Dit maakt het model uniek in staat om schrijfstijl en mensgericht ontwerp te begrijpen. Het is geoptimaliseerd voor agentic workflows, met een context window van 200.000 tokens en een gespecialiseerde "effort parameter" waarmee ontwikkelaars reasoning-diepte kunnen afwegen tegen rekenkosten.

Multimodal uitmuntendheid

Als een multimodal krachtpatser blinkt Opus 4.5 uit in vision-gebaseerde taken, van het analyseren van dichte architecturale diagrammen tot het extraheren van data uit complexe documentlay-outs. Het vermogen om in een terminal-native omgeving te navigeren via Claude Code stelt het in staat om systeembrede audits en security-patching uit te voeren, waardoor het een permanente, uiterst bekwame partner is voor professionele engineering-teams.

Claude Opus 4.5

Gebruikscases voor Claude Opus 4.5

Ontdek de verschillende manieren waarop je Claude Opus 4.5 kunt gebruiken voor geweldige resultaten.

Autonomous Engineering

Automatiseert de volledige levenscyclus van GitHub-issues, inclusief reproductie, debugging en testen.

Systeembeheer

Voert autonome server-audits en security-patching uit via directe terminal-interactie.

Architecturale Refactoring

Verwerkt enorme repositories om systeembrede security hardening voor te stellen en te implementeren.

Complexe Document-synthese

Transformeert honderden PDF's van meerdere pagina's in gestructureerde financiële modellen of datavisualisaties.

Creatieve Game-ontwikkeling

Genereert functionele 3D-omgevingen met werkende physics op basis van enkelvoudige, complexe prompts.

Permanente Research-assistent

Vergelijkt enorme datasets om niet-voor-de-hand-liggende tegenstrijdigelijkheden in juridische of technische bestanden te vinden.

Sterke punten

Beperkingen

Recordbrekende Coding: Behaalt 80,9% op SWE-bench Verified en automatiseert complexe software engineering-opdrachten.
Premium Prijsmodel: Met $5/$25 per 1M tokens is het aanzienlijk duurder dan mid-tier modellen.
Superieure Token-efficiëntie: Bereikt frontier-intelligentie met tot wel 76% minder tokens dan Sonnet voor vergelijkbare logica.
Kloof in Wiskunde-benchmarks: Blijft achter bij gespecialiseerde reasoning modellen in wiskunde op wedstrijdniveau, zoals de AIME-test.
Groot 200K Context Window: Verwerkt enorme documentensets en repositories met een hoge retrieval-nauwkeurigheid.
Geen Native Audio/Video: Mist momenteel de mogelijkheid om audio- of videostreams direct te verwerken zonder voorverwerking.
Autonomous Agent Logica: Geoptimaliseerd voor langdurige autonome sessies via terminal-native tools en stop hooks.
Hoge Latency bij uitvoering: Diepe reasoning-taken kunnen aanzienlijke tijd in beslag nemen, soms met sessies van uren voor agents.

API snelstart

anthropic/claude-4.5-opus

Bekijk documentatie
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Claude Opus 4.5

Bekijk wat de community denkt over Claude Opus 4.5

"Elke regel van mijn productiecode is gegenereerd door Claude Code draaiend op Opus 4.5"
Boris Cherny
x
"Opus 4.5 is waar je moet nadenken over schrijfstijl en hoe het klinkt als een mens"
Nate B Jones
youtube
"Intelligentie wordt eindelijk goedkoper; dit model is 3x goedkoper dan de vorige Opus"
BuildwithVignesh
reddit
"Claude Opus 4.5 brak een benchmark door te slim te zijn en een maas in de wet te misbruiken"
MetaKnowing
reddit
"De reasoning-diepte en coding-capaciteiten zijn van een ander niveau vergeleken met al het andere"
Santosh Gupta
x
"De agentic mogelijkheden op de terminal via Claude Code maken het een uitblinker voor devops"
hn_user_alpha
hackernews

Video's over Claude Opus 4.5

Bekijk tutorials, reviews en discussies over Claude Opus 4.5

De prijs is nu drie keer zo goedkoop... $5 voor een miljoen input tokens.

Dit is het beste resultaat dat ik ooit van een model heb gekregen op deze Minecraft-test met een enkele prompt.

Opus 4.5 scoorde hoger dan welke menselijke kandidaat dan ook op dit take-home examen.

De reasoning hier is niet alleen het volgen van instructies; het is het begrijpen van de intentie.

Als je complex architecturaal werk doet, is dit het enige model dat dit betrouwbaar afhandelt.

80,9% op SWE-bench verified... en verbruikt 50% minder tokens dan Sonnet.

Opus 4.5 is specifiek gericht op professionele software engineering, niet op hobby-coding.

Naast SWE-bench boekt het een winst van 15% ten opzichte van Sonnet op Terminal Bench.

Het model is in staat tot langdurige autonome sessies die uren kunnen duren.

Vision-prestaties zijn merkbaar gedetailleerder bij het analyseren van dichte technische diagrammen.

Zie Claude Opus 4.5 als een overtuigingslaag en een absoluut agentic monster.

Veel engineers geven uiteindelijk de voorkeur aan Opus 4.5 vanwege de ergonomie en de harness.

Het model is zich op een out-of-context manier bewust van zijn soul-specificatie.

Opus 4.5 vertoont een niveau van schrijfstijl dat GPT-5.2 simpelweg mist.

Het gebruikt een dynamische effort parameter om de intelligentie te schalen op basis van de taak.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows
Bekijk demo

Pro-tips voor Claude Opus 4.5

Experttips om je te helpen het maximale uit Claude Opus 4.5 te halen en betere resultaten te behalen.

Gebruik High Effort voor Logica

Stel de 'effort' parameter in op 'high' voor complexe architecturale taken om maximale reasoning-diepte te garanderen.

Zet Stop Hooks in

Gebruik gespecialiseerde stop hooks in agentic workflows om het model gedurende meerdere uren te laten draaien en zichzelf te laten corrigeren.

Benut Claude Code

Koppel het model aan de Claude Code CLI-tool om het volledige potentieel voor terminal-native systeemtaken te ontsluiten.

Optimaliseer Token-verbruik

Gebruik Opus 4.5 alleen voor taken met hoge logica, aangezien het een gelijkwaardige kwaliteit levert als Sonnet met tot wel 76% minder tokens.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Veelgestelde vragen over Claude Opus 4.5

Vind antwoorden op veelvoorkomende vragen over Claude Opus 4.5