openai

GPT-5.4

GPT-5.4 is het frontier model van OpenAI met een 1,05M context window en Extreme Reasoning. Het uitblinkt in autonome UI-interactie en data-analyse van lange...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 maart 2026
Context
1.1Mtokens
Max output
128Ktokens
Invoerprijs
$2.50/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
84.2%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. GPT-5.4 scoorde 84.2% op deze benchmark.
HLE
42%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. GPT-5.4 scoorde 42% op deze benchmark.
MMLU
91%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. GPT-5.4 scoorde 91% op deze benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. GPT-5.4 scoorde 76% op deze benchmark.
SimpleQA
56.7%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. GPT-5.4 scoorde 56.7% op deze benchmark.
IFEval
92%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. GPT-5.4 scoorde 92% op deze benchmark.
AIME 2025
100%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. GPT-5.4 scoorde 100% op deze benchmark.
MATH
88.6%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. GPT-5.4 scoorde 88.6% op deze benchmark.
GSM8k
99%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. GPT-5.4 scoorde 99% op deze benchmark.
MGSM
96%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. GPT-5.4 scoorde 96% op deze benchmark.
MathVista
74%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. GPT-5.4 scoorde 74% op deze benchmark.
SWE-Bench
52.8%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. GPT-5.4 scoorde 52.8% op deze benchmark.
HumanEval
85.1%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. GPT-5.4 scoorde 85.1% op deze benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. GPT-5.4 scoorde 72.5% op deze benchmark.
MMMU
84.2%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. GPT-5.4 scoorde 84.2% op deze benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. GPT-5.4 scoorde 61% op deze benchmark.
ChartQA
89%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. GPT-5.4 scoorde 89% op deze benchmark.
DocVQA
94%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. GPT-5.4 scoorde 94% op deze benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. GPT-5.4 scoorde 55% op deze benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. GPT-5.4 scoorde 52.9% op deze benchmark.

Over GPT-5.4

Leer over de mogelijkheden van GPT-5.4, functies en hoe het je kan helpen betere resultaten te behalen.

De Grens van Long-Context Reasoning

GPT-5.4 vertegenwoordigt de krachtige evolutie van de GPT-5-serie, gekenmerkt door zijn toonaangevende 1,05-miljoen-token context window. Dit model is specifiek ontworpen om uitgebreide datasets te verwerken, zoals massale code repositories of historische logs over meerdere jaren, zonder het vermogen tot high-fidelity reasoning te verliezen. Een opvallende functie is de interactieve "Mid-Response Steering," waarmee gebruikers in real-time het denkplan van het model visueel kunnen monitoren en aanpassen, zodat de output perfect aansluit bij complexe intenties met meerdere stappen.

Verenigde Intelligentie en Autonome Actie

Technisch gezien verenigt GPT-5.4 de wereldklasse coding-sterktes van de eerdere Codex-specifieke takken met de creatieve nuances van de standaard GPT-5-serie. Het beschikt over een gespecialiseerde "Thinking"-modus met aanpasbare inspanningsniveaus (Standard, Extended en Heavy) die gebruikmaakt van versterkte chain-of-thought verwerking om wetenschappelijke en logische problemen op PhD-niveau op te lossen. Naast tekst introduceert GPT-5.4 native mogelijkheden voor computergebruik, waarbij een score van 75% wordt behaald op OSWorld-Verified taken door high-fidelity visuele screenshots te interpreteren en klikken op basis van coördinaten uit te voeren.

Efficiëntie en Betrouwbaarheid

OpenAI rapporteert een aanzienlijke afname van 33% in fouten op claimniveau vergeleken met zijn voorgangers, wat GPT-5.4 tot een eerste keuze maakt voor autonome agents en besluitvorming met een hoog risico. Ondanks zijn kracht is het ontworpen voor token- en energie-efficiëntie, waardoor long-context verwerking goedkoper is dan in eerdere iteraties. Of het nu gaat om het beheren van een volledige enterprise codebase of het optreden als een autonome scheduling agent, GPT-5.4 zet een nieuwe standaard voor betrouwbaarheid en agentic prestaties in het landschap van generatieve AI.

GPT-5.4

Gebruikscases voor GPT-5.4

Ontdek de verschillende manieren waarop je GPT-5.4 kunt gebruiken voor geweldige resultaten.

Refactoring van Grote Codebases

Het gelijktijdig inladen en analyseren van honderden bronbestanden om consistentie tussen modules te waarborgen en diepe semantische bugs in volledige repositories te identificeren.

Autonome Agentic Scheduling

Interactie met e-mail en agenda's via visuele grounding om autonoom complexe evenementschema's te coördineren en vervolgcommunicatie te verzenden.

High-Fidelity Architectonisch Ontwerp

Het genereren van complexe 3D-scènes en structurele plannen, zoals functionele metrostations, met gebruik van meer dan 1.000 regels nauwkeurige, voor simulatie geschikte code.

Wetenschappelijke Planning op Lange Termijn

Gebruikmaken van Extreme Reasoning om wetenschappelijke problemen op PhD-niveau op te lossen en meerstapsanalyses uit te voeren die uren aan consistent statusbeheer vereisen.

Onderzoek naar Cybersecurity-incidenten

Het verwerken van enorme hoeveelheden ruwe loggegevens binnen een enkele 1,05M context-sessie om autonoom inbreuken op de beveiliging te identificeren, te onderzoeken en te rapporteren.

Interactieve Mid-Response Steering

Het bijsturen van het model tijdens de interne 'denkfase' om architectonische keuzes of logische paden aan te passen zonder de prompt opnieuw te hoeven starten.

Sterke punten

Beperkingen

Frontier 1,05M Context Window: Biedt toonaangevende capaciteit om over enorme datasets en codebases te redeneren in een enkele prompt zonder onmiddellijk verlies van coherentie.
Degradatie bij Lange Context: De prestaties bij complexe reasoning taken nemen aanzienlijk af zodra de context window de grens van 256K tokens overschrijdt.
Extreme Reasoning Nauwkeurigheid: Behaalt wetenschappelijke kennis op PhD-niveau (84,2% op GPQA) en perfecte scores voor wiskunde (100% op AIME 2025) met de high-effort reasoning modus.
Verwarrend Versienummeringsschema: De complexe line-up van 5.1, 5.2 Thinking, 5.3 Codex en 5.4 varianten zorgt voor een aanzienlijke cognitieve belasting voor API-ontwikkelaars en Chat-gebruikers.
Autonome UI-interactie: State-of-the-art visuele grounding stelt het model in staat om met software en browsers te communiceren met een nauwkeurigheid van 75% op de OSWorld-benchmark.
Hoge Latency in Heavy Mode: De modi met de hoogste reasoning effort kunnen meer dan 8 minuten in beslag nemen voor interne chain-of-thought, wat ze ongeschikt maakt voor real-time interactieve taken.
Token- en Energie-efficiëntie: Ontwikkeld als het meest efficiënte frontier model van OpenAI tot nu toe, waardoor de energiekosten voor complexe reasoning lager zijn in vergelijking met de GPT-5.2 release.
Neurotische Alignment: Agressieve safety fine-tuning kan leiden tot tegendraads gedrag waarbij het model de gebruiker onnodig tegenspreekt over onschadelijke feitelijke onderwerpen.

API snelstart

openai/gpt-5.4

Bekijk documentatie
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyseer dit logbestand van 1,05 miljoen tokens op beveiligingsrisico's." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over GPT-5.4

Bekijk wat de community denkt over GPT-5.4

GPT-5 maakt een meedogenloze comeback... elke regel code die het genereerde werkte volledig.
immortalsol
reddit
De belangrijkste feature is natuurlijk de 1M context window, vergeleken met de ~200k die andere modellen ondersteunen.
Developer
hackernews
Wauw, GPT 5.4 is krankzinnig goed. Het zou een grote sprong naar 6.0 moeten zijn. Ongelooflijk dat Codex zo ver is gekomen.
Rahul Sood
twitter
GPT-5.4 scoort extra hoog met 94,0 op NYT Connections. Het heeft dingen gewoon in één keer goed.
senko
hackernews
GPT-5.4 staat nu op de Artificial Analysis Intelligence Index... Gelijk met Gemini 3.1 Pro.
AiBattle
twitter
De diepgang van de reasoning is eindelijk op het niveau waar het architecturale problemen op enterpriseniveau aankan.
CloudArchitect99
reddit

Video's over GPT-5.4

Bekijk tutorials, reviews en discussies over GPT-5.4

Een context window van 1 miljoen 50.000 tokens... dit is een zeer lange context window.

Na 5 minuten en 22 seconden denken ontvingen we ons resultaat... het testte dit meer op een agentic manier.

De verbetering van het vermogen om naar high-fidelity afbeeldingen te kijken... tot 10,24 miljoen totale pixels.

Het model voert daadwerkelijk onderzoek uit op het web om zijn eigen logica te verifiëren.

Dit is een enorme sprong voor agentic workflows waar de status behouden moet blijven.

GPT 5.4 heeft alles... ze zeiden eigenlijk, oké, 5.2 en GPT 5.3 Codex, ga je gang en krijg een baby.

De coding-capaciteiten zijn belachelijk. Het is in wezen foutloos.

De smaak op het gebied van front-end ligt ver achter op Opus 4.6 en Gemini 3.1 Pro.

Het voelt alsof het een veel beter begrip heeft van genuanceerde intenties van ontwikkelaars.

De prijs is competitief gezien de 1M token window-grootte.

Het zet duidelijk druk op OpenAI om te reageren met een model dat die 1 miljoen context-capaciteit evenaart.

Het feit dat dit model in één poging deze Minecraft-kloon kan maken, is gewoon opmerkelijk.

We zien een vermindering van 33 procent in het aantal feitelijke hallucinaties.

De reasoning-modi zijn onderverdeeld in de niveaus Standard, Extended en Heavy.

De visuele grounding op de OSWorld-benchmark is momenteel toonaangevend in de sector.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor GPT-5.4

Experttips om je te helpen het maximale uit GPT-5.4 te halen en betere resultaten te behalen.

Wissel tussen Reasoning Effort

Gebruik Standard, Extended of Heavy reasoning effort afhankelijk van de complexiteit van de taak om de rekenkosten en de kwaliteit van de output in balans te houden.

Monitor het Upfront Plan

Let bij het gebruik van de Thinking-variant op het vooraf opgestelde plan; je kunt halverwege de generatie ingrijpen als het voorgestelde logische pad van het model gebrekkig lijkt.

Strategische Prompt Caching

Plaats grote, statische context-blokken aan het begin van je prompt om te profiteren van de automatische prompt caching van OpenAI voor kostenbesparingen.

Beheer Context-stabiliteit

Hoewel de 1,05M window robuust is, wordt gemeld dat de prestaties het meest stabiel zijn binnen de eerste 256K tokens; houd kritieke samenvattingen dicht bij het einde van de prompt.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Veelgestelde vragen over GPT-5.4

Vind antwoorden op veelvoorkomende vragen over GPT-5.4