openai

GPT-5.1

GPT-5.1 is OpenAI’s geavanceerde reasoning flagship met adaptief denken, native multimodaliteit en state-of-the-art prestaties in wiskunde en technische...

openai logoopenaiGPT-512 november 2025
Context
400Ktokens
Max output
128Ktokens
Invoerprijs
$1.25/ 1M
Uitvoerprijs
$10.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
88.1%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. GPT-5.1 scoorde 88.1% op deze benchmark.
HLE
32.5%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. GPT-5.1 scoorde 32.5% op deze benchmark.
MMLU
90.2%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. GPT-5.1 scoorde 90.2% op deze benchmark.
MMLU Pro
81%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. GPT-5.1 scoorde 81% op deze benchmark.
SimpleQA
52%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. GPT-5.1 scoorde 52% op deze benchmark.
IFEval
91%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. GPT-5.1 scoorde 91% op deze benchmark.
AIME 2025
94%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. GPT-5.1 scoorde 94% op deze benchmark.
MATH
91%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. GPT-5.1 scoorde 91% op deze benchmark.
GSM8k
98.5%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. GPT-5.1 scoorde 98.5% op deze benchmark.
MGSM
95%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. GPT-5.1 scoorde 95% op deze benchmark.
MathVista
75%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. GPT-5.1 scoorde 75% op deze benchmark.
SWE-Bench
76.3%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. GPT-5.1 scoorde 76.3% op deze benchmark.
HumanEval
92.5%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. GPT-5.1 scoorde 92.5% op deze benchmark.
LiveCodeBench
74%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. GPT-5.1 scoorde 74% op deze benchmark.
MMMU
85.4%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. GPT-5.1 scoorde 85.4% op deze benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. GPT-5.1 scoorde 62% op deze benchmark.
ChartQA
89%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. GPT-5.1 scoorde 89% op deze benchmark.
DocVQA
93%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. GPT-5.1 scoorde 93% op deze benchmark.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. GPT-5.1 scoorde 58% op deze benchmark.
ARC-AGI
12%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. GPT-5.1 scoorde 12% op deze benchmark.

Over GPT-5.1

Leer over de mogelijkheden van GPT-5.1, functies en hoe het je kan helpen betere resultaten te behalen.

Reasoning Architectuur

GPT-5.1 beschikt over een System 2 thinking architectuur. Hiermee kan het model zijn verwerkingstijd aanpassen op basis van de complexiteit van de vraag. Voor wiskundige bewijzen past het diepe logische deducties toe, terwijl eenvoudige conversatietaken een lage latency behouden. Het adaptieve reasoning systeem zorgt ervoor dat rekenkracht wordt toegewezen waar het de meeste waarde biedt.

Multimodal prestaties

Het model gebruikt een omni multimodal framework voor tekst- en vision-inputs. Het biedt 84% lagere latency bij enterprise documentextractietaken in vergelijking met zijn voorganger. Verbeterde retentie zorgt ervoor dat de context behouden blijft tijdens lange agentic workflows, waardoor het geschikt is voor grootschalige software engineering projecten.

Personalisatiesystemen

Een nieuwe engine maakt toon- en eigenschapssturing mogelijk. Gebruikers kunnen het model configureren om professioneel, informeel of expressief te zijn via expliciete systeeminstructies. Met deze eigenschappen kunnen ontwikkelaars bots inzetten die beter aansluiten bij specifieke merkidentiteiten en gebruikersvoorkeuren zonder uitgebreide few-shot prompting.

GPT-5.1

Gebruikscases voor GPT-5.1

Ontdek de verschillende manieren waarop je GPT-5.1 kunt gebruiken voor geweldige resultaten.

Agentic Software Engineering

Het model automatiseert complexe refactors in grote codebases met behulp van high-accuracy reasoning.

PhD-niveau onderzoek

Het lost ingewikkelde problemen in de biologie en natuurkunde op die geverifieerde deducties in meerdere stappen vereisen.

Enterprise documentanalyse

Het systeem extraheert gestructureerde data uit enorme sets tabeldocumenten met hoge visuele precisie.

Gepersonaliseerde klantenservice

Ontwikkelaars zetten bots in met specifieke merkeigenschappen, zoals eigenzinnig of professioneel, om aan te sluiten bij het sentiment van de gebruiker.

Wiskundige probleemoplossing

Het model gebruikt zijn 99,6% AIME-scores om bewijzen te verifiëren en studenten te begeleiden in gevorderde wiskunde.

Vision-gebaseerde Business Intelligence

Het analyseert complexe grafieken en financiële rapporten om executive summaries met visuele context te genereren.

Sterke punten

Beperkingen

Elite wiskundige reasoning: Het model behaalde een score van 99,6% op de AIME 2025 en presteerde daarmee beter dan bijna alle voorgaande concurrerende modellen.
Hoge output latency: Reasoning met hoge inspanning kan de responstijden voor complexe vragen verlengen tot meer dan 20 seconden.
Adaptieve verwerking: Dynamische compute-schaling vermindert de latency met 84% bij eenvoudige enterprise documenttaken.
Geen native audio: Het mist de ingebouwde speech-to-speech mogelijkheden zoals die bij concurrenten als Gemini 2.0 worden gevonden.
Verbeterde persoonlijkheidscontrole: Native toonsturing zorgt ervoor dat interacties warmer en menselijker aanvoelen dan bij de originele GPT-5.
Output prijzen: Met $10 per miljoen tokens zijn de kosten voor long-form reasoning outputs aanzienlijk hoger dan bij instant modellen.
Large Scale context: Een 400.000 token window in combinatie met 24-uurs caching maakt massale agentic workflows mogelijk.
Hardnekkige stilistische eigenaardigheden: Gebruikers melden dat het model nog steeds moeite heeft om specifieke interpunctiepatronen te vermijden, ondanks expliciete geheugeninstructies.

API snelstart

openai/gpt-5.1

Bekijk documentatie
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over GPT-5.1

Bekijk wat de community denkt over GPT-5.1

GPT-5.1 etc in Codex is still the best reviewer for planning and code review tasks.
darrenjr
twitter
Our evals found GPT-5 performed up to 190% better than other leading models in complex reasoning.
CodeRabbit
twitter
GPT-5.1 is better calibrated to prompt difficulty, consuming far fewer tokens on easy inputs.
Tech Titans
facebook
This release is all about the personality and making ChatGPT feel less clinical and sterile.
Theo
youtube
The 400k context window is a lifesaver for our entire repo analysis.
RedditUser99
reddit
Still no native audio is a bummer, but the reasoning gains are real.
HackerNewsGuy
hackernews

Video's over GPT-5.1

Bekijk tutorials, reviews en discussies over GPT-5.1

GPT 5.1 is here. It is faster. It is more accurate. It is more conversational.

For the first time, GPT 5.1 Instant can use adaptive reasoning to decide when to think.

The logic here is significantly better than the standard GPT 5 model.

It manages to maintain a warmer tone than we saw in the previous preview versions.

If you are a developer, the extended prompt caching is going to save you a ton of money.

It's even more personalizable than ever before.

The tone sounds a lot more natural... 5.1 is much better for energy.

I noticed it doesn't hallucinate as much during complex workflow steps.

The speed of the instant mode is almost equivalent to GPT 4o mini but with more smarts.

Personalization features mean you can actually tell it to stop being so formal.

This is probably one of the most relaxed iterative updates to a Frontier AI model.

It produced a successful bumper car game result compared to GPT5 thinking.

The vision processing on handwritten documents is noticeably sharper.

I think the reasoning effort toggle is the best feature for managing API costs.

It finally feels like a model you can talk to without it sounding like a textbook.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor GPT-5.1

Experttips om je te helpen het maximale uit GPT-5.1 te halen en betere resultaten te behalen.

Pas Reasoning Effort aan

Gebruik de reasoning_effort parameter om het denkniveau op high te zetten voor wiskunde, maar op none voor eenvoudige chats om latency te besparen.

Benut de grote context

Gebruik de 400k context window voor volledige projectmappen, aangezien het model informatie goed vasthoudt in lange prompts.

Toonsturing

Activeer toon-eigenschappen in je systeeminstructies om het model minder klinisch en meer als een teamlid te laten klinken.

Prompt Caching

Maak gebruik van 24-uurs prompt caching om kosten te verlagen bij het uitvoeren van repetitieve agentic loops op dezelfde codebase.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Veelgestelde vragen over GPT-5.1

Vind antwoorden op veelvoorkomende vragen over GPT-5.1