openai

GPT-5.2

GPT-5.2 er OpenAI's flagship model til professionelle opgaver, med et 400K context window, elite-kodning og dybe multi-step reasoning-evner.

openai logoopenaiGPT-511. december 2025
Kontekst
400Ktokens
Maks output
100Ktokens
Input-pris
$1.75/ 1M
Output-pris
$14.00/ 1M
Modalitet:TextImage
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
93%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). GPT-5.2 scorede 93% på denne benchmark.
HLE
45%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. GPT-5.2 scorede 45% på denne benchmark.
MMLU
88%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. GPT-5.2 scorede 88% på denne benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. GPT-5.2 scorede 83% på denne benchmark.
SimpleQA
58%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. GPT-5.2 scorede 58% på denne benchmark.
IFEval
95%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. GPT-5.2 scorede 95% på denne benchmark.
AIME 2025
100%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. GPT-5.2 scorede 100% på denne benchmark.
MATH
98%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. GPT-5.2 scorede 98% på denne benchmark.
GSM8k
99%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. GPT-5.2 scorede 99% på denne benchmark.
MGSM
98%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. GPT-5.2 scorede 98% på denne benchmark.
MathVista
78%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. GPT-5.2 scorede 78% på denne benchmark.
SWE-Bench
80%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. GPT-5.2 scorede 80% på denne benchmark.
HumanEval
95%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. GPT-5.2 scorede 95% på denne benchmark.
LiveCodeBench
80%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. GPT-5.2 scorede 80% på denne benchmark.
MMMU
75%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. GPT-5.2 scorede 75% på denne benchmark.
MMMU Pro
65%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. GPT-5.2 scorede 65% på denne benchmark.
ChartQA
93%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. GPT-5.2 scorede 93% på denne benchmark.
DocVQA
95%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. GPT-5.2 scorede 95% på denne benchmark.
Terminal-Bench
60%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. GPT-5.2 scorede 60% på denne benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. GPT-5.2 scorede 52.9% på denne benchmark.

Prøv GPT-5.2 gratis

Chat med GPT-5.2 gratis. Test dens muligheder, stil spørgsmål og udforsk, hvad denne AI-model kan.

Prompt
Svar
openai/gpt-5.2

Dit AI-svar vil vises her

Om GPT-5.2

Lær om GPT-5.2s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Elite professionel reasoning

GPT-5.2 repræsenterer OpenAI's frontier model inden for professionel kunstig intelligens, specifikt udviklet til komplekst vidensarbejde og autonom opgaveudførelse. Den blev udgivet i slutningen af 2025 og introducerer en dedikeret Thinking mode, der giver modellen mulighed for at pause og planlægge multi-step logik, hvilket gør den usædvanligt dygtig til indviklet softwareudvikling, avancerede matematiske beviser og videnskabelig analyse. Denne model-arkitektur integrerer multimodal vision og tool-calling i en samlet reasoning-motor, hvilket gør det muligt for den at fungere som en agentic partner i professionelle workflows.

Skalerbar intelligens-arkitektur

Teknisk set har GPT-5.2 et brancheførende 400K context window med næsten 100 % recall-nøjagtighed, hvilket gør det muligt for den at behandle massive codebases eller tætte tekniske manualer uden at miste information. Selvom den udmærker sig ved nøjagtighed og pålidelighed – med en reduktion af hallucinationer på 30 % sammenlignet med tidligere iterationer – vedtager denne model en mere formel og struktureret samtaletone. Den er optimeret til enterprise-miljøer, hvor konsistens og præcision prioriteres over kreative finesser, hvilket markerer et skift mod AI som en pålidelig vidensarbejder.

GPT-5.2

Anvendelser for GPT-5.2

Opdag de forskellige måder, du kan bruge GPT-5.2 til at opnå gode resultater.

Autonom softwareudvikling

Løsning af komplekse GitHub-issues og styring af debugging i store codebases med 80 % nøjagtighed.

Avanceret finansiel research

Udførelse af dyb fundamental aktieanalyse og syntese af markedstendenser ved hjælp af integrerede agentic værktøjer.

Multi-step forretningsautomatisering

Orkestrering af komplekse workflows på tværs af forbundne produktivitetsapps som Notion, Slack og Google Drive.

Syntese af tekniske dokumenter

Behandling og opsummering af massive tekniske dokumenter ved hjælp af dens 400K context window.

Videnskabelig matematisk reasoning

Løsning af videnskab på PhD-niveau og matematik på konkurrenceniveau gennem specialiseret Thinking mode.

Professionel indholdsgenerering

Produktion af højkvalitets prosa i operastil og formaterede professionelle rapporter i stor skala.

Styrker

Begrænsninger

Elite-kodningsevner: Dens 80 % score på SWE-bench Verified gør den til en af de mest kapable modeller til professionel softwareudvikling.
Problemer med vision-latency: Billedopfattelse og oprettelsesopgaver er betydeligt langsommere end tekstbaseret reasoning på grund af høj beregningsmæssig overhead.
State-of-the-art reasoning: Den specialiserede Thinking-variant leverer dyb logik til matematik på konkurrenceniveau og videnskab på PhD-niveau.
Kold samtaletone: Modellens interaktionsstil beskrives ofte som formel og robotagtig og mangler den naturlige varme fra tidligere iterationer.
Agentic brug af værktøjer: Yderst effektiv til at bruge eksterne værktøjer som browsere og Python-miljøer til at administrere multi-step professionelle workflows.
Premium-prissætning på output: Med $14 per million tokens i Thinking mode forbliver output-omkostningerne betydeligt højere end for ældre, mere agile modeller.
Large-scale context recall: Understøtter op til 400K tokens med næsten perfekt nøjagtighed, ideelt til analyse og syntese af massive datasæt.
Manglende sammenhæng i samtaler: Dens fokus på organisering kan nogle gange forstyrre flowet i naturlige, synkrone diskussioner med brugere.

API hurtig start

openai/gpt-5.2

Se dokumentation
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-thinking',
    messages: [{ role: 'user', content: 'Analyze this recursive reflection problem in WebGL 2.' }],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om GPT-5.2

Se hvad fællesskabet mener om GPT-5.2

"GPT-5.2's Thinking mode ændrer alt for komplekse kodningsopgaver; den bygger rent faktisk funktionelle apps i ét hug."
AI_Dev
reddit
"Den fandt Holger på 13 minutter ved hjælp af rå pixel-analyse. Skræmmende intelligent, men så langsom til simple opgaver."
VisualLearner
youtube
"Recall i 400k context window er næsten perfekt, endelig en reel konkurrent til Geminis dominans inden for long-context."
LogicGate
hackernews
"At skabe billeder med GPT-5.2 føles stadig langsommere end sirup, der løber op ad bakke i januar. Hastighed er dens største fjende."
adventurepaul
reddit
"OpenAIs modeller fokuserer så meget på at være organiserede nu, at det grundlæggende holder op med at føles som en samtale."
ArchMeta1868
reddit
"ARC-prisen har netop verificeret en 390x effektivitetsforbedring på ét år fra o3-modellen til 5.2."
Fireship
x

Videoer om GPT-5.2

Se vejledninger, anmeldelser og diskussioner om GPT-5.2

GPT 5.2 er ikke bare en bedre version af GPT-4. Det er et helt andet bæst.

I nogle tilstande kan du fodre den med hele bøger, adskillige forskningsartikler og massive codebases på én gang.

I billedbaserede reasoning-opgaver opnår Thinking mode omkring 89 % nøjagtighed på virkelig udfordrende benchmarks.

Parametren for reasoning_effort er nøglen til at låse op for denne models sande logik-potentiale.

Vent til du ser, hvordan den håndterer prompt caching til tilbagevendende udvikleropgaver.

Modellen identificerede korrekt, at bier flyver ind gennem en enkelt indgang i stedet for at sprede sig tilfældigt.

Modellen brugte 19 sekunder på at 'tænke' for at generere en funktionel Photoshop-klon med lag og blending-tilstande.

GPT 5.2 implementerede succesfuldt rekursiv ray tracing for reflekterende kugler i WebGL 2.

Det er første gang, jeg har set en AI opretholde tilstand på tværs af så massiv en logik-kæde.

Selv med komplekse UI-layouts mistede vision-modulet aldrig overblikket over den primære CTA.

OpenAI har lige udgivet deres svar på Gemini: GPT 5.2, en model der endnu en gang drejer AI-hype-hjulet til fordel for OpenAI.

Det virkelige 'flex' er dog dens opstigen til toppen af ARC AGI benchmark.

ARC-prisen har netop verificeret en 390x effektivitetsforbedring på ét år fra o3-modellen til 5.2.

Hvis du troede, at tidligere kodnings-agenter var gode, så er denne her på et helt andet niveau af autonomi.

Send den på gaden, bare udgiv den model, for den løser GitHub-issues, mens vi sover.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange
Se demovideo

Pro-tips

Eksperttips til at hjælpe dig med at få mest muligt ud af denne model og opnå bedre resultater.

Aktivér Thinking mode til logik

Skift eksplicit til gpt-5.2-thinking varianten, når du løser matematik- eller kodningsproblemer med høj kompleksitet for at opnå maksimal nøjagtighed.

Udnyt prompt caching

Drag fordel af 24-timers prompt caching for at reducere latency og omkostninger, når du arbejder med store, tilbagevendende datasæt.

Benyt Model Context Protocol

Forbind din model til dine værktøjer i dit workspace for at muliggøre udførelse af opgaver i den virkelige verden, såsom planlægning og e-mails.

Trinvis prompting

Bed din model om at vise sin reasoning-proces for at hjælpe med at auditere beslutningstagning under ekstremt lange context window reasoning-opgaver.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Ofte stillede spørgsmål

Find svar på almindelige spørgsmål om denne model