openai

GPT-5.2

GPT-5.2 är OpenAIs flaggskeppsmodell för professionella uppgifter, utrustad med ett 400K context window, avancerad kodningsförmåga och djupgående reasoning.

openai logoopenaiGPT-511 december 2025
Kontext
400Ktokens
Max utdata
100Ktokens
Inmatningspris
$1.75/ 1M
Utdatapris
$14.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
93%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.2 fick 93% pa detta benchmark.
HLE
45%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.2 fick 45% pa detta benchmark.
MMLU
88%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.2 fick 88% pa detta benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.2 fick 83% pa detta benchmark.
SimpleQA
58%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.2 fick 58% pa detta benchmark.
IFEval
95%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.2 fick 95% pa detta benchmark.
AIME 2025
100%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.2 fick 100% pa detta benchmark.
MATH
98%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.2 fick 98% pa detta benchmark.
GSM8k
99%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.2 fick 99% pa detta benchmark.
MGSM
98%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.2 fick 98% pa detta benchmark.
MathVista
78%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.2 fick 78% pa detta benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.2 fick 80% pa detta benchmark.
HumanEval
95%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.2 fick 95% pa detta benchmark.
LiveCodeBench
80%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.2 fick 80% pa detta benchmark.
MMMU
75%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.2 fick 75% pa detta benchmark.
MMMU Pro
65%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.2 fick 65% pa detta benchmark.
ChartQA
93%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.2 fick 93% pa detta benchmark.
DocVQA
95%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.2 fick 95% pa detta benchmark.
Terminal-Bench
60%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.2 fick 60% pa detta benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.2 fick 52.9% pa detta benchmark.

Om GPT-5.2

Lar dig om GPT-5.2s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

GPT-5.2 är OpenAIs flaggskeppsmodell för reasoning, utformad för kvalificerat professionellt kunskapsarbete och autonom ingenjörskonst. Den lanserades 11 december 2025 och markerar en betydande utveckling från GPT-4 och GPT-o1-serien genom att integrera ett dedikerat Thinking-läge med kontrollmöjligheter (Medium, High, Extra High). Detta gör att modellen kan pausa och verifiera logik i flera steg innan ett svar genereras.

Med ett massivt 400K context window och nästan 100 % recall är den byggd för senior kodgranskning, komplex refaktorisering och vetenskaplig forskning. Modellarkitekturen stödjer agentic arbetsflöden med inbyggda verktygsanrop och multimodal vision som kan bearbeta intrikata tekniska diagram och kodbaser samtidigt.

Samtidigt som den briljerar i logisk precision och når 100 % på AIME 2025, antar den en mer formell, maskinlik ton jämfört med konkurrenter som Claude. Den kostar för närvarande 1,75 $ per miljon input tokens och 14,00 $ per miljon output tokens, vilket gör den till ett kostnadseffektivt alternativ för djupgående reasoning som tidigare krävde mänsklig övervakning.

GPT-5.2

Anvandningsfall for GPT-5.2

Upptack de olika satten du kan anvanda GPT-5.2 for att uppna fantastiska resultat.

Komplex refaktorisering

Genomför djupgående refaktorisering av prestandakritisk kod samtidigt som strikta typinvarianter och arkitektonisk konsekvens bibehålls.

Autonoma terminaluppgifter

Utför CLI-arbetsflöden i flera steg och hantera komplexa molndistributioner genom hög prestanda i Terminal-Bench-miljöer.

Kunskapssyntes på forskarnivå

Analysera hundratals tekniska källor och vetenskapliga artiklar samtidigt för att skapa omfattande forskningsrapporter om nischade ämnen.

Lösning av concurrency-buggar

Identifiera och åtgärda subtila race conditions eller minnesläckor som kräver högkvalitativ logisk slutledningsförmåga över långa kodsegment.

Mekanisk kodbearbetning

Hantering av storskaliga, repetitiva kodmigreringar över hela arkiv utan den lathet som ofta observeras hos generella LLM:er.

Senior teknisk granskning

Agera som en virtuell senior ingenjör för att granska designplaner och identifiera edge cases i logik för produktionssystem.

Styrkor

Begransningar

Överlägsen ingenjörsmässig precision: Uppnådde 77,3 % på Terminal-Bench 2.0, vilket överträffar konkurrenter i komplexa CLI-uppgifter.
Hög svarslatens: Den omfattande beräkningskapaciteten innebär att modellen är märkbart långsammare än tidigare iterationer, vilket leder till längre väntetider.
Exceptionell matematisk reasoning: Uppnådde 100 % på benchmark-testet AIME 2025, vilket visar på förmåga till matematik på tävlingsnivå utan externa verktyg.
Artificiell UX-ton: Kritiserad av användare för en pretentiös och överdrivet strukturerad hjälpsamhet som känns mindre naturlig än Claude-serien.
Låg frekvens av hallucinationer: Community-tester och interna benchmarks visar en 30-procentig minskning av faktamässiga felaktigheter jämfört med tidigare flaggskeppsgenerationer.
Opak tankeprocess: Till skillnad från vissa transparenta modeller döljer GPT-5.2 ofta sin interna chain-of-thought och tillhandahåller endast det slutgiltiga verifierade svaret.
Utökad persistens i uppgifter: Kan bibehålla aktiva autonoma arbetssessioner i över två timmar, vilket gör den idealisk för storskaligt utvecklingsarbete.
Premiumkostnader för reasoning: Priset på 14,00 $ per output kan snabbt eskalera vid långa resonemangsuppgifter där stora mängder thinking tokens debiteras.

API snabbstart

openai/gpt-5.2

Visa dokumentation
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.2

Se vad communityt tycker om GPT-5.2

GPT 5.2 i Codex är en enorm förbättring, den är mer villig att hantera de där mekaniska uppgifterna som normalt gör modeller lata.
ArchMeta1868
reddit
Det ökade övervägandet och tiden som läggs på att faktagranska output bör uppmärksammas... pålitligheten är kraftigt förbättrad.
Thomas Randall
techopedia
Modellen som driver djupgående forskning uppvisade en mänsklig approach genom att effektivt söka upp specialiserad information när det behövdes.
OpenAI Official
twitter
OpenAIs fokus på strukturerad 'användarvård' känns som en företagsmask för en kall kärna jämfört med de naturliga diskussionerna i Claude.
Anonym utvecklare
hackernews
Äntligen en modell som inte blir lat halvvägs genom en refaktorisering på 500 rader.
CodeWizard
reddit
Reasoning effort-parametern är den verkliga hjälten för komplexa logikproblem.
AIBuilder
twitter

Videor om GPT-5.2

Se handledningar, recensioner och diskussioner om GPT-5.2

Detta är faktiskt helt galet. Titta på det här.

Designen imponerar inte på mig med GPT 5.2... den presterade betydligt sämre än Gemini 3.

Context recall är nästan perfekt över hela 400k-intervallet.

Den känns mycket mer som en reasoning-motor än en chatbot.

Latensen är det enda riktiga problemet för vissa realtidsapplikationer.

GPT 5.2 kan nu skapa fullt formaterade kalkylblad och presentationer direkt i ChatGPT.

Det känns som att modellen äntligen vuxit upp och börjat ta sitt jobb på allvar.

Använd inställningen för hög reasoning endast för logiktunga uppgifter.

Hallucinationerna har minskat avsevärt jämfört med 4o-serien.

Agentic arbetsflöden är äntligen fungerande utan konstant övervakning.

GPT 5.2 är faktiskt 40 % dyrare än 5.1, men fortfarande betydligt billigare än Opus.

GPT 5.2 tog 11 minuter och 20 sekunder [för att bygga appen]. Så dubbelt så lång tid [jämfört med Opus].

Output-kvaliteten är mycket högre när du tillåter thinking-läget att köras.

Den hanterade refaktoriseringen av flera filer utan att tappa typdefinitionerna.

Om du behöver rå hastighet är detta inte modellen för dig.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for GPT-5.2

Experttips for att hjalpa dig fa ut det mesta av GPT-5.2 och uppna battre resultat.

Utnyttja Thinking Effort

Använd parametern reasoning_effort (medium, high, xhigh) för att anpassa modellens reflektionstid efter uppgiftens komplexitet.

Aktivera Codex för persistens

När du arbetar med stora kodarkiv, använd den dedikerade Codex-miljön för att upprätthålla aktiva bearbetningssessioner i upp till 150 minuter.

Tillhandahåll kontext proaktivt

Ge utförlig bakgrundsdokumentation i system-prompts, då modellen presterar bäst när den får instruktioner om vilken kontext som krävs.

Iterera över krav

Instruera modellen explicit att utföra verifieringskontroller mot den nuvarande kodbasen för att säkerställa att kraven efterlevs.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Vanliga fragor om GPT-5.2

Hitta svar pa vanliga fragor om GPT-5.2