openai

GPT-5.2 Pro

GPT-5.2 Pro är OpenAIs flaggskeppsmodell för resonemang 2025, med utökat tänkande för SOTA-prestanda inom matematik, programmering och expertarbete.

openai logoopenaiGPT-52025-12-11
Kontext
400Ktokens
Max utdata
128Ktokens
Inmatningspris
$21.00/ 1M
Utdatapris
$168.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
93.2%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.2 Pro fick 93.2% pa detta benchmark.
HLE
36.6%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.2 Pro fick 36.6% pa detta benchmark.
MMLU
89.6%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.2 Pro fick 89.6% pa detta benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.2 Pro fick 82% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.2 Pro fick 52% pa detta benchmark.
IFEval
93.5%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.2 Pro fick 93.5% pa detta benchmark.
AIME 2025
100%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.2 Pro fick 100% pa detta benchmark.
MATH
97%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.2 Pro fick 97% pa detta benchmark.
GSM8k
99.2%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.2 Pro fick 99.2% pa detta benchmark.
MGSM
96%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.2 Pro fick 96% pa detta benchmark.
MathVista
76.5%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.2 Pro fick 76.5% pa detta benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.2 Pro fick 80% pa detta benchmark.
HumanEval
94.5%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.2 Pro fick 94.5% pa detta benchmark.
LiveCodeBench
78%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.2 Pro fick 78% pa detta benchmark.
MMMU
79.5%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.2 Pro fick 79.5% pa detta benchmark.
MMMU Pro
79.5%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.2 Pro fick 79.5% pa detta benchmark.
ChartQA
91.2%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.2 Pro fick 91.2% pa detta benchmark.
DocVQA
94.8%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.2 Pro fick 94.8% pa detta benchmark.
Terminal-Bench
55.6%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.2 Pro fick 55.6% pa detta benchmark.
ARC-AGI
54.2%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.2 Pro fick 54.2% pa detta benchmark.

Om GPT-5.2 Pro

Lar dig om GPT-5.2 Pros kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

En ny standard för resonerande intelligens

GPT-5.2 Pro utgör den mest beräkningsintensiva nivån av OpenAIs resonemangsfokuserade modeller. Den är specifikt konstruerad för arbetsflöden i företag som kräver vetenskaplig forskning på doktorandnivå och komplexa logiska slutledningar. Till skillnad från standardmodeller för språk använder den en sofistikerad arkitektur för beräkning under inference-tiden som gör det möjligt för användare att skala modellens ansträngning för tänkande. Detta gör att systemet internt kan bryta ner problem, verifiera sin egen logik och åsidosätta statistiska antaganden som ofta leder till fel i mindre modeller.

Specialiserad för teknisk precision

Trots att den delar grundträning med den bredare GPT-5-familjen, utmärker sig Pro-varianten genom sitt enorma context window på 400 000 tokens och betydligt lägre hallucinationsfrekvens. Den har dokumenterats som en pålitlig samarbetspartner inom teoretisk fysik och matematiska bevis med hög insats. Dess prestanda på kontamineringsresistenta benchmark-tester som ARC-AGI-2 och GPQA Diamond etablerar den som en primär processmotor för autonoma agenter som måste hantera tekniska instruktioner i flera steg utan mänsklig inblandning.

Företagsprestanda och output

Modellen kännetecknas av sin strikta efterlevnad av komplexa instruktioner och professionella samtalston. Det är den första modellen som konsekvent överträffar mänskliga branschexperter med över 14 års erfarenhet av specialiserade arbetsuppgifter. Med en genereringskapacitet på upp till 128 000 tokens markerar den ett betydande skifte bort från den "lata" inställning som observerats i tidigare generationer, vilket gör den kapabel att producera hela kodmoduler eller uttömmande forskningsrapporter i ett enda körpass.

GPT-5.2 Pro

Anvandningsfall for GPT-5.2 Pro

Upptack de olika satten du kan anvanda GPT-5.2 Pro for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Löser komplexa GitHub-ärenden med flera filer och utför refaktorering av hela moduler med en framgångsfrekvens på 84,5 % på SWE-Bench Verified.

Matematik på olympiadnivå

Löser 100 % av AIME 2025-tävlingsproblemen och bidrar med originalbevis till öppna frågor inom statistisk lärandeteori.

Orkestrering av företagsagenter

Fungerar som en högpresterande processmotor som kan sekvensera dussintals verktyg för att hantera finansiell modellering och logistik i flera steg.

Vetenskaplig forskning på doktorandnivå

Analyserar problem inom fysik, kemi och biologi med ett GPQA-resultat på 93,2 %, vilket överträffar många mänskliga experter inom ämnesområdet.

Syntes av dokument med lång kontext

Läser in upp till 400 000 tokens av arkivdata för att generera omfattande juridiska rapporter eller tekniska manualer.

Interaktiv 3D-simulering

Genererar 3D-simuleringar på flera tusen rader kod i Three.js eller C++, inklusive komplex partikelfysik och mekanisk logik.

Styrkor

Begransningar

Perfekt matematisk noggrannhet: Uppnår en felfri 100 % lösningsfrekvens på benchmark-testet AIME 2025, vilket uttömmer signalen i moderna matteprov på tävlingsnivå.
Avskräckande prissättning: Med 168 USD per miljon output tokens är modellen ungefär 16 gånger dyrare än GPT-5.1, vilket begränsar användningen till affärskritiska arbetsflöden.
State-of-the-art programmering: Når 84,5 % lösningsfrekvens på SWE-Bench Verified och fungerar effektivt som en juniorutvecklare kapabel att ansvara för icke-triviala bugglistor.
Saknar minnesfunktioner: Saknar stöd för sparade minnen och referenshistorik för chattar, funktioner som är standard i de enklare ChatGPT 5.2-modellerna.
Avancerat abstrakt resonemang: Tredubblar ARC-AGI-2-prestandan jämfört med sin föregångare (54,2 % mot 17,6 %), vilket tyder på ett genombrott i hanteringen av nya regelinduktionsuppgifter.
Betydande latens: Djupa interna resonemang kan göra att modellen arbetar i över 15 minuter på en enda prompt, särskilt i läget xhigh.
Massiv output-kapacitet på 128K: Designad för att generera hela böcker, kodarkiv eller uttömmande vetenskapliga rapporter i ett enda inference-pass.
Fel vid ramval: Ibland misslyckas den med att åsidosätta statistiska antaganden vid uppgifter som kräver sunt förnuft, även när den korrekt identifierar logiska begränsningar i tankekedjan.

API snabbstart

openai/gpt-5.2-pro

Visa dokumentation
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Design a leveraged buyout model for a take-private project.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.2 Pro

Se vad communityt tycker om GPT-5.2 Pro

Resonemanget fanns där; slutsatsen följde helt enkelt inte. Om inte det får dig att stanna upp, så borde det göra det.
Ok_Entrance_4380
reddit
GPT-5.2 Pro härledde ett nytt resultat inom teoretisk fysik som klarade expertgranskning, något 5.1 inte kunde göra.
kevinweil
twitter
GPT-5.2 Pro börjar likna en juniorutvecklare som kan ansvara för en icke-trivial del av ärendelistan.
Due_Woodpecker2882
reddit
OpenAI medger att Pro-modellen saknar minne. Det är förödande för mig som akademiker.
Oldschool728603
hackernews
Logiken är felfri, men latensen gör att det känns som om jag samarbetar med ett väldigt långsamt geni.
User123
reddit
Äntligen en modell som inte hallucinerar sig igenom en enkel tensor-kontraktion.
PhysicsProf
hackernews

Videor om GPT-5.2 Pro

Se handledningar, recensioner och diskussioner om GPT-5.2 Pro

ryktas om Mensa Norge IQ-resultat mellan 145 och 147

producerade över 24 000 rader kod

inkludering av ett valbart tidsalternativ för tänkande

prissättningen för Pro-nivån är strikt för företagsbudgetar

den här modellen löste hela min utvecklingskö på en eftermiddag

30 % minskning av hallucinationer

layouten är överlag chockerande bra jämfört med var vi var med 5.1

Exakt 300 ord. Det är första gången jag gav den ett ordantal och den prickade det exakt

Vision-kapaciteten på arkitektoniska ritningar är oöverträffad

Den känns betydligt kallare och mer robotaktig än 5.1

GPT5 Pro för 200 USD tänkte i 25 minuter och 36 sekunder

tilldelade dubbelt så mycket inference-beräkningskraft

omvandlade ett komplicerat problem... till en annan typ av maskineri från ett område som kallas komplex analys

det är i praktiken en doktorsexamen i en låda för 200 USD i månaden

tankekedjan visar att den faktiskt verifierar sina egna steg

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for GPT-5.2 Pro

Experttips for att hjalpa dig fa ut det mesta av GPT-5.2 Pro och uppna battre resultat.

Skala resonemangsansträngning

Använd API-parametern reasoning_effort och ställ in den på xhigh för uppgifter där logisk konsekvens är viktigare än hastighet vid generering.

Hantera statistiska antaganden

Om modellen faller i fällor baserade på sunt förnuft, ge en kontextuell knuff för att aktivera dess aktiva resonemangslager och åsidosätta dess grundläggande träning.

Utnyttja massiv output

Begär hela projektkataloger eller kompletta dokumentationsfiler i en enda prompt för att dra nytta av output-budgeten på 128K.

Dra nytta av verktygsintegration

Aktivera alltid funktionsanrop (function calling) för vision-uppgifter; modellens multimodala prestanda ökar när den kan använda verktyg för att verifiera visuell data.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Vanliga fragor om GPT-5.2 Pro

Hitta svar pa vanliga fragor om GPT-5.2 Pro