openai

GPT-5.2 Pro

GPT-5.2 Pro je OpenAI-jev flagship reasoning model iz 2025. koji sadrži Extended Thinking za SOTA performanse u matematici, kodiranju i stručnom radu.

openai logoopenaiGPT-52025-12-11
Kontekst
400Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$21.00/ 1M
Izlazna cijena
$168.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
93.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.2 Pro je postigao 93.2% na ovom benchmarku.
HLE
36.6%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.2 Pro je postigao 36.6% na ovom benchmarku.
MMLU
89.6%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.2 Pro je postigao 89.6% na ovom benchmarku.
MMLU Pro
82%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.2 Pro je postigao 82% na ovom benchmarku.
SimpleQA
52%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.2 Pro je postigao 52% na ovom benchmarku.
IFEval
93.5%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.2 Pro je postigao 93.5% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.2 Pro je postigao 100% na ovom benchmarku.
MATH
97%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.2 Pro je postigao 97% na ovom benchmarku.
GSM8k
99.2%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.2 Pro je postigao 99.2% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.2 Pro je postigao 96% na ovom benchmarku.
MathVista
76.5%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.2 Pro je postigao 76.5% na ovom benchmarku.
SWE-Bench
80%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.2 Pro je postigao 80% na ovom benchmarku.
HumanEval
94.5%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.2 Pro je postigao 94.5% na ovom benchmarku.
LiveCodeBench
78%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.2 Pro je postigao 78% na ovom benchmarku.
MMMU
79.5%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.2 Pro je postigao 79.5% na ovom benchmarku.
MMMU Pro
79.5%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.2 Pro je postigao 79.5% na ovom benchmarku.
ChartQA
91.2%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.2 Pro je postigao 91.2% na ovom benchmarku.
DocVQA
94.8%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.2 Pro je postigao 94.8% na ovom benchmarku.
Terminal-Bench
55.6%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.2 Pro je postigao 55.6% na ovom benchmarku.
ARC-AGI
54.2%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.2 Pro je postigao 54.2% na ovom benchmarku.

O modelu GPT-5.2 Pro

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.2 Pro.

Novi standard u inteligentnom reasoningu

GPT-5.2 Pro predstavlja razinu visoke procesorske snage OpenAI-jevih modela fokusiranih na reasoning. Posebno je konstruiran za enterprise workflowe koji zahtijevaju znanstvena istraživanja na doktorskoj razini i složenu logičku inferenciju. Za razliku od standardnih jezičnih modela, koristi sofisticiranu arhitekturu inference-time computea koja korisnicima omogućuje skaliranje napora razmišljanja modela. To omogućuje sustavu da interno dekomponira probleme, provjeri vlastitu logiku i nadjača statističke pretpostavke koje često dovode do pogrešaka u manjim modelima.

Specijaliziran za tehničku preciznost

Dok dijeli jezgru obuke sa širom obitelji GPT-5, Pro varijanta se ističe svojim masivnim context windowom od 400 000 tokens i znatno nižim stopama halucinacija. Dokumentiran je kao pouzdan suradnik u teoretskoj fizici i matematičkim dokazima visokog uloga. Njegove performanse na benchmarkovima otpornim na kontaminaciju kao što su ARC-AGI-2 i GPQA Diamond postavljaju ga kao primarni procesni motor za autonomne agente koji moraju obrađivati višestupanjske tehničke upute bez ljudske intervencije.

Enterprise performanse i output

Model karakterizira strogo pridržavanje složenih uputa i profesionalan ton razgovora. Ovo je prvi model koji dosljedno nadmašuje ljudske stručnjake iz industrije s više od 14 godina iskustva na specijaliziranim radnim zadacima. S kapacitetom generiranja do 128 000 tokens, označava značajan odmak od „lijenosti” uočenoj u prethodnim generacijama, čineći ga sposobnim za izradu cijelih programskih modula ili iscrpnih istraživačkih izvješća u jednom prolazu.

GPT-5.2 Pro

Slučajevi korištenja za GPT-5.2 Pro

Otkrijte različite načine korištenja modela GPT-5.2 Pro za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Rješavanje složenih problema na više datoteka na GitHubu i izvršavanje refaktoriranja cijelih modula s 84,5% uspješnosti na SWE-Bench Verified.

Olimpijska matematika

Rješavanje 100% problema s natjecanja AIME 2025 i doprinos originalnim dokazima za otvorena pitanja u teoriji statističkog učenja.

Enterprise agent orkestracija

Funkcionira kao procesni motor visokih performansi koji može nizati desetke alata za rukovanje višestupanjskim financijskim modeliranjem i logistikom.

Znanstvena istraživanja na doktorskoj razini

Analiza problema iz fizike, kemije i biologije s rezultatom 93,2% na GPQA, nadmašujući mnoge ljudske stručnjake za navedena područja.

Sinteza dokumenata s dugim kontekstom

Učitavanje do 400 000 tokens arhivskih podataka za generiranje sveobuhvatnih pravnih izvješća ili tehničkih priručnika.

Interaktivne 3D simulacije

Generiranje tisuća linija koda za 3D simulacije u Three.js ili C++, uključujući složenu fiziku čestica i mehaničku logiku.

Prednosti

Ograničenja

Savršena matematička točnost: Postiže besprijekornih 100% uspješnosti na benchmarku AIME 2025, iscrpljujući potencijal modernih matematičkih natjecateljskih ispita.
Prohibitivne cijene: Uz 168 USD po milijunu output tokens, model je otprilike 16 puta skuplji od GPT-5.1, što ograničava njegovu upotrebu na workflowe visokog uloga.
State-of-the-art kodiranje: Dostiže stopu rješavanja od 84,5% na SWE-Bench Verified, djelujući učinkovito kao mlađi inženjer sposoban nositi se s netrivijalnim zaostacima bugova.
Nedostaju značajke memorije: Nedostaje podrška za spremljene memorije i referentnu povijest chata, značajke koje su standardne u modelima ChatGPT 5.2 niže razine.
Napredno apstraktno reasoning: Trostruko bolje performanse od prethodnika na ARC-AGI-2 (54,2% u odnosu na 17,6%), što ukazuje na proboj u rukovanju zadacima indukcije novih pravila.
Značajna latencija: Duboko interno reasoning može uzrokovati da model razmišlja dulje od 15 minuta na jednom promptu, posebno u xhigh effort načinu rada.
Masivni kapacitet outputa od 128K: Dizajniran za generiranje cijelih knjiga, repozitorija koda ili iscrpnih znanstvenih izvješća u jednom prolazu inferencea.
Pogreške u odabiru okvira: Povremeni neuspjeh u nadjačavanju statističkih pretpostavki u zadacima zdravog razuma, čak i kada ispravno identificira logička ograničenja u tragovima razmišljanja.

API brzi početak

openai/gpt-5.2-pro

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Dizajniraj model leveraged buyout-a za take-private projekt.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.2 Pro

Pogledajte što zajednica misli o modelu GPT-5.2 Pro

Reasoning je bio prisutan; zaključak jednostavno nije slijedio. Ako vas to ne natjera na pauzu, trebalo bi.
Ok_Entrance_4380
reddit
GPT-5.2 Pro izveo je novi rezultat u teoretskoj fizici koji je preživio stručni nadzor, što 5.1 nije mogao učiniti.
kevinweil
twitter
GPT-5.2 Pro počinje izgledati kao mlađi inženjer koji može preuzeti netrivijalan dio problema u issue trackeru.
Due_Woodpecker2882
reddit
OpenAI priznaje da Pro model nema memoriju. To je poražavajuće za mene kao akademika.
Oldschool728603
hackernews
Logika je besprijekorna, ali latencija čini da se osjećam kao da surađujem s vrlo sporim genijem.
User123
reddit
Konačno, model koji ne halucinira kroz jednostavnu kontrakciju tenzora.
PhysicsProf
hackernews

Videozapisi o modelu GPT-5.2 Pro

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.2 Pro

glasine o Mensa Norway IQ rezultatima između 145 i 147

proizveo preko 24 000 linija koda

uključivanje opcije odabira vremena za razmišljanje

cijene Pro razine su isključivo za enterprise proračune

ovaj model je riješio cijeli moj razvojni zaostatak u jednom poslijepodnevu

30% smanjenje halucinacija

izgled je sveukupno šokantno dobar u usporedbi s onim gdje smo bili s 5.1

Točno 300 riječi. Ovo je prvi put da sam mu zadao broj riječi i pogodio je točan broj

Vision mogućnosti na arhitektonskim nacrtima su bez premca

Čini se znatno hladnijim i robotskijim od 5.1

GPT5 Pro od 200 USD razmišljao je 25 minuta i 36 sekundi

dodjeljivanje dvostruke snage inference computea

pretvorio komplicirani problem... u drugu vrstu mehanizma iz područja zvanog kompleksna analiza

to je učinkovito doktorat u kutiji za 200 dolara mjesečno

trag razmišljanja pokazuje da zapravo provjerava vlastite korake

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.2 Pro

Stručni savjeti za maksimalno iskorištavanje GPT-5.2 Pro.

Skaliranje napora za reasoning

Koristite reasoning_effort API parametar i postavite ga na xhigh za zadatke gdje je logička dosljednost važnija od brzine generiranja.

Adresiranje statističkih pretpostavki

Ako model upadne u zamke zdravog razuma, pružite kontekstualnu natuknicu kako biste aktivirali njegov sloj za aktivno reasoning i nadjačali njegovu osnovnu obuku.

Iskorištavanje masivnog outputa

Zatražite cijele direktorije projekata ili kompletnu dokumentaciju u jednom promptu kako biste iskoristili budžet od 128K tokens za generiranje.

Iskorištavanje integracije alata

Uvijek omogućite pozivanje funkcija za vizualne zadatke; performanse multimodal modela rastu kada može koristiti alate za provjeru vizualnih podataka.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Često Postavljana Pitanja o GPT-5.2 Pro

Pronađite odgovore na česta pitanja o GPT-5.2 Pro