openai

GPT-5.2

GPT-5.2 je OpenAI-ev flagship model za profesionalne zadatke, s 400K context windowom, elitnim kodiranjem i sposobnostima dubokog višestupanjskog reasoninga.

openai logoopenaiGPT-511. prosinca 2025.
Kontekst
400Ktokena
Maks. izlaz
100Ktokena
Ulazna cijena
$1.75/ 1M
Izlazna cijena
$14.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
93%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.2 je postigao 93% na ovom benchmarku.
HLE
45%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.2 je postigao 45% na ovom benchmarku.
MMLU
88%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.2 je postigao 88% na ovom benchmarku.
MMLU Pro
83%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.2 je postigao 83% na ovom benchmarku.
SimpleQA
58%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.2 je postigao 58% na ovom benchmarku.
IFEval
95%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.2 je postigao 95% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.2 je postigao 100% na ovom benchmarku.
MATH
98%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.2 je postigao 98% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.2 je postigao 99% na ovom benchmarku.
MGSM
98%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.2 je postigao 98% na ovom benchmarku.
MathVista
78%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.2 je postigao 78% na ovom benchmarku.
SWE-Bench
80%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.2 je postigao 80% na ovom benchmarku.
HumanEval
95%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.2 je postigao 95% na ovom benchmarku.
LiveCodeBench
80%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.2 je postigao 80% na ovom benchmarku.
MMMU
75%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.2 je postigao 75% na ovom benchmarku.
MMMU Pro
65%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.2 je postigao 65% na ovom benchmarku.
ChartQA
93%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.2 je postigao 93% na ovom benchmarku.
DocVQA
95%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.2 je postigao 95% na ovom benchmarku.
Terminal-Bench
60%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.2 je postigao 60% na ovom benchmarku.
ARC-AGI
52.9%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.2 je postigao 52.9% na ovom benchmarku.

O modelu GPT-5.2

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.2.

GPT-5.2 je OpenAI-ev vodeći model za reasoning dizajniran za profesionalni rad visokog uloga i autonomno inženjerstvo. Objavljen 11. prosinca 2025., označava značajnu evoluciju u odnosu na serije GPT-4 i GPT-o1 integracijom namjenskog Thinking moda s kontrolama napora (Medium, High, Extra High). To omogućuje modelu da zastane i verificira višestupanjsku logiku prije generiranja odgovora.

S ogromnim 400K context windowom i gotovo 100% preciznošću (recall), dizajniran je za code reviewe na višoj razini, složeni refaktoring i znanstvena istraživanja. Arhitektura modela izgrađena je za podršku agentic tijekovima rada, sadrži nativno pozivanje alata i multimodalni vid koji može istovremeno obrađivati složene tehničke dijagrame i baze koda.

Iako se ističe u logičkoj preciznosti i inženjerskim benchmarkovima, postižući 100% rezultat na AIME 2025, poprima formalniji, stroju sličniji ton u usporedbi s konkurentima poput Claudea. Trenutno se naplaćuje 1,75 USD po milijun input tokena i 14,00 USD po milijun output tokena, što ga čini isplativom alternativom za duboke zadatke reasoninga koji su prethodno zahtijevali ljudski nadzor uz visoku računalnu snagu.

GPT-5.2

Slučajevi korištenja za GPT-5.2

Otkrijte različite načine korištenja modela GPT-5.2 za postizanje izvrsnih rezultata.

Složeni inženjerski refaktoring

Izvođenje dubokog refaktoringa na kôdu kritičnom za performanse, uz održavanje strogih tipskih invarijanti i arhitektonske dosljednosti.

Autonomni zadaci u terminalu

Izvršavanje višestupanjskih CLI radnih procesa i upravljanje složenim cloud deploymentima kroz visoke performanse u Terminal-Bench okruženjima.

Sinteza znanja na doktorskoj razini

Istovremena analiza stotina tehničkih izvora i akademskih radova za stvaranje sveobuhvatnih istraživačkih izvještaja o specijaliziranim znanstvenim temama.

Rješavanje bugova vezanih uz istodobnost (concurrency)

Identificiranje i ispravljanje suptilnih race conditiona ili curenja memorije koji zahtijevaju logički inference visoke razine kroz dugačke segmente koda.

Mehanička obrada koda

Upravljanje velikim, repetitivnim migracijama koda kroz cijele repozitorije bez lijenosti koja se često primjećuje kod modela opće namjene.

Senior tehnička recenzija

Djelovanje kao virtualni senior inženjer za pregled dizajnerskih planova i identificiranje rubnih slučajeva u logici za produkcijske sustave.

Prednosti

Ograničenja

Vrhunska inženjerska točnost: Postigao je rezultat od 77,3% na Terminal-Bench 2.0, nadmašivši konkurenciju u složenim zadacima putem sučelja naredbenog retka.
Visoka latencija odgovora: Značajan overhead za reasoning znači da je model primjetno sporiji od prethodnih iteracija, što dovodi do dugog vremena čekanja.
Elitni matematički reasoning: Ostvario je 100% na benchmarku AIME 2025, demonstrirajući sposobnost za matematiku na natjecateljskoj razini bez vanjskih alata.
Umjetni UX ton: Korisnici kritiziraju pretencioznu i pretjerano strukturiranu uslužnost koja djeluje manje prirodno od serije Claude.
Niska stopa halucinacija: Testiranja zajednice i interni benchmarkovi pokazuju 30% smanjenje činjeničnih izmišljotina u usporedbi s prethodnim generacijama.
Neproziran proces razmišljanja: Za razliku od nekih transparentnih modela, GPT-5.2 često skriva svoj interni chain-of-thought, pružajući samo konačni verificirani odgovor.
Produljena postojanost zadataka: Sposoban održavati aktivne autonomne radne sesije dulje od dva sata, što ga čini idealnim za razvojni rad velikih razmjera.
Premijske cijene za reasoning: Cijena outputa od 14,00 USD može brzo narasti tijekom dugih zadataka reasoninga gdje se naplaćuju velike količine thinking tokena.

API brzi početak

openai/gpt-5.2

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.2

Pogledajte što zajednica misli o modelu GPT-5.2

GPT 5.2 u Codexu je ogromno poboljšanje, spremniji je nositi se s onim mehaničkim zadacima koji bi inače učinili modele lijenima.
ArchMeta1868
reddit
Povećano promišljanje i vrijeme utrošeno na provjeru činjenica u outputu zaslužuju pohvalu... pouzdanost je znatno poboljšana.
Thomas Randall
techopedia
Model koji pokreće dubinska istraživanja pokazao je ljudski pristup učinkovitim traženjem specijaliziranih informacija kada je to bilo potrebno.
OpenAI Official
twitter
OpenAI-ev fokus na strukturiranu 'brigu o korisnicima' djeluje kao korporativna maska za hladnu jezgru u usporedbi s prirodnim raspravama u Claudeu.
Anonymous Developer
hackernews
Napokon model koji ne postane lijen na pola puta kroz refaktoring od 500 linija.
CodeWizard
reddit
Parametar reasoning effort je pravi MVP za složene logičke probleme.
AIBuilder
twitter

Videozapisi o modelu GPT-5.2

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.2

Ovo je zapravo suludo. Pogledajte ovo iz prvog pokušaja.

Dizajnom nisam pretjerano impresioniran kod GPT 5.2... prošao je puno lošije od Gemini 3.

Context recall je gotovo savršen kroz cijeli raspon od 400k.

Djeluje puno više kao engine za reasoning nego kao chatbot.

Latencija je jedina stvarna prepreka za neke aplikacije u stvarnom vremenu.

GPT 5.2 sada može kreirati potpuno formatirane proračunske tablice i prezentacije izravno unutar ChatGPT-a.

Kao da je model napokon odrastao i počeo svoj posao shvaćati ozbiljno.

Koristite postavku visokog reasoninga samo za zadatke s teškom logikom.

Halucinacije su znatno smanjene u usporedbi sa serijom 4o.

Agentic tijekovi rada su napokon održivi bez stalnog nadzora.

GPT 5.2 je zapravo 40% skuplji od 5.1, ali je i dalje znatno jeftiniji od Opusa.

GPT 5.2 je potrošio 11 minuta i 20 sekundi [za izradu aplikacije]. Dakle, dvostruko više vremena [u usporedbi s Opusom].

Kvaliteta outputa je puno veća kada dopustite da način rada 'razmišljanja' odradi svoje.

Obradio je refaktoring više datoteka bez gubitka definicija tipova.

Ako trebate čistu brzinu, ovo nije model za vas.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.2

Stručni savjeti za maksimalno iskorištavanje GPT-5.2.

Iskoristite Thinking Effort

Koristite parametar reasoning_effort (medium, high, xhigh) kako biste uskladili vrijeme promišljanja modela sa složenošću zadatka.

Omogućite Codex za postojanost

Prilikom rada na velikim repozitorijima, koristite namjensko Codex okruženje za održavanje aktivnih sesija obrade u trajanju do 150 minuta.

Pružite bogat kontekst

Osigurajte bogatu popratnu dokumentaciju unutar system promptova, jer model najbolje funkcionira kada ga se intervjuira o potrebnom kontekstu.

Iterirajte kroz zahtjeve

Eksplicitno uputite model da provede provjere u odnosu na trenutnu bazu koda kako biste osigurali validaciju zahtjeva.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Često Postavljana Pitanja o GPT-5.2

Pronađite odgovore na česta pitanja o GPT-5.2