openai

GPT-5.2

GPT-5.2 je OpenAI-jev flagship model za profesionalne zadatke, s context windowom od 400K, vrhunskim coding sposobnostima i dubokim reasoningom u više koraka.

openai logoopenaiGPT-5December 11, 2025
Kontekst
400Ktokena
Maks. izlaz
100Ktokena
Ulazna cijena
$1.75/ 1M
Izlazna cijena
$14.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
93%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.2 je postigao 93% na ovom benchmarku.
HLE
45%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.2 je postigao 45% na ovom benchmarku.
MMLU
88%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.2 je postigao 88% na ovom benchmarku.
MMLU Pro
83%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.2 je postigao 83% na ovom benchmarku.
SimpleQA
58%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.2 je postigao 58% na ovom benchmarku.
IFEval
95%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.2 je postigao 95% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.2 je postigao 100% na ovom benchmarku.
MATH
98%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.2 je postigao 98% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.2 je postigao 99% na ovom benchmarku.
MGSM
98%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.2 je postigao 98% na ovom benchmarku.
MathVista
78%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.2 je postigao 78% na ovom benchmarku.
SWE-Bench
80%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.2 je postigao 80% na ovom benchmarku.
HumanEval
95%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.2 je postigao 95% na ovom benchmarku.
LiveCodeBench
80%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.2 je postigao 80% na ovom benchmarku.
MMMU
75%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.2 je postigao 75% na ovom benchmarku.
MMMU Pro
65%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.2 je postigao 65% na ovom benchmarku.
ChartQA
93%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.2 je postigao 93% na ovom benchmarku.
DocVQA
95%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.2 je postigao 95% na ovom benchmarku.
Terminal-Bench
60%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.2 je postigao 60% na ovom benchmarku.
ARC-AGI
52.9%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.2 je postigao 52.9% na ovom benchmarku.

Isprobaj GPT-5.2 besplatno

Razgovaraj s GPT-5.2 besplatno. Testiraj mogućnosti, postavljaj pitanja i istraži što ovaj AI model može.

Prompt
Odgovor
openai/gpt-5.2

Vaš AI odgovor će se pojaviti ovdje

O modelu GPT-5.2

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.2.

Vrhunski profesionalni reasoning

GPT-5.2 predstavlja OpenAI-jev frontier u umjetnoj inteligenciji profesionalne klase, specifično dizajniran za kompleksan intelektualni rad i autonomno izvršavanje zadataka. Lansiran krajem 2025. godine, uvodi namjenski Thinking mode koji omogućuje modelu da planira logiku u više koraka, čineći ga iznimno vještim u zamršenom softverskom inženjerstvu, naprednim matematičkim dokazima i znanstvenim analizama. Arhitektura ovog modela integrira multimodalni vid i pozivanje alata u jedinstveni reasoning engine, omogućujući mu da djeluje kao agentic partner u profesionalnim radnim tijekovima.

Skalabilna arhitektura inteligencije

Tehnički gledano, GPT-5.2 ima vodeći 400K context window s gotovo 100-postotnom točnošću recall-a, što mu omogućuje obradu masivnih codebaseova ili gustih tehničkih priručnika bez gubitka informacija. Iako se ističe točnošću i pouzdanošću — smanjujući halucinacije za 30 % u usporedbi s prethodnim verzijama — model usvaja formalniji, strukturiraniji ton razgovora. Optimiziran je za poduzetnička okruženja u kojima su dosljednost i preciznost prioritet nad kreativnim izričajem, označavajući pomak prema AI-ju kao pouzdanom stručnom suradniku.

GPT-5.2

Slučajevi korištenja za GPT-5.2

Otkrijte različite načine korištenja modela GPT-5.2 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Rješavanje složenih GitHub problema i upravljanje ispravljanjem bugova u velikim codebaseovima s točnošću od 80 %.

Napredno financijsko istraživanje

Provođenje dubinske fundamentalne analize dionica i sinteze tržišnih trendova korištenjem integriranih agentic alata.

Poslovna automatizacija u više koraka

Orkestracija složenih radnih tijekova kroz povezane aplikacije za produktivnost poput Notiona, Slacka i Google Drivea.

Sinteza tehničke dokumentacije

Obrada i sažimanje masivnih tehničkih dokumenata koristeći svoj 400K token context window.

Znanstveni i matematički reasoning

Rješavanje znanstvenih problema na razini doktorata i natjecateljske matematike kroz specijalizirani Thinking mode.

Profesionalno generiranje sadržaja

Produkcija visokokvalitetne proze i formatiranih profesionalnih izvještaja u velikim količinama.

Prednosti

Ograničenja

Vrhunska vještina programiranja: Njegov rezultat od 80 % na SWE-bench Verified čini ga jednim od najsposobnijih modela za profesionalno softversko inženjerstvo.
Problemi s latencyjem vizualnih funkcija: Zadaci prepoznavanja i kreiranja slika znatno su sporiji od tekstualnog reasoninga zbog visokih računalnih zahtjeva.
State-of-the-art reasoning: Specijalizirana Thinking varijanta pruža duboku logiku za natjecateljsku matematiku i znanost na razini doktorata.
Hladan ton razgovora: Stil interakcije modela često se opisuje kao formalan i robotski, bez prirodne topline prethodnih verzija.
Agentic korištenje alata: Izrazito učinkovit u korištenju vanjskih alata poput preglednika i Python okruženja za upravljanje profesionalnim radnim tijekovima u više koraka.
Premium cijene za output: S cijenom od 14 USD po milijunu tokens u Thinking modeu, troškovi za output ostaju znatno viši nego kod starijih, agilnijih modela.
Dohvaćanje informacija iz opsežnog konteksta: Podržava do 400K tokens s gotovo savršenom točnošću, što je idealno za analizu i sintezu masivnih skupova podataka.
Prekidi u tijeku razgovora: Fokus na organizaciju ponekad može poremetiti tijek prirodnih, sinkronih rasprava s korisnicima.

API brzi početak

openai/gpt-5.2

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-thinking',
    messages: [{ role: 'user', content: 'Analyze this recursive reflection problem in WebGL 2.' }],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.2

Pogledajte što zajednica misli o modelu GPT-5.2

"GPT-5.2 thinking mode mijenja pravila igre za kompleksne coding zadatke; zapravo gradi funkcionalne aplikacije odjednom."
AI_Dev
reddit
"Pronašao je Walda za 13 minuta koristeći sirovu analizu piksela. Zastrašujuće pametan, ali tako spor za jednostavne zadatke."
VisualLearner
youtube
"Recall unutar 400k context windowa je gotovo savršen, napokon pravi konkurent Geminijevoj dominaciji u dugom kontekstu."
LogicGate
hackernews
"Kreiranje slika s GPT-5.2 i dalje djeluje sporije od puža. Brzina mu je najveći neprijatelj."
adventurepaul
reddit
"OpenAI-jevi modeli se sada toliko fokusiraju na organizaciju da se gubi osjećaj razgovora."
ArchMeta1868
reddit
"ARC nagrada je upravo potvrdila poboljšanje učinkovitosti od 390x u godinu dana od o3 modela do 5.2."
Fireship
x

Videozapisi o modelu GPT-5.2

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.2

GPT 5.2 nije samo bolja verzija GPT-4. To je potpuno drugačija kategorija.

U nekim načinima rada možete mu dati cijele knjige, više istraživačkih radova i ogromne baze koda odjednom.

Na zadacima reasoninga temeljenim na slikama, thinking mode postiže oko 89 % točnosti na zaista izazovnim benchmarkovima.

Parametar reasoning_effort je ključ za otključavanje pravog logičkog potencijala ovog modela.

Čekajte dok ne vidite kako rješava prompt caching za ponavljajuće developerske zadatke.

Model je ispravno identificirao da pčele ulaze kroz jedan ulaz, a ne da se nasumično razilaze.

Model je proveo 19 sekundi 'razmišljajući' kako bi generirao funkcionalni klon Photoshopa sa slojevima i načinima miješanja.

GPT 5.2 je uspješno implementirao rekurzivni ray tracing za reflektirajuće sfere u WebGL 2.

Prvi put vidim da AI održava stanje kroz tako ogroman lanac logike.

Čak i s kompleksnim UI izgledima, vizualni modul nikada nije izgubio iz vida primarni CTA.

OpenAI je upravo izbacio svoj odgovor na Gemini: GPT 5.2, model koji ponovno pokreće AI hype kotač u korist OpenAI-ja.

Pravi 'flex' je ipak uspon na vrh ARC AGI benchmarka.

ARC nagrada je upravo potvrdila poboljšanje učinkovitosti od 390x u godinu dana od o3 modela do 5.2.

Ako ste mislili da su prethodni coding agenti bili dobri, ovo je na sasvim drugoj razini autonomije.

Lansirajte ga, samo lansirajte model jer on rješava GitHub probleme dok mi spavamo.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti

Stručni savjeti koji će vam pomoći izvući maksimum iz ovog modela.

Aktivirajte Thinking Mode za logiku

Eksplicitno se prebacite na gpt-5.2-thinking varijantu pri rješavanju matematičkih ili coding problema visoke složenosti za maksimalnu točnost.

Iskoristite prompt caching

Iskoristite prednosti 24-satnog prompt cachinga kako biste smanjili latency i troškove pri radu s velikim, ponavljajućim skupovima podataka.

Koristite Model Context Protocol

Povežite model sa svojim alatima u radnom okruženju kako biste omogućili izvršavanje zadataka u stvarnom svijetu, poput zakazivanja sastanaka i slanja e-pošte.

Korak-po-korak promptanje

Tražite od modela da prikaže svoj proces reasoninga kako biste lakše revidirali donošenje odluka tijekom zadataka s ekstremno dugim context windowom.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Često Postavljana Pitanja

Pronađite odgovore na česta pitanja o ovom modelu