openai

GPT-5.3 Codex

GPT-5.3 Codex je OpenAI-jev frontier agent za kodiranje za 2026. godinu, koji sadrži context window od 400K, 77,3% Terminal-Bench rezultat i superiornu logiku...

Agent za kodiranjeGPT-5OpenAISoftverski inženjeringAutonomni AI
openai logoopenaiGPT5. veljače 2026.
Kontekst
400Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$1.75/ 1M
Izlazna cijena
$14.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
81%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.3 Codex je postigao 81% na ovom benchmarku.
HLE
36%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.3 Codex je postigao 36% na ovom benchmarku.
MMLU
93%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.3 Codex je postigao 93% na ovom benchmarku.
MMLU Pro
83%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.3 Codex je postigao 83% na ovom benchmarku.
SimpleQA
58%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.3 Codex je postigao 58% na ovom benchmarku.
IFEval
94%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.3 Codex je postigao 94% na ovom benchmarku.
AIME 2025
94%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.3 Codex je postigao 94% na ovom benchmarku.
MATH
96%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.3 Codex je postigao 96% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.3 Codex je postigao 99% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.3 Codex je postigao 96% na ovom benchmarku.
MathVista
78%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.3 Codex je postigao 78% na ovom benchmarku.
SWE-Bench
57%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.3 Codex je postigao 57% na ovom benchmarku.
HumanEval
93%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.3 Codex je postigao 93% na ovom benchmarku.
LiveCodeBench
71%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.3 Codex je postigao 71% na ovom benchmarku.
MMMU
84%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.3 Codex je postigao 84% na ovom benchmarku.
MMMU Pro
64%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.3 Codex je postigao 64% na ovom benchmarku.
ChartQA
91%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.3 Codex je postigao 91% na ovom benchmarku.
DocVQA
95%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.3 Codex je postigao 95% na ovom benchmarku.
Terminal-Bench
77.3%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.3 Codex je postigao 77.3% na ovom benchmarku.
ARC-AGI
54%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.3 Codex je postigao 54% na ovom benchmarku.

O modelu GPT-5.3 Codex

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.3 Codex.

Nova era autonomnog razvoja

GPT-5.3 Codex je OpenAI-jev najsposobniji agentic model za kodiranje. On premošćuje jaz između statičkog generiranja koda i autonomnog softverskog inženjeringa. Izgrađen na GPT-5 arhitekturi, integrira specijalizirano profesionalno znanje s naprednim zaključivanjem za obavljanje dugoročnih zadataka poput administracije sustava, praćenja deploymenta i arhitektonskog refaktoringa. Model uključuje usmjeravanje tijekom izvršavanja zadatka. To developerima omogućuje interakciju i navođenje agenta u stvarnom vremenu dok korača kroz složene projekte.

Rekurzivna inteligencija i performanse

OpenAI je trenirao ovaj model koristeći vlastite ranije iteracije kako bi samog sebe debugirao i optimizirao svoj deployment. To predstavlja značajan korak prema samousavršavajućim sustavima. Izvrsno se snalazi u Terminal-Bench 2.0 okruženjima, demonstrirajući sposobnost upravljanja aktivnim terminalima, pokretanja unit testova i iterativnog popravljanja bugova bez ljudske intervencije. Ovaj pristup rekurzivnog treniranja rezultirao je učinkovitom potrošnjom tokena i context windowom od 400.000 tokena. Može obraditi cijele repozitorije poduzeća u jednom prolazu.

Besprijekorna profesionalna integracija

Dostupan kroz namjensku Codex aplikaciju, CLI i IDE ekstenzije, model se integrira u moderne tijekove rada. Učinkovit je u identificiranju zero-day eksploita, optimiziranju arhitektura podatkovnih cjevovoda i obavljanju produkcijskih revizija naslijeđenih baza koda. Uz superiornu logiku i konkurentne cijene, služi kao alat visokih performansi za zahtjevne softverske inženjerske zadatke.

GPT-5.3 Codex

Slučajevi korištenja za GPT-5.3 Codex

Otkrijte različite načine korištenja modela GPT-5.3 Codex za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Arhitektura i izgradnja modularnih softverskih projekata s više datoteka na temelju visokorazinskih specifikacija.

Revizija produkcijskog koda

Analiza aktivnih baza koda zbog problema s konkurentnošću, curenja memorije i arhitektonskog tehničkog duga.

DevOps automatizacija u stvarnom vremenu

Upravljanje tijekovima rada temeljenim na terminalu, uključujući postavljanje poslužitelja, deployment kontejnera i skaliranje klastera.

Sanacija kibernetičkih ranjivosti

Identificiranje i popravljanje zero-day eksploita i softverskih ranjivosti pomoću visoko sposobne defenzivne logike.

Interaktivno prototipiranje

Generiranje web stranica i aplikacija spremnih za produkciju iz rukom nacrtanih wireframeova ili nedovoljno specifičnih promptova.

Arhitektura podatkovnih cjevovoda

Praćenje i optimizacija složenih tokova podataka kroz više slojeva obrade i asinkronih okruženja.

Prednosti

Ograničenja

State-of-the-art logika kodiranja: Vodeći u industriji rezultat od 77,3% na Terminal-Bench 2.0 i vrhunske performanse na SWE-Bench Pro.
Funkcionalna sažetost: Povremeno daje prednost funkcionalnoj sažetosti u odnosu na ekstremnu arhitektonsku dubinu viđenu kod modela poput o3-pro.
Neponovljiv omjer cijene i performansi: Donosi frontier agentic mogućnosti po otprilike 1/7 cijene suparnika poput Opus 4.6.
Zadani estetski izgled: Iako je logički besprijekoran, početni UI dizajn aplikacija ponekad može nedostajati moderne vizualne uglađenosti.
Rekurzivna samooptimizacija: Izgrađen korištenjem vlastite arhitekture za identificiranje bugova i optimizaciju treninga za visoku učinkovitost.
Nedostaci kod resursa u kritičnim situacijama: Povremeno propušta specifične zadatke čišćenja resursa u složenim simulacijama hardvera i softvera.
Interaktivno usmjeravanje u stvarnom vremenu: Jedinstvena sposobnost primanja uputa od ljudi tijekom zadatka, smanjujući potrebu za dugim iterativnim petljama.
Trenje ekosustava: Primarni pristup optimiziran je za specijaliziranu Codex aplikaciju i CLI, što predstavlja krivulju učenja za standardne API korisnike.

API brzi početak

openai/gpt-5.3-codex

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.3 Codex

Pogledajte što zajednica misli o modelu GPT-5.3 Codex

GPT-5.3 Codex djeluje manje kao opći chatbot, a više kao čisti inženjerski model.
Federal-Piano8695
reddit
Codex isporučuje bolji kod po otprilike 1/7 cijene. Performanse po cijeni su jednostavno apsurdne.
sergeykarayev
reddit
Nije samo izvršavao moje upute. Donosio je inteligentne odluke. Imao je nešto što je djelovalo kao prosuđivanje.
mattshumer_
twitter
Upravo smo migrirali cijelu našu backend orkestraciju na Codex agente i pouzdanost je zastrašujuće visoka.
HackerNewsUser99
hackernews
GPT 5.3 Codex postavio je novi visoki rezultat na Terminal-Bench 2.0. 77,3% je ogroman skok u odnosu na prethodnu verziju.
bridgemindai
twitter
Sposobnost rukovanja context windowom od 400k omogućuje reviziju cijelih repozitorija poduzeća odjednom.
cdcore
other

Videozapisi o modelu GPT-5.3 Codex

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.3 Codex

Codex je zapravo ispravno implementirao i jedan i dva dok je vršio promjene pogleda, dok ih je Claude samo mapirao na ključ jedan.

Codex je zapravo shvatio glavni uzrok, ali ga je i identificirao kao potencijalni problem te ga popravio.

Svidio mi se način na koji se odbijalo od zgrada, fizika se činila najprirodnijom.

Uspoređujući ovo s Gemini 3.1, Codex upravlja logikom više datoteka s puno manje odstupanja.

Brzina agentic petlji ovdje je osjetno veća nego kod Claude Opus 4.6.

Ovo nije još jedan pomoćnik za kodiranje. Ovo je AI koji gradi cijeli vaš projekt dok vi gledate.

Sposobnost da jednostavno ubacite cijeli set dokumentacije u prompt je nevjerojatna.

Doslovno ga možete vidjeti kako ispravlja vlastite pogreške u terminalu u stvarnom vremenu.

Ako radite na razvoju SEO alata, automatizirane skripte za scraping koje piše spremne su za produkciju.

Uspio je deployati cijelu stranicu na Vercel bez da sam dodirnuo ijedan gumb.

GPT-5.3 Codex je naš prvi model koji je bio ključan u stvaranju samog sebe.

Učinkovitost u povećanju onoga što može učiniti s manje tokena je uistinu fantastična.

Vidimo ogroman skok u tome kako upravlja integracijom hardvera iz stvarnog svijeta.

Reasoning engine iza odluka o kodiranju daleko je robusniji od standardnog GPT-5.

Terminal-Bench rezultati su jedno, ali vidjeti ga kako se kreće kroz linux datotečni sustav je nešto sasvim drugo.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.3 Codex

Stručni savjeti za maksimalno iskorištavanje GPT-5.3 Codex.

Omogućite usmjeravanje u stvarnom vremenu

Aktivirajte ponašanje praćenja u postavkama Codexa kako biste usmjeravali model tijekom rada bez gubitka konteksta.

Iskoristite način rada Plan

Koristite naredbu Plan za složene refaktoringe kako bi model iznio svoju strategiju prije izmjena.

Grupni pregledi pull requestova

Učitajte cijele grane značajki u context window od 400K za dubinsko integracijsko testiranje.

Sažimanje konteksta

Oslonite se na izvornu kompresiju konteksta za dugotrajne agentic sesije kako biste zadržali fokus na projekt.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Često Postavljana Pitanja o GPT-5.3 Codex

Pronađite odgovore na česta pitanja o GPT-5.3 Codex