openai

GPT-5.3 Codex

GPT-5.3 Codex je OpenAI-jev frontier agent za programiranje iz 2026., s context windowom od 400K, Terminal-Bench rezultatom od 77,3% i vrhunskom logikom za...

Agent za programiranjeGPT-5OpenAISoftversko inženjerstvoAutonomna AI
openai logoopenaiGPT-55. veljače 2026.
Kontekst
400Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$1.75/ 1M
Izlazna cijena
$14.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
81%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.3 Codex je postigao 81% na ovom benchmarku.
HLE
36%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.3 Codex je postigao 36% na ovom benchmarku.
MMLU
93%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.3 Codex je postigao 93% na ovom benchmarku.
MMLU Pro
83%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.3 Codex je postigao 83% na ovom benchmarku.
SimpleQA
58%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.3 Codex je postigao 58% na ovom benchmarku.
IFEval
94%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.3 Codex je postigao 94% na ovom benchmarku.
AIME 2025
94%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.3 Codex je postigao 94% na ovom benchmarku.
MATH
96%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.3 Codex je postigao 96% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.3 Codex je postigao 99% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.3 Codex je postigao 96% na ovom benchmarku.
MathVista
78%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.3 Codex je postigao 78% na ovom benchmarku.
SWE-Bench
57%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.3 Codex je postigao 57% na ovom benchmarku.
HumanEval
93%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.3 Codex je postigao 93% na ovom benchmarku.
LiveCodeBench
71%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.3 Codex je postigao 71% na ovom benchmarku.
MMMU
84%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.3 Codex je postigao 84% na ovom benchmarku.
MMMU Pro
64%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.3 Codex je postigao 64% na ovom benchmarku.
ChartQA
91%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.3 Codex je postigao 91% na ovom benchmarku.
DocVQA
95%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.3 Codex je postigao 95% na ovom benchmarku.
Terminal-Bench
77.3%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.3 Codex je postigao 77.3% na ovom benchmarku.
ARC-AGI
54%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.3 Codex je postigao 54% na ovom benchmarku.

O modelu GPT-5.3 Codex

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.3 Codex.

Nova era autonomnog razvoja

GPT-5.3 Codex je OpenAI-jev najsposobniji agentic model za programiranje, dizajniran da premosti jaz između statičkog generiranja koda i autonomnog softverskog inženjerstva. Izgrađen na GPT-5 arhitekturi sljedeće generacije, integrira specijalizirano stručno znanje s naprednim reasoningom za rješavanje dugotrajnih zadataka poput administracije sustava, praćenja deploymenta i arhitektonskog refaktoringa. Model se ističe svojom mogućnošću 'usmjeravanja usred zadatka', omogućujući developerima interakciju i vođenje agenta u stvarnom vremenu dok on upravlja složenim projektima.

Rekurzivna inteligencija i performanse

Budući da je treniran koristeći vlastite ranije iteracije za debugiranje i optimizaciju vlastitog deploymenta, GPT-5.3 Codex predstavlja značajan korak prema AI sustavima koji se sami poboljšavaju. Briljira u Terminal-Bench 2.0 okruženjima, pokazujući sposobnost upravljanja terminalima uživo, pokretanja unit testova i iterativnog ispravljanja bugova bez ljudske intervencije. Ovaj rekurzivni pristup treningu rezultirao je visoko učinkovitim korištenjem tokens i masivnim context windowom od 400.000 tokens, sposobnim za analizu čitavih korporativnih repozitorija u jednom prolazu.

Besprijekorna profesionalna integracija

Dostupan putem namjenske Codex aplikacije, CLI-ja i ekstenzija za IDE, model je dizajniran za duboku integraciju u moderne workflowove. Posebno je učinkovit u identificiranju zero-day eksploita, optimizaciji arhitektura data pipelinea i provođenju produkcijskih audita legacy codebaseova. S vrhunskom logikom i konkurentnom cijenom, brzo je postao zlatni standard za najzahtjevnije zadatke softverskog inženjerstva.

GPT-5.3 Codex

Slučajevi korištenja za GPT-5.3 Codex

Otkrijte različite načine korištenja modela GPT-5.3 Codex za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Arhitektura i izgradnja modularnih softverskih projekata s više datoteka na temelju specifikacija visoke razine.

Audit produkcijskog koda

Analiza postojećih codebaseova za probleme s konkurentnošću, curenjem memorije i arhitektonskim tehničkim dugom.

Automatizacija DevOps-a u stvarnom vremenu

Upravljanje workflowovima temeljenim na terminalu, uključujući postavljanje servera, deployment kontejnera i skaliranje klastera.

Sanacija sigurnosnih ranjivosti

Identifikacija i popravljanje zero-day eksploita i softverskih ranjivosti pomoću visokokvalitetne obrambene logike.

Interaktivno prototipiranje

Generiranje landing stranica i web aplikacija spremnih za produkciju iz rukom crtanih skica ili nedovoljno definiranih prompts.

Arhitektura data pipelinea

Praćenje i optimizacija kompleksnih protoka podataka kroz više procesnih slojeva i asinkronih okruženja.

Prednosti

Ograničenja

State-of-the-art logika programiranja: Vodeći u industriji s 77,3% Terminal-Bench 2.0 rezultatom i vrhunskim performansama na SWE-Bench Pro.
Komprimirani detalji: Povremeno daje prioritet funkcionalnoj sažetosti nad ekstremnom arhitektonskom dubinom kakva se nalazi u modelima poput o3-pro.
Nenadmašan omjer cijene i performansi: Pruža frontier agentic mogućnosti uz otprilike 1/7 cijene svog najbližeg rivala, Opus 4.6.
Zadane postavke estetike: Iako je logički besprijekoran, početni dizajni korisničkog sučelja za aplikacije ponekad mogu oskudijevati modernim vizualnim sjajem.
Rekurzivna samooptimizacija: Izgrađen korištenjem vlastite arhitekture za identifikaciju bugova i optimizaciju treninga, što rezultira visokom učinkovitošću.
Nedostaci kod resursa visokog rizika: Povremeno propušta specifične zadatke čišćenja resursa u kompleksnim simulacijama hardvera i softvera.
Interaktivno usmjeravanje u stvarnom vremenu: Jedinstvena sposobnost primanja uputa od ljudi usred zadatka, smanjujući potrebu za dugim iterativnim petljama.
Trenje u ekosustavu: Primarni pristup ograničen je na specijaliziranu Codex aplikaciju i CLI, što predstavlja krivulju učenja za standardne korisnike.

API brzi početak

openai/gpt-5.3-codex

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.3 Codex

Pogledajte što zajednica misli o modelu GPT-5.3 Codex

"Zapravo su izbacili GPT-5.3 Codex čim je izašao Opus 4.6 LOL"
ShreckAndDonkey123
reddit
"Codex isporučuje bolji kod uz otprilike 1/7 cijene"
sergeykarayev
reddit
"Performanse po cijeni GPT-5.3 Codex-a su apsurdne"
VraserX
x
"Naložio sam GPT-5.3-Codex-Sparku da pročita vlastitu servisnu stranicu i izgradi novu web stranicu. Završio je u tren oka"
Yohei Takanashi
x
"Ovaj model je ispravno rezonirao o Swift actor izolaciji... na dan izlaska"
HeroicTardigrade
reddit
"Upravo smo migrirali čitavu orkestraciju backend-a na Codex agente i pouzdanost je zastrašujuće visoka"
HackerNewsUser99
hackernews

Videozapisi o modelu GPT-5.3 Codex

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.3 Codex

GPT-5.3 Codex je naš prvi model koji je bio instrumentalan u stvaranju samog sebe

Učinkovitost u povećanju onoga što može učiniti s manje tokens je uistinu fantastična

Ovaj se kalem zapravo pravilno vrti dok se mlaznica pomiče upravo ovdje u simulaciji

Vidimo ogroman skok u tome kako upravlja integracijom hardvera u stvarnom svijetu

Rekurzivna petlja treninga ovdje doslovno mijenja pravila igre za preciznost

Nisam se htio vratiti na GPT 5.2 jer se on jednostavno čini sporim

Osjećaj je kao veliko ubrzanje... rekli su mi da je 25% brži od prethodnog modela

Latency na malim izmjenama koda sada je praktički nepostojeći

Rad s velikim legacy codebaseovima je područje gdje context window od 400K uistinu briljira

Ovo je prvi put da osjećam kako AI uistinu razumije arhitekturu mog projekta

Ovo nije samo još jedan pomoćnik za kod. Ovo je AI koji gradi cijeli vaš projekt dok vi gledate

Ono što mi je prije trajalo danima, sada s ovim traje satima

Mogućnost jednostavnog ubacivanja cijelog seta dokumentacije u prompt je nevjerojatna

Doslovno možete vidjeti kako ispravlja vlastite pogreške u terminalu u stvarnom vremenu

Za bilo koga tko gradi SaaS, ovo će biti vaš najvrjedniji zaposlenik

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.3 Codex

Stručni savjeti za maksimalno iskorištavanje GPT-5.3 Codex.

Omogućite usmjeravanje u stvarnom vremenu

Aktivirajte 'follow-up' ponašanje u postavkama Codex-a kako biste vodili model usred procesa izgradnje.

Iskoristite Plan način rada

Koristite 'Plan' naredbu za kompleksne refaktore kako bi model skicirao svoju strategiju prije uređivanja.

Skupne recenzije Pull Requestova

Iskoristite context window od 400K kako biste modelu proslijedili čitave feature grane za duboko integracijsko testiranje.

Kompaktiranje konteksta

Oslonite se na nativno kompaktiranje konteksta za dugotrajne agentic sesije kako biste zadržali fokus na projektu.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Često Postavljana Pitanja o GPT-5.3 Codex

Pronađite odgovore na česta pitanja o GPT-5.3 Codex