openai

GPT-5.3 Codex

GPT-5.3 Codex je OpenAI 2026 frontier coding agent, koji sadrži 400K context window, 77.3% Terminal-Bench rezultat i superiornu logiku za kompleksan softver...

Coding AgentGPT-5OpenAISoftware EngineeringAutonomous AI
openai logoopenaiGPT5. februar 2026.
Контекст
400Kтокена
Макс. излаз
128Kтокена
Улазна цена
$1.75/ 1M
Излазна цена
$14.00/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
81%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-5.3 Codex је постигао 81% на овом бенчмарку.
HLE
36%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-5.3 Codex је постигао 36% на овом бенчмарку.
MMLU
93%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-5.3 Codex је постигао 93% на овом бенчмарку.
MMLU Pro
83%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-5.3 Codex је постигао 83% на овом бенчмарку.
SimpleQA
58%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-5.3 Codex је постигао 58% на овом бенчмарку.
IFEval
94%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-5.3 Codex је постигао 94% на овом бенчмарку.
AIME 2025
94%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-5.3 Codex је постигао 94% на овом бенчмарку.
MATH
96%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-5.3 Codex је постигао 96% на овом бенчмарку.
GSM8k
99%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-5.3 Codex је постигао 99% на овом бенчмарку.
MGSM
96%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-5.3 Codex је постигао 96% на овом бенчмарку.
MathVista
78%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-5.3 Codex је постигао 78% на овом бенчмарку.
SWE-Bench
57%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-5.3 Codex је постигао 57% на овом бенчмарку.
HumanEval
93%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-5.3 Codex је постигао 93% на овом бенчмарку.
LiveCodeBench
71%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-5.3 Codex је постигао 71% на овом бенчмарку.
MMMU
84%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-5.3 Codex је постигао 84% на овом бенчмарку.
MMMU Pro
64%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-5.3 Codex је постигао 64% на овом бенчмарку.
ChartQA
91%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-5.3 Codex је постигао 91% на овом бенчмарку.
DocVQA
95%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-5.3 Codex је постигао 95% на овом бенчмарку.
Terminal-Bench
77.3%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-5.3 Codex је постигао 77.3% на овом бенчмарку.
ARC-AGI
54%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-5.3 Codex је постигао 54% на овом бенчмарку.

О моделу GPT-5.3 Codex

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-5.3 Codex.

Nova era autonomnog razvoja

GPT-5.3 Codex je OpenAI najsposobniji agentic model za kodiranje. On premošćuje jaz između statičnog generisanja koda i autonomnog softverskog inženjeringa. Izgrađen na GPT-5 arhitekturi, integriše specijalizovano profesionalno znanje sa naprednim rezonovanjem za obavljanje dugoročnih zadataka kao što su administracija sistema, praćenje deployment-a i arhitektonsko refaktorisanje. Model uključuje usmeravanje tokom samog zadatka (mid-task steering), što omogućava developerima da komuniciraju i vode agenta u realnom vremenu dok navigira kroz složene projekte.

Rekurzivna inteligencija i performanse

OpenAI je trenirao ovaj model koristeći sopstvene ranije iteracije za debagovanje i optimizaciju sopstvenog deployment-a. Ovo predstavlja značajan korak ka sistemima koji se sami unapređuju. Model briljira u Terminal-Bench 2.0 okruženjima, demonstrirajući sposobnost upravljanja terminalima uživo, pokretanja unit testova i iterativnog ispravljanja bagova bez ljudske intervencije. Ovaj pristup rekurzivnog treniranja rezultirao je efikasnim korišćenjem tokens i 400.000-token context window kapacitetom. Može da obradi čitave enterprise repozitorijume u jednom prolazu.

Besprekorna profesionalna integracija

Dostupan kroz namensku Codex aplikaciju, CLI i IDE ekstenzije, model se integriše u savremene radne procese. Efikasan je u identifikovanju zero-day eksploita, optimizaciji arhitektura data pajplajna i vršenju produkcionih revizija nasleđenih baza koda. Sa superiornom logikom i konkurentnom cenom, služi kao alat visokih performansi za najzahtevnije zadatke softverskog inženjeringa.

GPT-5.3 Codex

Случајеви употребе за GPT-5.3 Codex

Откријте различите начине коришћења модела GPT-5.3 Codex за постизање одличних резултата.

Autonomni softverski inženjering

Arhitektura i izgradnja modularnih, multi-file softverskih projekata na osnovu specifikacija visokog nivoa.

Revizija produkcionog koda

Analiza živih baza koda radi pronalaženja problema sa konkurentnošću, curenja memorije i arhitektonskog tehničkog duga.

DevOps automatizacija u realnom vremenu

Upravljanje radnim procesima u terminalu, uključujući podešavanje servera, deployment kontejnera i skaliranje klastera.

Sanacija bezbednosnih ranjivosti

Identifikovanje i popravljanje zero-day eksploita i softverskih ranjivosti uz visoku sposobnost defanzivne logike.

Interaktivno prototipiranje

Generisanje landing stranica i web aplikacija spremnih za produkciju na osnovu rukom crtanih skica ili nedovoljno definisanih prompt-ova.

Arhitektura data pajplajna

Praćenje i optimizacija složenih tokova podataka kroz više slojeva obrade i asinhrona okruženja.

Предности

Ограничења

State-of-the-art logika za kodiranje: Industrijski vodeći 77,3% rezultat na Terminal-Bench 2.0 i superiorne performanse na SWE-Bench Pro.
Funkcionalna konciznost: Povremeno daje prednost funkcionalnoj konciznosti nad ekstremnom arhitektonskom dubinom koja se nalazi u modelima kao što je o3-pro.
Bez premca odnos cene i performansi: Pruža frontier agentic mogućnosti po ceni od približno 1/7 u odnosu na rivale kao što je Opus 4.6.
Podrazumevani estetski izbori: Iako logički besprekorni, početni UI dizajn za aplikacije ponekad može da pati od nedostatka modernog vizuelnog sjaja.
Rekurzivna samo-optimizacija: Izgrađen korišćenjem sopstvene arhitekture za identifikaciju bagova i optimizaciju treninga za visoku efikasnost.
Nedostaci resursa u visokorizičnim situacijama: Povremeno propušta zadatke čišćenja određenih resursa u složenim simulacijama hardvera i softvera.
Interaktivno usmeravanje u realnom vremenu: Jedinstvena mogućnost primanja direktiva od ljudi tokom samog zadatka, smanjujući potrebu za dugim iterativnim petljama.
Trenje u ekosistemu: Primarni pristup je optimizovan za specijalizovanu Codex aplikaciju i CLI, što predstavlja krivu učenja za standardne API korisnike.

АПИ брзи старт

openai/gpt-5.3-codex

Погледај документацију
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-5.3 Codex

Погледајте шта заједница мисли о моделу GPT-5.3 Codex

GPT-5.3 Codex deluje manje kao opšti chatbot, a više kao model čistog inženjera.
Federal-Piano8695
reddit
Codex isporučuje bolji kod po približno 1/7 cene. Performanse po ceni su jednostavno apsurdne.
sergeykarayev
reddit
Nije samo izvršavao moje instrukcije. Donosio je inteligentne odluke. Imao je nešto što je delovalo kao rasuđivanje.
mattshumer_
twitter
Upravo smo migrirali celokupnu backend orkestraciju na Codex agente i pouzdanost je zastrašujuće visoka.
HackerNewsUser99
hackernews
GPT 5.3 Codex je postavio novi rekord na Terminal-Bench 2.0. 77,3% je ogroman skok u odnosu na prethodnu verziju.
bridgemindai
twitter
Mogućnost rukovanja sa 400k context window omogućava reviziju čitavih enterprise repozitorijuma odjednom.
cdcore
other

Видео снимци о моделу GPT-5.3 Codex

Гледајте туторијале, рецензије и дискусије о моделу GPT-5.3 Codex

Codex je zaista pravilno implementirao i jedan i drugi view change, dok je Claude samo mapirao na taster jedan.

Codex je zapravo shvatio glavni uzrok, ali je takođe identifikovao to kao potencijalni problem i popravio ga.

Svideo mi se način na koji se odbija od zgrada, fizika je delovala najprirodnije.

U poređenju sa Gemini 3.1, Codex mnogo bolje rukuje logikom više fajlova bez mnogo odstupanja.

Brzina agentic petlji ovde je primetno brža nego kod Claude Opus 4.6.

Ovo nije još jedan pomoćnik za kod. Ovo je AI koji gradi ceo tvoj projekat dok ti posmatraš.

Mogućnost da jednostavno ubaciš kompletan set dokumentacije u prompt je ludilo.

Možeš bukvalno da vidiš kako ispravlja svoje greške u terminalu u realnom vremenu.

Ako radiš na razvoju SEO alata, automatizovane skripte za scraping koje piše su spremne za produkciju.

Uspeo je da deployuje ceo sajt na Vercel bez da sam dodirnuo ijedno dugme.

GPT-5.3 Codex je naš prvi model koji je bio od ključnog značaja u kreiranju samog sebe.

Efikasnost u povećanju onoga što može da uradi sa manje tokens je zaista fantastična.

Vidimo ogroman napredak u tome kako rukuje hardverskom integracijom u stvarnom svetu.

Engine za reasoning iza odluka o kodiranju je daleko robusniji nego kod standardnog GPT-5.

Terminal-Bench rezultati su jedno, ali videti ga kako se snalazi kroz linux fajl sistem je nešto sasvim drugo.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GPT-5.3 Codex

Stručni saveti za maksimalno iskorišćenje GPT-5.3 Codex.

Omogućite real-time usmeravanje

Aktivirajte follow-up ponašanje u Codex podešavanjima da biste vodili model tokom izrade bez gubitka konteksta.

Iskoristite Plan Mode

Koristite Plan komandu za složena refaktorisanja kako bi model izložio svoju strategiju pre nego što počne sa izmenama.

Batch pregled Pull Request-ova

Ubacite čitave feature grane u 400K context window radi dubokog integration testiranja.

Kompresija konteksta

Oslonite se na nativnu kompresiju konteksta za dugotrajne agentic sesije kako biste zadržali fokus na projektu.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Често Постављана Питања о GPT-5.3 Codex

Пронађите одговоре на честа питања о GPT-5.3 Codex