openai

GPT-5.3 Codex

GPT-5.3 Codex je OpenAI frontier programerski agent iz 2026. godine, sa 400K context window, 77,3% Terminal-Bench rezultatom i superiornom logikom za...

Programerski agentGPT-5OpenAISoftversko inženjerstvoAutonomna AI
openai logoopenaiGPT-5February 5, 2026
Контекст
400Kтокена
Макс. излаз
128Kтокена
Улазна цена
$1.75/ 1M
Излазна цена
$14.00/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
81%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-5.3 Codex је постигао 81% на овом бенчмарку.
HLE
36%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-5.3 Codex је постигао 36% на овом бенчмарку.
MMLU
93%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-5.3 Codex је постигао 93% на овом бенчмарку.
MMLU Pro
83%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-5.3 Codex је постигао 83% на овом бенчмарку.
SimpleQA
58%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-5.3 Codex је постигао 58% на овом бенчмарку.
IFEval
94%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-5.3 Codex је постигао 94% на овом бенчмарку.
AIME 2025
94%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-5.3 Codex је постигао 94% на овом бенчмарку.
MATH
96%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-5.3 Codex је постигао 96% на овом бенчмарку.
GSM8k
99%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-5.3 Codex је постигао 99% на овом бенчмарку.
MGSM
96%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-5.3 Codex је постигао 96% на овом бенчмарку.
MathVista
78%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-5.3 Codex је постигао 78% на овом бенчмарку.
SWE-Bench
57%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-5.3 Codex је постигао 57% на овом бенчмарку.
HumanEval
93%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-5.3 Codex је постигао 93% на овом бенчмарку.
LiveCodeBench
71%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-5.3 Codex је постигао 71% на овом бенчмарку.
MMMU
84%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-5.3 Codex је постигао 84% на овом бенчмарку.
MMMU Pro
64%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-5.3 Codex је постигао 64% на овом бенчмарку.
ChartQA
91%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-5.3 Codex је постигао 91% на овом бенчмарку.
DocVQA
95%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-5.3 Codex је постигао 95% на овом бенчмарку.
Terminal-Bench
77.3%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-5.3 Codex је постигао 77.3% на овом бенчмарку.
ARC-AGI
54%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-5.3 Codex је постигао 54% на овом бенчмарку.

О моделу GPT-5.3 Codex

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-5.3 Codex.

Nova era autonomnog razvoja

GPT-5.3 Codex je najsposobniji OpenAI agentic model za programiranje, dizajniran da premosti jaz između statičkog generisanja koda i autonomnog softverskog inženjerstva. Izgrađen na sledećoj generaciji GPT-5 arhitekture, on integriše specijalizovano profesionalno znanje sa naprednim reasoning sposobnostima za rešavanje dugoročnih zadataka kao što su administracija sistema, monitoring deployment-a i arhitekturni refaktoring. Model se izdvaja po svojoj 'mid-task steering' sposobnosti, koja omogućava programerima da komuniciraju sa agentom i vode ga u realnom vremenu dok se on kreće kroz kompleksne projekte.

Rekurzivna inteligencija i performanse

Budući da je treniran koristeći sopstvene ranije iteracije za debug i optimizaciju sopstvene implementacije, GPT-5.3 Codex predstavlja značajan korak ka AI sistemima koji se sami unapređuju. Briljira u Terminal-Bench 2.0 okruženjima, pokazujući sposobnost da upravlja terminalima uživo, pokreće unit testove i iterativno ispravlja bagove bez ljudske intervencije. Ovaj rekurzivni pristup treningu rezultirao je veoma efikasnom upotrebom tokena i masivnim context window od 400.000 tokena, koji je sposoban da obradi čitave korporativne repozitorijume u jednom prolazu.

Besprizorna profesionalna integracija

Dostupan preko namenske Codex aplikacije, CLI-ja i ekstenzija za IDE, model je dizajniran za duboku integraciju u moderne radne tokove. Posebno je efikasan u identifikovanju zero-day eksploita, optimizaciji arhitektura data pipeline-a i sprovođenju produkcionih audita starih baza koda. Sa svojom superiornom logikom i konkurentnom cenom, brzo je postao zlatni standard za najzahtevnije zadatke u softverskom inženjerstvu.

GPT-5.3 Codex

Случајеви употребе за GPT-5.3 Codex

Откријте различите начине коришћења модела GPT-5.3 Codex за постизање одличних резултата.

Autonomno softversko inženjerstvo

Projektovanje i izgradnja modularnih softverskih projekata sa više fajlova na osnovu specifikacija visokog nivoa.

Audit produkcionog koda

Analiza živih baza koda radi pronalaženja problema sa konkurentnošću, curenja memorije i arhitekturalnog tehničkog duga.

Real-Time DevOps automatizacija

Upravljanje radnim tokovima u terminalu, uključujući podešavanje servera, deployment kontejnera i skaliranje klastera.

Sanacija sajber-bezbednosnih propusta

Identifikovanje i popravljanje zero-day eksploita i softverskih ranjivosti uz pomoć visokokvalitetne odbrambene logike.

Interaktivno prototipovanje

Generisanje landing stranica i web aplikacija spremnih za produkciju na osnovu rukom crtanih skica ili nedovoljno specifikovanih promptova.

Arhitektura data pipeline-a

Praćenje i optimizacija kompleksnih tokova podataka kroz više slojeva obrade i asinhrona okruženja.

Предности

Ограничења

State-of-the-art logika programiranja: Vodeći u industriji sa 77,3% poena na Terminal-Bench 2.0 i superiornim performansama na SWE-Bench Pro.
Sažeti detalji: Povremeno daje prioritet funkcionalnoj konciznosti u odnosu na ekstremnu arhitektonsku dubinu koja se nalazi u modelima kao što je o3-pro.
Nenadmašan odnos cene i performansi: Pruža frontier agentic mogućnosti po ceni od otprilike 1/7 u odnosu na najbližeg rivala, Opus 4.6.
Podrazumevana estetika: Iako je logički besprekoran, početni dizajni korisničkog interfejsa za aplikacije ponekad mogu biti bez modernog vizuelnog sjaja.
Rekurzivna samooptimizacija: Napravljen korišćenjem sopstvene arhitekture za identifikaciju bagova i optimizaciju treninga, što rezultira visokom efikasnošću.
Propusti u resursima visokog rizika: Povremeno propušta specifične zadatke čišćenja resursa u kompleksnim simulacijama hardvera i softvera.
Interaktivno Real-Time Steering: Jedinstvena sposobnost da prihvata uputstva od ljudi usred zadatka, smanjujući potrebu za dugim iterativnim ciklusima.
Trenje u ekosistemu: Primarni pristup je ograničen na specijalizovanu Codex aplikaciju i CLI, što predstavlja izazov u učenju za standardne korisnike.

АПИ брзи старт

openai/gpt-5.3-codex

Погледај документацију
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-5.3 Codex

Погледајте шта заједница мисли о моделу GPT-5.3 Codex

"Zapravo su izbacili GPT-5.3 Codex istog trenutka kada je izašao Opus 4.6 LOL"
ShreckAndDonkey123
reddit
"Codex isporučuje bolji kôd po ceni od otprilike 1/7"
sergeykarayev
reddit
"Performanse po ceni kod GPT-5.3 Codex su prosto apsurdne"
VraserX
x
"Naterao sam GPT-5.3-Codex-Spark da pročita sopstveni servisni sajt i napravi novi sajt. Završio je za tren oka"
Yohei Takanashi
x
"Ovaj model je ispravno primenio reasoning o Swift actor izolaciji... onog dana kada je izašao"
HeroicTardigrade
reddit
"Upravo smo migrirali celu orkestraciju backend-a na Codex agente i pouzdanost je zastrašujuće visoka"
HackerNewsUser99
hackernews

Видео снимци о моделу GPT-5.3 Codex

Гледајте туторијале, рецензије и дискусије о моделу GPT-5.3 Codex

GPT-5.3 Codex je naš prvi model koji je bio ključan u sopstvenom kreiranju

Efikasnost u povećanju onoga što može da uradi sa manje tokens je zaista fantastična

Ovaj kalem se zapravo pravilno okreće dok se mlaznica pomera ovde u simulaciji

Vidimo ogroman skok u tome kako se nosi sa integracijom hardvera u stvarnom svetu

Rekurzivna petlja treninga je bukvalno game changer za preciznost

Nisam želeo da se vraćam na GPT 5.2 jer jednostavno deluju sporo

Zaista se oseća veliki skok u brzini... rekli su mi da je 25% brži od prethodnog modela

Latency kod malih izmena koda sada praktično ne postoji

Rad sa velikim legacy bazama koda je mesto gde context window od 400K zaista briljira

Ovo je prvi put da osećam da AI zaista razume arhitekturu mog projekta

Ovo nije još jedan pomoćnik za kôd. Ovo je AI koji gradi vaš ceo projekat dok vi gledate

Ono za šta su mi ranije trebali dani, sada sa ovim traje satima

Sposobnost da samo ubacite ceo set dokumentacije u prompt je neverovatna

Doslovno možete videti kako ispravlja sopstvene greške u terminalu u realnom vremenu

Za bilo koga ko pravi SaaS, ovo će biti vaš najvredniji zaposleni

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GPT-5.3 Codex

Stručni saveti za maksimalno iskorišćenje GPT-5.3 Codex.

Omogućite Real-Time Steering

Aktivirajte funkciju praćenja u Codex podešavanjima kako biste usmeravali model usred procesa izgradnje.

Iskoristite Plan Mode

Koristite komandu 'Plan' za kompleksne refaktore kako bi model napravio plan strategije pre samog editovanja.

Grupne recenzije Pull Request-ova

Iskoristite context window od 400K da pošaljete modelu cele grane funkcionalnosti (feature branches) radi dubokog testiranja integracije.

Context Compaction

Oslonite se na izvorni context compaction za dugotrajne agentic sesije kako biste zadržali fokus na projektu.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Често Постављана Питања о GPT-5.3 Codex

Пронађите одговоре на честа питања о GPT-5.3 Codex