openai

GPT-5.3 Codex

GPT-5.3 Codex er OpenAI's 2026 frontier coding agent med et 400K context window, 77.3% Terminal-Bench score og overlegen logik til komplekse software...

Kodnings-agentGPT-5OpenAISoftwareudviklingAutonom AI
openai logoopenaiGPT-5February 5, 2026
Kontekst
400Ktokens
Maks output
128Ktokens
Input-pris
$1.75/ 1M
Output-pris
$14.00/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
81%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). GPT-5.3 Codex scorede 81% på denne benchmark.
HLE
36%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. GPT-5.3 Codex scorede 36% på denne benchmark.
MMLU
93%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. GPT-5.3 Codex scorede 93% på denne benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. GPT-5.3 Codex scorede 83% på denne benchmark.
SimpleQA
58%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. GPT-5.3 Codex scorede 58% på denne benchmark.
IFEval
94%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. GPT-5.3 Codex scorede 94% på denne benchmark.
AIME 2025
94%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. GPT-5.3 Codex scorede 94% på denne benchmark.
MATH
96%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. GPT-5.3 Codex scorede 96% på denne benchmark.
GSM8k
99%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. GPT-5.3 Codex scorede 99% på denne benchmark.
MGSM
96%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. GPT-5.3 Codex scorede 96% på denne benchmark.
MathVista
78%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. GPT-5.3 Codex scorede 78% på denne benchmark.
SWE-Bench
57%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. GPT-5.3 Codex scorede 57% på denne benchmark.
HumanEval
93%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. GPT-5.3 Codex scorede 93% på denne benchmark.
LiveCodeBench
71%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. GPT-5.3 Codex scorede 71% på denne benchmark.
MMMU
84%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. GPT-5.3 Codex scorede 84% på denne benchmark.
MMMU Pro
64%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. GPT-5.3 Codex scorede 64% på denne benchmark.
ChartQA
91%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. GPT-5.3 Codex scorede 91% på denne benchmark.
DocVQA
95%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. GPT-5.3 Codex scorede 95% på denne benchmark.
Terminal-Bench
77.3%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. GPT-5.3 Codex scorede 77.3% på denne benchmark.
ARC-AGI
54%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. GPT-5.3 Codex scorede 54% på denne benchmark.

Om GPT-5.3 Codex

Lær om GPT-5.3 Codexs muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

En ny æra for autonom udvikling

GPT-5.3 Codex er OpenAI's mest kapable agentic kodningsmodel, konstrueret til at bygge bro mellem statisk kodegenerering og autonom softwareudvikling. Bygget på næste generations GPT-5 architecture, integrerer den specialiseret professionel viden med avanceret reasoning til at håndtere opgaver over lange tidsintervaller, såsom systemadministration, overvågning af udrulning og arkitektonisk refactoring. Modellen udmærker sig ved sin 'mid-task steering'-kapabilitet, der gør det muligt for udviklere at interagere med og guide agenten i realtid, mens den navigerer i komplekse projekter.

Rekursiv intelligens og ydeevne

Da den er blevet trænet ved hjælp af sine egne tidligere iterationer til at debugge og optimere sin egen udrulning, repræsenterer GPT-5.3 Codex et betydeligt skridt mod selvforbedrende AI-systemer. Den excellerer i Terminal-Bench 2.0 miljøer og demonstrerer evnen til at administrere live terminaler, køre unit tests og iterativt rette fejl uden menneskelig indgriben. Denne rekursive træningstilgang har resulteret i yderst effektiv token-brug og et massivt 400.000-token context window, der er i stand til at fordøje hele virksomhedsarkiver i en enkelt arbejdsgang.

Problemfri professionel integration

Tilgængelig via en dedikeret Codex-app, CLI og IDE-udvidelser, er modellen designet til dyb integration i moderne workflows. Den er særligt effektiv til at identificere zero-day exploits, optimere datapipe-arkitekturer og udføre produktionsklare audits af legacy kodebaser. Med sin overlegne logik og konkurrencedygtige prissætning er den hurtigt blevet guldstandarden for forretningskritiske softwareudviklingsopgaver.

GPT-5.3 Codex

Anvendelser for GPT-5.3 Codex

Opdag de forskellige måder, du kan bruge GPT-5.3 Codex til at opnå gode resultater.

Autonom softwareudvikling

Arkitektering og opbygning af modulære softwareprojekter med flere filer ud fra overordnede specifikationer.

Auditering af produktionskode

Analyse af aktive kodebaser for concurrency-problemer, hukommelseslækager og arkitektonisk teknisk gæld.

Realtids DevOps-automatisering

Håndtering af terminal-baserede workflows, herunder serveropsætning, container-udrulning og klyngeskalering.

Afhjælpning af cybersikkerhedssårbarheder

Identificering og rettelse af zero-day exploits og softwaresårbarheder med højtydende defensiv logik.

Interaktiv prototyping

Generering af produktionsklare landingssider og webapps fra håndtegnede wireframes eller uspecificerede prompts.

Datapipe-arkitektur

Sporing og optimering af komplekse datastrømme på tværs af flere behandlingslag og asynkrone miljøer.

Styrker

Begrænsninger

State-of-the-art kodningslogik: Brancheførende 77.3% Terminal-Bench 2.0 score og overlegen ydeevne på SWE-Bench Pro.
Komprimeret detaljegrad: Prioriterer lejlighedsvis funktionel kortfattethed over den ekstreme arkitektoniske dybde, der findes i modeller som o3-pro.
Uovertruffen pris-til-ydelse: Leverer frontier agentic kapabiliteter til cirka 1/7 af prisen på dens nærmeste rival, Opus 4.6.
Æstetiske standardvalg: Selvom den logisk set er fejlfri, kan de indledende UI-designs til apps nogle gange mangle moderne visuel finish.
Rekursiv selvoptimering: Bygget ved hjælp af sin egen arkitektur til at identificere fejl og optimere træning, hvilket resulterer i høj effektivitet.
Ressource-mangler ved høj kompleksitet: Kan lejlighedsvis overse specifikke ressource-oprydningsopgaver i komplekse hardware-software-simuleringer.
Interaktiv Real-Time Steering: Unik evne til at modtage instruktioner fra mennesker midt i en opgave, hvilket reducerer behovet for lange iterative loops.
Økosystem-friktion: Primær adgang er begrænset til den specialiserede Codex-app og CLI, hvilket giver en læringskurve for standardbrugere.

API hurtig start

openai/gpt-5.3-codex

Se dokumentation
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om GPT-5.3 Codex

Se hvad fællesskabet mener om GPT-5.3 Codex

"De udgav faktisk GPT-5.3 Codex i samme minut, som Opus 4.6 landede LOL"
ShreckAndDonkey123
reddit
"Codex leverer bedre kode til cirka 1/7 af prisen"
sergeykarayev
reddit
"Ydeevnen i forhold til prisen på GPT-5.3 Codex er helt absurd"
VraserX
x
"Jeg fik GPT-5.3-Codex-Spark til at læse sin egen serviceside og bygge en ny hjemmeside. Den blev færdig på et øjeblik"
Yohei Takanashi
x
"Denne model ræsonnerede korrekt omkring Swift actor isolation... samme dag den blev udgivet"
HeroicTardigrade
reddit
"Har lige migreret hele vores backend-orkestrering til Codex-agenter, og pålideligheden er skræmmende høj"
HackerNewsUser99
hackernews

Videoer om GPT-5.3 Codex

Se vejledninger, anmeldelser og diskussioner om GPT-5.3 Codex

GPT-5.3 Codex er vores første model, der var medvirkende til at skabe sig selv

Effektiviteten i stigningen af, hvad den kan gøre med færre tokens, er virkelig fantastisk

Denne spole spinder faktisk korrekt, mens dysen bevæger sig lige her i simuleringen

Vi ser et massivt spring i, hvordan den håndterer integration med hardware i den virkelige verden

Det rekursive træningsloop her er en bogstavelig gamechanger for nøjagtighed

Jeg har ikke haft lyst til at gå tilbage til GPT 5.2, fordi de bare føles langsomme

Det føles virkelig som et stort hastighedsboost... de fortalte mig, at den er 25% hurtigere end den forrige model

Latency på små koderedigeringer er praktisk talt ikke-eksisterende nu

Håndtering af store legacy kodebaser er dér, hvor 400K context window virkelig skinner

Dette er første gang, jeg har følt, at en AI virkelig forstår mit projekts arkitektur

Dette er ikke bare endnu en kodehjælper. Dette er en AI, der bygger hele dit projekt, mens du ser på

Det, der før tog mig dage, tager nu timer med denne ting

Evnen til bare at dumpe et helt dokumentationssæt ind i prompten er vanvittig

Man kan bogstaveligt talt se den rette sine egne fejl i terminalen i realtid

For alle, der bygger SaaS, vil dette være din mest værdifulde medarbejder

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til GPT-5.3 Codex

Eksperttips til at hjælpe dig med at få mest muligt ud af GPT-5.3 Codex og opnå bedre resultater.

Aktiver Real-Time Steering

Aktiver follow-up adfærd i Codex-indstillingerne for at guide modellen midt i byggeprocessen.

Udnyt Plan Mode

Brug 'Plan'-kommandoen til komplekse refactoring-opgaver for at få modellen til at skitsere sin strategi før redigering.

Batch Pull Request Reviews

Brug det 400K context window til at føde modellen med hele feature-branches til dybdegående integrationstest.

Context Compaction

Stol på indbygget context compaction til langvarige agentic sessioner for at bevare fokus på projektet.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Ofte stillede spørgsmål om GPT-5.3 Codex

Find svar på almindelige spørgsmål om GPT-5.3 Codex