openai

GPT-5.3 Codex

O GPT-5.3 Codex é o frontier coding agent de 2026 da OpenAI, com context window de 400K, score de 77.3% no Terminal-Bench e lógica superior para softwares...

Coding AgentGPT-5OpenAIEngenharia de SoftwareIA Autônoma
openai logoopenaiGPT-55 de fevereiro de 2026
Contexto
400Ktokens
Saida Max
128Ktokens
Preco Entrada
$1.75/ 1M
Preco Saida
$14.00/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
81%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-5.3 Codex pontuou 81% neste benchmark.
HLE
36%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-5.3 Codex pontuou 36% neste benchmark.
MMLU
93%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-5.3 Codex pontuou 93% neste benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-5.3 Codex pontuou 83% neste benchmark.
SimpleQA
58%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-5.3 Codex pontuou 58% neste benchmark.
IFEval
94%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-5.3 Codex pontuou 94% neste benchmark.
AIME 2025
94%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-5.3 Codex pontuou 94% neste benchmark.
MATH
96%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-5.3 Codex pontuou 96% neste benchmark.
GSM8k
99%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-5.3 Codex pontuou 99% neste benchmark.
MGSM
96%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-5.3 Codex pontuou 96% neste benchmark.
MathVista
78%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-5.3 Codex pontuou 78% neste benchmark.
SWE-Bench
57%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-5.3 Codex pontuou 57% neste benchmark.
HumanEval
93%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-5.3 Codex pontuou 93% neste benchmark.
LiveCodeBench
71%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-5.3 Codex pontuou 71% neste benchmark.
MMMU
84%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-5.3 Codex pontuou 84% neste benchmark.
MMMU Pro
64%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-5.3 Codex pontuou 64% neste benchmark.
ChartQA
91%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-5.3 Codex pontuou 91% neste benchmark.
DocVQA
95%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-5.3 Codex pontuou 95% neste benchmark.
Terminal-Bench
77.3%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-5.3 Codex pontuou 77.3% neste benchmark.
ARC-AGI
54%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-5.3 Codex pontuou 54% neste benchmark.

Sobre GPT-5.3 Codex

Aprenda sobre as capacidades do GPT-5.3 Codex, recursos e como ele pode ajuda-lo a obter melhores resultados.

Uma Nova Era de Desenvolvimento Autônomo

O GPT-5.3 Codex é o model de coding agentic mais capaz da OpenAI, projetado para preencher a lacuna entre a geração de código estático e a engenharia de software autônoma. Construído na arquitetura GPT-5 de próxima geração, ele integra conhecimento profissional especializado com reasoning avançado para lidar com tarefas de longo horizonte, como administração de sistemas, monitoramento de implantação e refatoração arquitetural. O model se destaca por sua capacidade de 'steering no meio da tarefa', permitindo que desenvolvedores interajam e guiem o agente em tempo real enquanto ele navega por projetos complexos.

Inteligência Recursiva e Performance

Treinado usando suas próprias iterações anteriores para depurar e otimizar sua própria implantação, o GPT-5.3 Codex representa um passo significativo em direção a sistemas de IA que se autoaperfeiçoam. Ele se destaca em ambientes Terminal-Bench 2.0, demonstrando a capacidade de gerenciar terminais em tempo real, executar testes unitários e corrigir bugs de forma iterativa sem intervenção humana. Essa abordagem de treinamento recursivo resultou em um uso de tokens altamente eficiente e uma massiva context window de 400.000 tokens, capaz de digerir repositórios empresariais inteiros em uma única passagem.

Integração Profissional Fluida

Disponível através de um app Codex dedicado, CLI e extensões de IDE, o model foi projetado para uma integração profunda em fluxos de trabalho modernos. É particularmente eficaz na identificação de exploits zero-day, na otimização de arquiteturas de pipeline de dados e na realização de auditorias de nível de produção em bases de código legadas. Com sua lógica superior e preços competitivos, tornou-se rapidamente o padrão ouro para tarefas de engenharia de software de alto risco.

GPT-5.3 Codex

Casos de Uso para GPT-5.3 Codex

Descubra as diferentes maneiras de usar GPT-5.3 Codex para obter otimos resultados.

Engenharia de Software Autônoma

Arquitetura e construção de projetos de software modulares e de múltiplos arquivos a partir de especificações de alto nível.

Auditoria de Código em Produção

Análise de codebases em tempo real para problemas de concorrência, vazamentos de memória e débitos técnicos arquiteturais.

Automação de DevOps em Tempo Real

Gerenciamento de fluxos de trabalho baseados em terminal, incluindo configuração de servidor, implantação de containers e escalonamento de clusters.

Remediação de Vulnerabilidades de Cibersegurança

Identificação e correção de exploits zero-day e vulnerabilidades de software com lógica defensiva de alta capacidade.

Prototipagem Interativa

Geração de landing pages e web apps prontos para produção a partir de wireframes desenhados à mão ou prompts subespecificados.

Arquitetura de Pipeline de Dados

Rastreamento e otimização de fluxos de dados complexos em múltiplas camadas de processamento e ambientes assíncronos.

Pontos Fortes

Limitacoes

Lógica de Coding State-of-the-Art: Pontuação líder do setor de 77.3% no Terminal-Bench 2.0 e performance superior no SWE-Bench Pro.
Detalhe Comprimido: Ocasionalmente prioriza a brevidade funcional em vez da profundidade arquitetural extrema encontrada em models como o o3-pro.
Relação Preço-Performance Incomparável: Entrega capacidades agentic de fronteira por aproximadamente 1/7 do custo de seu rival mais próximo, o Opus 4.6.
Padrão Estético: Embora logicamente impecável, o design inicial de UI para apps às vezes pode carecer de polimento visual moderno.
Auto-otimização Recursiva: Construído usando sua própria arquitetura para identificar bugs e otimizar o treinamento, resultando em alta eficiência.
Gaps de Recursos de Alto Risco: Ocasionalmente esquece tarefas específicas de limpeza de recursos em simulações complexas de hardware-software.
Real-Time Steering Interativo: Capacidade única de receber direcionamento humano no meio da tarefa, reduzindo a necessidade de longos loops iterativos.
Fricção no Ecossistema: O acesso primário é restrito ao app especializado Codex e CLI, representando uma curva de aprendizado para usuários padrão.

Inicio Rapido da API

openai/gpt-5.3-codex

Ver Documentacao
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-5.3 Codex

Veja o que a comunidade pensa sobre GPT-5.3 Codex

"Eles realmente lançaram o GPT-5.3 Codex no minuto em que o Opus 4.6 saiu LOL"
ShreckAndDonkey123
reddit
"O Codex está entregando um código melhor por cerca de 1/7 do preço"
sergeykarayev
reddit
"A performance por preço do GPT-5.3 Codex é simplesmente absurda"
VraserX
x
"Eu fiz o GPT-5.3-Codex-Spark ler seu próprio site de serviço e construir um novo site. Ele terminou em um piscar de olhos"
Yohei Takanashi
x
"Este model raciocinou corretamente sobre o isolamento de actor do Swift... no dia do lançamento"
HeroicTardigrade
reddit
"Acabamos de migrar toda a nossa orquestração de backend para agentes Codex e a confiabilidade é assustadoramente alta"
HackerNewsUser99
hackernews

Videos Sobre GPT-5.3 Codex

Assista tutoriais, analises e discussoes sobre GPT-5.3 Codex

O GPT-5.3 Codex é o nosso primeiro model que foi fundamental para criar a si mesmo

A eficiência no aumento do que ele pode fazer com menos tokens é realmente fantástica

Este carretel está realmente girando corretamente enquanto o bocal se move aqui na simulação

Estamos vendo um salto enorme na forma como ele lida com a integração de hardware do mundo real

O loop de treinamento recursivo aqui é um divisor de águas literal para a precisão

Eu não quis voltar para o GPT 5.2 porque ele parece simplesmente lento

Realmente parece um grande aumento de velocidade... me disseram que é 25% mais rápido que o model anterior

A latency em pequenas edições de código é virtualmente inexistente agora

Lidar com grandes bases de código legadas é onde a context window de 400K realmente brilha

Esta é a primeira vez que sinto que uma IA entende verdadeiramente a arquitetura do meu projeto

Isso não é apenas mais um ajudante de código. Esta é uma IA que constrói todo o seu projeto enquanto você assiste

O que costumava levar dias, agora leva horas com essa ferramenta

A capacidade de simplesmente jogar todo um conjunto de documentação no prompt é insana

Você pode literalmente vê-lo corrigindo seus próprios erros no terminal em tempo real

Para quem está construindo SaaS, este será o seu funcionário mais valioso

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-5.3 Codex

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-5.3 Codex e obter melhores resultados.

Ative o Real-Time Steering

Habilite o comportamento de acompanhamento nas configurações do Codex para guiar o model durante a construção.

Aproveite o Plan Mode

Use o comando 'Plan' para refatorações complexas para que o model esboce sua estratégia antes de editar.

Revisões de Pull Request em Lote

Use a context window de 400K para carregar branches inteiras de funcionalidades para testes de integração profundos.

Compactação de Contexto

Confie na compactação de contexto nativa para sessões agentic de longa duração para manter o foco no projeto.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Perguntas Frequentes Sobre GPT-5.3 Codex

Encontre respostas para perguntas comuns sobre GPT-5.3 Codex