openai

GPT-5.3 Codex

O GPT-5.3 Codex é o agent de codificação frontier da OpenAI para 2026, com um context window de 400K, pontuação de 77,3% no Terminal-Bench e lógica superior...

Agent de codificaçãoGPT-5OpenAIEngenharia de SoftwareAI Autônoma
openai logoopenaiGPT5 de fevereiro de 2026
Contexto
400Ktokens
Saida Max
128Ktokens
Preco Entrada
$1.75/ 1M
Preco Saida
$14.00/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
81%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-5.3 Codex pontuou 81% neste benchmark.
HLE
36%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-5.3 Codex pontuou 36% neste benchmark.
MMLU
93%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-5.3 Codex pontuou 93% neste benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-5.3 Codex pontuou 83% neste benchmark.
SimpleQA
58%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-5.3 Codex pontuou 58% neste benchmark.
IFEval
94%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-5.3 Codex pontuou 94% neste benchmark.
AIME 2025
94%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-5.3 Codex pontuou 94% neste benchmark.
MATH
96%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-5.3 Codex pontuou 96% neste benchmark.
GSM8k
99%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-5.3 Codex pontuou 99% neste benchmark.
MGSM
96%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-5.3 Codex pontuou 96% neste benchmark.
MathVista
78%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-5.3 Codex pontuou 78% neste benchmark.
SWE-Bench
57%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-5.3 Codex pontuou 57% neste benchmark.
HumanEval
93%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-5.3 Codex pontuou 93% neste benchmark.
LiveCodeBench
71%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-5.3 Codex pontuou 71% neste benchmark.
MMMU
84%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-5.3 Codex pontuou 84% neste benchmark.
MMMU Pro
64%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-5.3 Codex pontuou 64% neste benchmark.
ChartQA
91%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-5.3 Codex pontuou 91% neste benchmark.
DocVQA
95%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-5.3 Codex pontuou 95% neste benchmark.
Terminal-Bench
77.3%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-5.3 Codex pontuou 77.3% neste benchmark.
ARC-AGI
54%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-5.3 Codex pontuou 54% neste benchmark.

Sobre GPT-5.3 Codex

Aprenda sobre as capacidades do GPT-5.3 Codex, recursos e como ele pode ajuda-lo a obter melhores resultados.

Uma nova era do desenvolvimento autônomo

O GPT-5.3 Codex é o model de codificação agentic mais capaz da OpenAI. Ele preenche a lacuna entre a geração de código estático e a engenharia de software autônoma. Construído sobre a arquitetura GPT-5, ele integra conhecimento profissional especializado com reasoning avançado para lidar com tarefas de longo prazo, como administração de sistemas, monitoramento de deployment e refatoração arquitetural. O model inclui direcionamento durante a tarefa. Isso permite que os desenvolvedores interajam e orientem o agent em tempo real enquanto ele navega por projetos complexos.

Inteligência recursiva e desempenho

A OpenAI treinou este model usando suas próprias iterações anteriores para depurar e otimizar seu próprio deployment. Ele representa um passo significativo em direção a sistemas que melhoram a si mesmos. Ele se destaca em ambientes Terminal-Bench 2.0, demonstrando uma habilidade de gerenciar terminais ativos, executar unit tests e corrigir bugs de forma iterativa sem intervenção humana. Essa abordagem de treinamento recursivo resultou em uso eficiente de tokens e um context window de 400.000 tokens. Ele pode processar repositórios empresariais inteiros em uma única passagem.

Integração profissional perfeita

Disponível através de um app dedicado do Codex, CLI e extensões de IDE, o model se integra a fluxos de trabalho modernos. Ele é eficaz na identificação de exploits zero-day, na otimização de arquiteturas de pipeline de dados e na realização de auditorias de nível de produção em bases de código legadas. Com lógica superior e preços competitivos, ele serve como uma ferramenta de alto desempenho para tarefas de engenharia de software de alto risco.

GPT-5.3 Codex

Casos de Uso para GPT-5.3 Codex

Descubra as diferentes maneiras de usar GPT-5.3 Codex para obter otimos resultados.

Engenharia de Software Autônoma

Arquitetar e construir projetos de software modulares e com múltiplos arquivos a partir de especificações de alto nível.

Auditoria de código de produção

Analisar bases de código ativas em busca de problemas de concorrência, vazamentos de memória e dívida técnica arquitetural.

Automação de DevOps em tempo real

Gerenciar fluxos de trabalho baseados em terminal, incluindo configuração de servidores, deployment de containers e escalonamento de clusters.

Remediação de vulnerabilidades de cibersegurança

Identificar e corrigir exploits zero-day e vulnerabilidades de software com lógica defensiva de alta capacidade.

Prototipagem interativa

Gerar landing pages e aplicações web prontas para produção a partir de wireframes desenhados à mão ou prompts pouco especificados.

Arquitetura de pipeline de dados

Rastrear e otimizar fluxos de dados complexos através de múltiplas camadas de processamento e ambientes assíncronos.

Pontos Fortes

Limitacoes

Lógica de codificação state-of-the-art: Pontuação líder no setor de 77,3% no Terminal-Bench 2.0 e desempenho superior no SWE-Bench Pro.
Brevidade funcional: Ocasionalmente prioriza a brevidade funcional em detrimento da profundidade arquitetural extrema encontrada em models como o o3-pro.
Relação custo-benefício inigualável: Oferece capacidades agentic de frontier model por aproximadamente 1/7 do custo de rivais como o Opus 4.6.
Estética padrão: Embora logicamente impecáveis, os designs de UI iniciais para aplicações podem, às vezes, carecer de um acabamento visual moderno.
Auto-otimização recursiva: Construído usando sua própria arquitetura para identificar bugs e otimizar o treinamento para alta eficiência.
Lacunas de recursos em situações de alto risco: Ocasionalmente falha em tarefas específicas de limpeza de recursos em simulações complexas de hardware e software.
Direcionamento interativo em tempo real: Capacidade única de receber instruções humanas durante a tarefa, reduzindo a necessidade de longos ciclos iterativos.
Fricção no ecossistema: O acesso principal é otimizado para o app e CLI especializados do Codex, criando uma curva de aprendizado para usuários padrão da API.

Inicio Rapido da API

openai/gpt-5.3-codex

Ver Documentacao
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audite este actor Swift para condições de corrida' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-5.3 Codex

Veja o que a comunidade pensa sobre GPT-5.3 Codex

O GPT-5.3 Codex parece menos um chatbot genérico e mais um model puramente para engenharia.
Federal-Piano8695
reddit
O Codex está entregando código melhor por aproximadamente 1/7 do preço. O desempenho por preço é simplesmente absurdo.
sergeykarayev
reddit
Ele não estava apenas executando minhas instruções. Ele estava tomando decisões inteligentes. Tinha algo que parecia julgamento.
mattshumer_
twitter
Acabei de migrar toda a nossa orquestração de backend para agents do Codex e a confiabilidade é assustadoramente alta.
HackerNewsUser99
hackernews
O GPT 5.3 Codex estabeleceu a nova pontuação máxima no Terminal-Bench 2.0. 77,3% é um salto enorme em relação à versão anterior.
bridgemindai
twitter
A capacidade de lidar com um context window de 400k torna possível auditar repositórios empresariais inteiros de uma só vez.
cdcore
other

Videos Sobre GPT-5.3 Codex

Assista tutoriais, analises e discussoes sobre GPT-5.3 Codex

O Codex realmente implementou corretamente tanto o um quanto o dois fazendo as alterações de visualização, enquanto o Claude apenas mapeou para a tecla um.

O Codex realmente descobriu a causa principal, mas também identificou isso como um problema potencial e corrigiu.

Gostei da maneira como ele ricocheteou nos edifícios; a física pareceu a mais natural.

Comparando com o Gemini 3.1, o Codex lida com a lógica de múltiplos arquivos com muito menos desvio.

A velocidade dos loops agentic aqui é visivelmente mais rápida que no Claude Opus 4.6.

Isto não é apenas mais um assistente de código. É uma AI que constrói todo o seu projeto enquanto você assiste.

A capacidade de simplesmente despejar todo um conjunto de documentação no prompt é insana.

Você pode ver literalmente ele corrigindo seus próprios erros no terminal em tempo real.

Se você está desenvolvendo ferramentas de SEO, os scripts de scraping automatizados que ele escreve estão prontos para produção.

Ele conseguiu fazer o deployment de todo o site na Vercel sem que eu tocasse em um único botão.

O GPT-5.3 Codex é o nosso primeiro model que foi fundamental para criar a si mesmo.

A eficiência no aumento do que ele pode fazer com menos tokens é realmente fantástica.

Estamos vendo um salto gigantesco em como ele lida com a integração de hardware do mundo real.

O mecanismo de reasoning por trás das decisões de codificação é muito mais robusto que o do GPT-5 padrão.

As pontuações do Terminal-Bench são uma coisa, mas vê-lo navegar em um sistema de arquivos linux é outra.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-5.3 Codex

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-5.3 Codex e obter melhores resultados.

Ative o direcionamento em tempo real

Ative o comportamento de follow-up nas configurações do Codex para orientar o model durante a construção, sem perder o contexto.

Aproveite o Plan Mode

Use o comando Plan para refatorações complexas para que o model descreva sua estratégia antes de editar.

Revisão de Pull Requests em lote

Insira branches inteiras de funcionalidades no context window de 400K para testes de integração profunda.

Compactação de contexto

Conte com a compactação de contexto nativa para sessões agentic de longa duração para manter o foco no projeto.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre GPT-5.3 Codex

Encontre respostas para perguntas comuns sobre GPT-5.3 Codex