openai

GPT-5.4

O GPT-5.4 é o frontier model da OpenAI com context window de 1,05M e Extreme Reasoning. Destaca-se em interação de UI autônoma e análise de dados complexos.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 de março de 2026
Contexto
1.1Mtokens
Saida Max
128Ktokens
Preco Entrada
$2.50/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
84.2%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-5.4 pontuou 84.2% neste benchmark.
HLE
42%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-5.4 pontuou 42% neste benchmark.
MMLU
91%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-5.4 pontuou 91% neste benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-5.4 pontuou 76% neste benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-5.4 pontuou 56.7% neste benchmark.
IFEval
92%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-5.4 pontuou 92% neste benchmark.
AIME 2025
100%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-5.4 pontuou 100% neste benchmark.
MATH
88.6%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-5.4 pontuou 88.6% neste benchmark.
GSM8k
99%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-5.4 pontuou 99% neste benchmark.
MGSM
96%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-5.4 pontuou 96% neste benchmark.
MathVista
74%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-5.4 pontuou 74% neste benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-5.4 pontuou 52.8% neste benchmark.
HumanEval
85.1%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-5.4 pontuou 85.1% neste benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-5.4 pontuou 72.5% neste benchmark.
MMMU
84.2%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-5.4 pontuou 84.2% neste benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-5.4 pontuou 61% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-5.4 pontuou 89% neste benchmark.
DocVQA
94%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-5.4 pontuou 94% neste benchmark.
Terminal-Bench
55%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-5.4 pontuou 55% neste benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-5.4 pontuou 52.9% neste benchmark.

Sobre GPT-5.4

Aprenda sobre as capacidades do GPT-5.4, recursos e como ele pode ajuda-lo a obter melhores resultados.

A Fronteira do Reasoning de Long-Context

O GPT-5.4 representa a evolução de alta performance da série GPT-5, caracterizado por sua context window de 1,05 milhão de tokens, líder do setor. Este model foi especificamente projetado para lidar com conjuntos de dados expansivos, como repositórios massivos de código ou logs históricos de vários anos, sem perder a capacidade de realizar reasoning de alta fidelidade. Um recurso de destaque é o "Mid-Response Steering" interativo, que permite aos usuários monitorar visualmente e ajustar o plano de pensamento do model em tempo real, garantindo que o output se alinhe perfeitamente com intenções complexas de múltiplas etapas.

Inteligência Unificada e Ação Autônoma

Tecnicamente, o GPT-5.4 unifica os pontos fortes de coding de classe mundial das ramificações anteriores específicas do Codex com as nuances criativas da série GPT-5 padrão. Ele apresenta um modo "Thinking" especializado com níveis de esforço ajustáveis (Standard, Extended e Heavy) que utiliza processamento de chain-of-thought reforçado para resolver problemas de lógica e ciência de nível de doutorado. Além do texto, o GPT-5.4 introduz capacidades nativas de computer use, alcançando uma pontuação de 75% em tarefas OSWorld-Verified ao interpretar screenshots visuais de alta fidelidade e executar cliques baseados em coordenadas.

Eficiência e Confiabilidade

A OpenAI relata uma diminuição significativa de 33% em erros de afirmação em comparação com seus predecessores, tornando o GPT-5.4 a escolha principal para agentes autônomos e suporte a decisões de alto risco. Apesar de sua potência, ele foi projetado para eficiência de tokens e energia, permitindo um processamento de long-context mais barato do que as iterações anteriores. Seja gerenciando toda a codebase de uma empresa ou atuando como um agente de agendamento autônomo, o GPT-5.4 define um novo padrão de confiabilidade e performance agentic no cenário da AI generativa.

GPT-5.4

Casos de Uso para GPT-5.4

Descubra as diferentes maneiras de usar GPT-5.4 para obter otimos resultados.

Refatoração de Grandes Codebases

Ingestão e análise de centenas de arquivos-fonte simultaneamente para garantir consistência entre módulos e identificar bugs semânticos profundos em repositórios inteiros.

Agendamento Agentic Autônomo

Interação com e-mail e calendários via visual grounding para coordenar autonomamente agendas de eventos complexos e enviar comunicações de acompanhamento.

Design Arquitetônico de Alta Fidelidade

Geração de cenas 3D intrincadas e planos estruturais, como estações de metrô funcionais, usando mais de 1.000 linhas de código preciso e pronto para simulação.

Planejamento Científico de Longo Prazo

Utilização de Extreme Reasoning para resolver problemas científicos de nível de doutorado e realizar análises de múltiplas etapas que exigem horas de gerenciamento de estado consistente.

Investigação de Incidentes de Cybersecurity

Processamento de vastas quantidades de dados brutos de logs em uma única sessão de contexto de 1,05M para identificar, investigar e reportar violações de segurança autonomamente.

Mid-Response Steering Interativo

Correção do curso do model durante a fase interna de 'thinking' para ajustar escolhas arquitetônicas ou caminhos lógicos sem a necessidade de reiniciar o prompt.

Pontos Fortes

Limitacoes

Frontier Context Window de 1,05M: Oferece capacidade líder do setor para realizar reasoning sobre conjuntos massivos de dados e codebases em um único prompt sem perda imediata de coerência.
Degradação em Contextos Longos: A performance em tarefas de reasoning de alta complexidade cai significativamente assim que a context window ultrapassa a marca de 256K tokens.
Acurácia de Extreme Reasoning: Alcança conhecimento científico de nível de doutorado (84,2% no GPQA) e pontuações perfeitas em matemática (100% no AIME 2025) usando seu modo de reasoning de alto esforço.
Esquema de Versionamento Confuso: A linha complexa de variantes 5.1, 5.2 Thinking, 5.3 Codex e 5.4 cria uma carga cognitiva significativa para desenvolvedores de API e usuários do Chat.
Interação de UI Autônoma: O visual grounding state-of-the-art permite que o model interaja com softwares e navegadores com 75% de acurácia no benchmark OSWorld.
Alta Latency no Modo Heavy: Os modos de maior esforço de reasoning podem levar mais de 8 minutos para processar o CoT interno, tornando-os inadequados para tarefas interativas em tempo real.
Eficiência de Token e Energia: Projetado como o frontier model mais eficiente da OpenAI até o momento, reduzindo o custo de energia necessário para reasoning complexo em comparação ao lançamento do GPT-5.2.
Alinhamento Neurótico: O fine-tuning de segurança agressivo pode levar a comportamentos contrários, onde o model contradiz desnecessariamente o usuário em tópicos fatuais inofensivos.

Inicio Rapido da API

openai/gpt-5.4

Ver Documentacao
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-5.4

Veja o que a comunidade pensa sobre GPT-5.4

O GPT-5 está fazendo um retorno brutalmente esmagador... cada linha de código que ele gerou funcionou perfeitamente.
immortalsol
reddit
O recurso principal é obviamente a context window de 1M, em comparação com os ~200k que outros models suportam.
Developer
hackernews
Uau, o GPT 5.4 é insanamente bom. Deveria ser um salto para a versão 6.0. Difícil acreditar que o Codex chegou tão longe.
Rahul Sood
twitter
O GPT-5.4 obteve pontuações extra altas de 94,0 no NYT Connections. Ele simplesmente acerta as coisas na primeira tentativa.
senko
hackernews
O GPT-5.4 está agora no Artificial Analysis Intelligence Index... Empatado com o Gemini 3.1 Pro.
AiBattle
twitter
A profundidade de reasoning está finalmente no nível em que pode lidar com problemas arquitetônicos de escala empresarial.
CloudArchitect99
reddit

Videos Sobre GPT-5.4

Assista tutoriais, analises e discussoes sobre GPT-5.4

Uma context window de 1 milhão e 50 mil tokens... esta é uma context window muito longa.

Em 5 minutos e 22 segundos de thinking, recebemos nosso resultado... ele testou isso de uma maneira mais agentic.

Atualizando a habilidade de analisar imagens de alta fidelidade... até 10,24 milhões de pixels totais.

O model realmente realiza pesquisas na web para verificar sua própria lógica.

Este é um salto massivo para workflows agentic onde o estado precisa persistir.

O GPT 5.4 tem tudo... eles basicamente disseram, ok, 5.2 e GPT 5.3 Codex: vão em frente e tenham um bebê.

As capacidades de coding são ridículas. É essencialmente impecável.

O gosto para front-end está muito atrás do Opus 4.6 e do Gemini 3.1 Pro.

Parece que ele tem uma compreensão muito melhor da intenção sutil do desenvolvedor.

O preço é competitivo considerando o tamanho da context window de 1M.

Está claramente pressionando a OpenAI a responder com um model que corresponda a essa capacidade de 1 milhão de contexto.

Em um único shot, o fato de este model ser capaz de criar este clone de Minecraft é simplesmente notável.

Estamos vendo uma redução de 33 por cento nas taxas de alucinação fatual.

Os modos de reasoning são categorizados nos níveis Standard, Extended e Heavy.

O visual grounding no benchmark OSWorld é simplesmente líder do setor no momento.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-5.4

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-5.4 e obter melhores resultados.

Alternar o Reasoning Effort

Use os esforços de reasoning Standard, Extended ou Heavy dependendo da complexidade da tarefa para equilibrar o custo computacional e a qualidade do output.

Monitore o Upfront Plan

Ao usar a variante Thinking, observe o plano inicial; você pode intervir durante a geração se o caminho lógico proposto pelo model parecer equivocado.

Prompt Caching Estratégico

Coloque blocos de contexto grandes e estáticos no início do seu prompt para aproveitar o prompt caching automático da OpenAI e economizar custos.

Gerencie a Estabilidade do Contexto

Embora a janela de 1,05M seja robusta, relatos indicam que a performance é mais estável nos primeiros 256K tokens; mantenha resumos críticos perto do fim do prompt.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre GPT-5.4

Encontre respostas para perguntas comuns sobre GPT-5.4