openai

GPT-5.4

O GPT-5.4 é o modelo frontier da OpenAI com context window de 1,05M e Extreme Reasoning. Ele se destaca na interação autônoma com UI e análise de dados longa.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 de março de 2026
Contexto
1.1Mtokens
Saida Max
128Ktokens
Preco Entrada
$2.50/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
84.2%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-5.4 pontuou 84.2% neste benchmark.
HLE
42%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-5.4 pontuou 42% neste benchmark.
MMLU
91%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-5.4 pontuou 91% neste benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-5.4 pontuou 76% neste benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-5.4 pontuou 56.7% neste benchmark.
IFEval
92%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-5.4 pontuou 92% neste benchmark.
AIME 2025
100%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-5.4 pontuou 100% neste benchmark.
MATH
88.6%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-5.4 pontuou 88.6% neste benchmark.
GSM8k
99%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-5.4 pontuou 99% neste benchmark.
MGSM
96%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-5.4 pontuou 96% neste benchmark.
MathVista
74%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-5.4 pontuou 74% neste benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-5.4 pontuou 52.8% neste benchmark.
HumanEval
85.1%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-5.4 pontuou 85.1% neste benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-5.4 pontuou 72.5% neste benchmark.
MMMU
84.2%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-5.4 pontuou 84.2% neste benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-5.4 pontuou 61% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-5.4 pontuou 89% neste benchmark.
DocVQA
94%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-5.4 pontuou 94% neste benchmark.
Terminal-Bench
55%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-5.4 pontuou 55% neste benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-5.4 pontuou 52.9% neste benchmark.

Sobre GPT-5.4

Aprenda sobre as capacidades do GPT-5.4, recursos e como ele pode ajuda-lo a obter melhores resultados.

A vanguarda do reasoning de longo contexto

O GPT-5.4 representa a evolução de alto desempenho da série GPT-5. Ele apresenta uma context window líder no setor de 1,05 milhão de tokens. Este modelo lida com conjuntos de dados expansivos, como repositórios de código massivos ou logs históricos de vários anos, sem perder a fidelidade de reasoning. O Mid-Response Steering interativo permite que os usuários monitorem e ajustem o plano de pensamento do modelo em tempo real. Isso garante que a saída esteja alinhada com intenções complexas de várias etapas.

Inteligência unificada e ação autônoma

Tecnicamente, o GPT-5.4 unifica as forças de codificação de classe mundial das ramificações anteriores do Codex com as nuances criativas da série padrão GPT-5. Ele apresenta um modo Thinking especializado com níveis de esforço ajustáveis. Eles incluem modos Standard, Extended e Heavy. Ele utiliza processamento de chain-of-thought reforçado para resolver problemas de lógica e ciência de nível de doutorado. Além de texto, o GPT-5.4 introduz capacidades nativas de computer use. Ele alcança uma pontuação de 75% em tarefas verificadas pelo OSWorld, interpretando screenshots visuais e executando cliques baseados em coordenadas.

Eficiência e confiabilidade

A OpenAI relata uma redução de 33% em erros de nível de alegação em comparação com os predecessores. Isso torna o GPT-5.4 uma escolha primária para agentes autônomos e suporte a decisões de alto risco. Ele foi projetado para eficiência de tokens e energia. Isso permite um processamento de contexto longo mais barato do que as iterações anteriores. Seja gerenciando uma base de código corporativa inteira ou atuando como um agente de agendamento autônomo, o GPT-5.4 estabelece um novo padrão de confiabilidade e desempenho agentic.

GPT-5.4

Casos de Uso para GPT-5.4

Descubra as diferentes maneiras de usar GPT-5.4 para obter otimos resultados.

Refatoração de código em larga escala

Reescrita sistemática de bases de código legadas que excedem 300.000 linhas, com estrita adesão aos padrões arquiteturais.

Modelagem financeira autônoma

Construção de modelos complexos de três demonstrativos onde a IA concilia balanços patrimoniais, demonstrações de resultados e fluxos de caixa.

Design de sistema interativo

Desenvolvimento de simulações 3D ou jogos baseados em física, direcionando o caminho lógico do modelo durante o processo de geração.

Agentic Computer Use

Execução de tarefas de desktop com várias etapas, como entrada de dados em massa, gerenciamento de e-mail e teste de software via interação nativa de UI.

Análise jurídica de longo contexto

Referenciamento cruzado de centenas de documentos jurídicos para identificar inconsistências ou extrair cláusulas específicas com alta precisão de recall.

Suporte de pesquisa em nível de doutorado

Resolução de provas matemáticas complexas e problemas científicos usando o modo Heavy Reasoning para cadeias lógicas verificadas.

Pontos Fortes

Limitacoes

Contexto massivo de 1,05M: Oferece capacidade líder no setor para análise profunda de bases de código e conjuntos de documentos enormes sem degradação de contexto.
Latency de reasoning: Ativar o modo Heavy Thinking pode resultar em tempos de espera de vários minutos para lógica complexa ou grandes gerações de código.
Pensamento interativo: A navegação exclusiva durante a resposta permite que os usuários direcionem caminhos de reasoning, reduzindo significativamente o desperdício de gerações e tokens.
Rate limiting: Durante o lançamento inicial, os usuários podem encontrar limites de mensagens agressivos ou bugs temporários na conta à medida que a capacidade é escalada.
Computer Use nativo: Interação de UI de alta precisão (75% no OSWorld) permite que o modelo trabalhe diretamente em ambientes de desktop e navegadores.
Escalonamento não linear: Em algumas tarefas criativas, observou-se que modos de reasoning mais leves superam os modos pesados em detalhes estéticos.
Extrema eficiência de tokens: A arquitetura otimizada entrega desempenho de vanguarda (frontier) com menor latency e consumo de energia que as versões anteriores do GPT-5.
Degradação de contexto em 1M: Embora a window seja grande, a precisão de recuperação cai significativamente ao passar de 256K para 1M de tokens.

Inicio Rapido da API

openai/gpt-5.4

Ver Documentacao
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-5.4

Veja o que a comunidade pensa sobre GPT-5.4

O GPT 5.4 no Codex é uma melhoria enorme... Eu realmente vi ele trabalhar por 150 minutos sem parar sem perder o contexto.
ArchMeta1868
reddit
As capacidades de design 3D do GPT 5.4 são incomparáveis. A maneira como ele lidou com transparência e física no meu simulador de navio foi assustadoramente precisa.
AI_Creative_Daily
twitter
A correção de curso durante a resposta é incrível. Posso ver para onde o modelo está indo e consertar antes que ele desperdice tokens.
dev_guru_99
reddit
Ele superou humanos em 83% das vezes em 44 trabalhos diferentes. Advogado. Contador. Analista financeiro. Administrador.
Josh Kale
twitter
A OpenAI finalmente corrigiu o gargalo de saída. 128k tokens de saída é um sonho para desenvolvedores construindo aplicações full-stack.
TheCodeChannel
youtube
A latency do computer use ainda existe, mas a precisão é alta o suficiente para lidar com fluxos de trabalho SAP complexos, o que é insano.
enterprise_sysadmin
hackernews

Videos Sobre GPT-5.4

Assista tutoriais, analises e discussoes sobre GPT-5.4

O GPT 5.4 chegou e talvez tenhamos um novo melhor modelo no planeta.

O Thinking do GPT 5.4 agora pode fornecer um plano antecipado do seu raciocínio... permitindo que você guie o modelo.

Este elemento interativo resolve o problema da caixa preta dos modelos de reasoning.

A velocidade em comparação ao o1-preview é da água para o vinho para tarefas padrão.

Você está vendo um reasoning que realmente parece consistente em longas conversas.

O GPT 5.4... não foi criado para conversar. Foi criado para trabalhar.

O carregamento diferido... reduziu o uso total de tokens em 47% sem perda de precisão.

A funcionalidade de computer use rastreia elementos da UI com um sistema baseado em coordenadas.

Eu testei com uma base de código legada em Java e ele realmente entendeu as dependências entre arquivos.

Estamos entrando em um mundo onde a IA é o controlador do sistema operacional.

1 milhão e 50 mil tokens de context window. É uma window muito longa.

Navegue enquanto ele pensa, o que é definitivamente mais eficiente de usar.

O preço é alto, mas para grandes conjuntos de documentos, é o único modelo que funciona.

O modo Thinking pode ser ajustado com base na complexidade do seu prompt.

Parece mais confiável na recuperação factual do que qualquer versão anterior do GPT.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-5.4

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-5.4 e obter melhores resultados.

Alterne o esforço de pensamento (Thinking Effort)

Use os parâmetros Standard, Extended ou Heavy para equilibrar a necessidade de precisão com a velocidade de geração e o custo.

Revise o plano de pensamento (Thinking Plan)

Monitore o plano inicial fornecido pelo modelo e use o Mid-Response Steering para corrigi-lo caso a lógica se desvie.

Aproveite o carregamento de ferramentas diferido (Deferred Tool Loading)

Para fluxos de trabalho agentic, use o registro de carregamento diferido para reduzir os custos iniciais de tokens em até 47%.

Use contratos de completude

Defina explicitamente o que significa concluído no seu prompt para tornar o modelo mais persistente durante tarefas de longa duração.

Visão de resolução máxima

Faça upload de imagens de alta fidelidade de até 10,24 MP para inspeções visuais precisas de elementos de UI ou diagramas técnicos.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Perguntas Frequentes Sobre GPT-5.4

Encontre respostas para perguntas comuns sobre GPT-5.4