openai

GPT-5.5

O GPT-5.5 é o modelo flagship da OpenAI com um context window de 1M de tokens e cinco níveis de esforço de raciocínio, otimizado para fluxos de trabalho...

Agentic AIOpenAIGPT-5Codificação AutônomaFrontier Models
openai logoopenaiGPT-523 de abril de 2026
Contexto
1.0Mtokens
Saida Max
128Ktokens
Preco Entrada
$5.00/ 1M
Preco Saida
$30.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
93.6%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-5.5 pontuou 93.6% neste benchmark.
HLE
52.2%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-5.5 pontuou 52.2% neste benchmark.
MMLU
92.5%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-5.5 pontuou 92.5% neste benchmark.
MMLU Pro
88.1%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-5.5 pontuou 88.1% neste benchmark.
SimpleQA
57%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-5.5 pontuou 57% neste benchmark.
IFEval
92.1%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-5.5 pontuou 92.1% neste benchmark.
AIME 2025
100%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-5.5 pontuou 100% neste benchmark.
MATH
98%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-5.5 pontuou 98% neste benchmark.
GSM8k
98.5%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-5.5 pontuou 98.5% neste benchmark.
MGSM
96.4%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-5.5 pontuou 96.4% neste benchmark.
MathVista
76%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-5.5 pontuou 76% neste benchmark.
SWE-Bench
58.6%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-5.5 pontuou 58.6% neste benchmark.
HumanEval
94.2%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-5.5 pontuou 94.2% neste benchmark.
LiveCodeBench
78%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-5.5 pontuou 78% neste benchmark.
MMMU
88.3%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-5.5 pontuou 88.3% neste benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-5.5 pontuou 62% neste benchmark.
ChartQA
94%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-5.5 pontuou 94% neste benchmark.
DocVQA
95%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-5.5 pontuou 95% neste benchmark.
Terminal-Bench
82.7%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-5.5 pontuou 82.7% neste benchmark.
ARC-AGI
85%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-5.5 pontuou 85% neste benchmark.

Sobre GPT-5.5

Aprenda sobre as capacidades do GPT-5.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

Transição para Inteligência Agentic

O GPT-5.5 representa a transição dos modelos de linguagem para large agentic models. Ele foi projetado para funcionar como um colega de equipe autônomo em vez de um simples chatbot, capaz de planejar, executar e autoverificar fluxos de trabalho complexos em ambientes digitais. A principal inovação do modelo é a implementação de níveis de esforço de raciocínio variáveis, que dá aos desenvolvedores controle granular sobre o tempo de processamento do modelo e os custos computacionais associados.

Eficiência Técnica e Visão

Tecnicamente, o GPT-5.5 mantém o context window de 1 milhão de tokens da família GPT-5, mas introduz um ganho de 40% na eficiência de tokens. Isso significa que, embora o preço por token tenha dobrado em relação à série 5.4, o custo efetivo para tarefas complexas é apenas 20% maior. As capacidades de visão do modelo também foram significativamente aprimoradas, alcançando desempenho próximo ao humano em diagramas técnicos e tarefas de raciocínio espacial, como o ARC-AGI v2.

Otimização para Autonomia

É particularmente eficaz para codificação autônoma, onde pode gerenciar repositórios inteiros e verificar suas próprias correções de bugs. Ao utilizar o novo parâmetro reasoning_effort, os usuários podem alternar entre cinco profundidades lógicas distintas, tornando-o o primeiro modelo a oferecer uma escala variável de inteligência para a resolução de problemas de alto risco.

GPT-5.5

Casos de Uso para GPT-5.5

Descubra as diferentes maneiras de usar GPT-5.5 para obter otimos resultados.

Engenharia de Software Autônoma

Gerenciar repositórios de código inteiros, corrigir bugs e implantar atualizações sem supervisão humana.

Análise de Pesquisa Científica

Processar milhares de artigos científicos dentro de uma janela de 1M de tokens para sintetizar novas hipóteses.

Modelagem Financeira Complexa

Criar e auditar estruturas financeiras corporativas intrincadas com precisão matemática de nível de doutorado.

Fluxos de Trabalho Agentic de Múltiplas Etapas

Criar e executar listas de tarefas recursivas para atingir objetivos digitais de longo prazo de forma autônoma.

Análise Técnica Visual

Interpretar plantas de engenharia complexas e diagramas de circuitos para garantia de qualidade automatizada.

Compressão de Dados de Alta Fidelidade

Converter conjuntos de dados massivos em resumos densos em tokens que preservam nuances semânticas profundas.

Pontos Fortes

Limitacoes

Desempenho Agentic de Elite: Alcança uma pontuação líder no setor de 82,7 no Terminal-Bench 2.0 para uso de computador e tarefas de terminal.
Alta Taxa de Alucinação: Exibe uma taxa de alucinação de 86% em benchmarks de conhecimento factual, apesar das altas capacidades de raciocínio.
Context Window Massivo: Suporta um context window de 1M de tokens de entrada, permitindo a análise de repositórios de código completos e grandes corpora de pesquisa.
Estratégia de Preços Premium: A US$ 5/US$ 30 por 1 milhão de tokens, é significativamente mais caro do que as gerações anteriores e os rivais open-source.
Raciocínio Matemático Perfeito: Obteve uma pontuação perfeita de 100% no benchmark de raciocínio matemático de nível olímpico AIME 2025.
Falta de Entrada de Vídeo: Diferente de concorrentes multimodais como o Gemini, o GPT-5.5 não possui capacidade nativa de processamento de vídeo para texto.
Esforço de Raciocínio Flexível: Possui 5 níveis distintos de esforço de raciocínio, permitindo que os desenvolvedores equilibrem latência, custo e inteligência.
Lacunas na Escrita Criativa: O desempenho em benchmarks de escrita criativa e expressão poética fica atrás dos modelos flagship da Anthropic.

Inicio Rapido da API

openai/gpt-5.5

Ver Documentacao
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "Você é um agente de codificação autônomo." },
      { role: "user", content: "Depure este repositório Python e verifique as correções." }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-5.5

Veja o que a comunidade pensa sobre GPT-5.5

A taxa de alucinação é insana, 86% em fatos? É como um gênio que se recusa a dizer 'não sei'.
@ArtificialAnlys
twitter
O GPT-5.5 Pro custa US$ 180/milhão na saída. Entramos oficialmente na era de luxo da IA.
@skeptrune
twitter
A era da proto-AGI chegou. Já não é mais um chatbot; é um colega de equipe.
lostlifon
reddit
A escala de raciocínio com 5 níveis de esforço é o lançamento de funcionalidade mais útil desde a chamada de funções (function calling).
DataLearnerAI
hackernews
A OpenAI acertou em cheio. É caro, mas realmente funciona para trabalhos agentic de alto nível.
David Ondrej
youtube
Em 20 benchmarks, o GPT-5.5 pontua ligeiramente acima do Opus 4.7, mas agora custa US$ 5/milhão de tokens.
@rxhit05
twitter

Videos Sobre GPT-5.5

Assista tutoriais, analises e discussoes sobre GPT-5.5

A capacidade de raciocínio deste modelo é simplesmente incomparável com tudo o que vimos antes.

Ele literalmente construiu uma aplicação SaaS inteira de uma só vez sem que eu precisasse corrigir um único bug.

A US$ 5 por milhão de tokens, você realmente precisa ter certeza de que precisa desse nível de inteligência.

Comparando com modelos open, ainda existe uma lacuna significativa na autonomia agentic.

Os parâmetros de esforço de raciocínio são o verdadeiro destaque aqui para os desenvolvedores.

A OpenAI acertou em cheio com este. É caro, mas realmente funciona para trabalhos agentic de alto nível.

A compreensão visual de layouts de interface agora é perfeitamente precisa.

Ele gerencia seu próprio estado em várias etapas muito melhor do que o GPT-5.4.

Você pode basicamente entregar um terminal e deixá-lo trabalhar por vinte minutos.

O preço é salgado, mas o tempo economizado na depuração vale a pena.

O context window de um milhão de tokens é um divisor de águas para a análise de documentos longos.

Se você está criando agentes autônomos, este é atualmente o único modelo que parece verdadeiramente autônomo.

Notei uma alta taxa de alucinação em fatos históricos muito específicos.

Os ganhos de eficiência significam que você usa menos tokens para a mesma tarefa complexa.

É uma ferramenta especializada para desenvolvedores mais do que um chatbot casual.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-5.5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-5.5 e obter melhores resultados.

Use Reasoning Effort xhigh

Defina o parâmetro reasoning_effort como 'xhigh' para tarefas que exigem muita lógica, como matemática e design arquitetural.

Aproveite o grande Context Window

Forneça documentação completa e o contexto da codebase no prompt do sistema inicial para tirar proveito total da janela de 1 milhão de tokens.

Implemente loops de autocrítica

Solicite uma revisão recursiva onde o modelo critica sua primeira saída para mitigar a taxa de alucinação nativa.

Verificação Agentic

Utilize o nível de esforço xhigh para tarefas agentic a fim de garantir que o modelo verifique cada etapa antes de seguir para a próxima.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Perguntas Frequentes Sobre GPT-5.5

Encontre respostas para perguntas comuns sobre GPT-5.5