openai

GPT-5.4

GPT-5.4 è il frontier model di OpenAI con una context window da 1,05M e Extreme Reasoning. Eccelle nell'interazione UI autonoma e nell'analisi di dati a lungo...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 Marzo 2026
Contesto
1.1Mtoken
Output max
128Ktoken
Prezzo input
$2.50/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
84.2%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. GPT-5.4 ha ottenuto 84.2% in questo benchmark.
HLE
42%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. GPT-5.4 ha ottenuto 42% in questo benchmark.
MMLU
91%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. GPT-5.4 ha ottenuto 91% in questo benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. GPT-5.4 ha ottenuto 76% in questo benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. GPT-5.4 ha ottenuto 56.7% in questo benchmark.
IFEval
92%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. GPT-5.4 ha ottenuto 92% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. GPT-5.4 ha ottenuto 100% in questo benchmark.
MATH
88.6%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. GPT-5.4 ha ottenuto 88.6% in questo benchmark.
GSM8k
99%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. GPT-5.4 ha ottenuto 99% in questo benchmark.
MGSM
96%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. GPT-5.4 ha ottenuto 96% in questo benchmark.
MathVista
74%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. GPT-5.4 ha ottenuto 74% in questo benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. GPT-5.4 ha ottenuto 52.8% in questo benchmark.
HumanEval
85.1%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. GPT-5.4 ha ottenuto 85.1% in questo benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. GPT-5.4 ha ottenuto 72.5% in questo benchmark.
MMMU
84.2%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. GPT-5.4 ha ottenuto 84.2% in questo benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. GPT-5.4 ha ottenuto 61% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. GPT-5.4 ha ottenuto 89% in questo benchmark.
DocVQA
94%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. GPT-5.4 ha ottenuto 94% in questo benchmark.
Terminal-Bench
55%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. GPT-5.4 ha ottenuto 55% in questo benchmark.
ARC-AGI
52.9%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. GPT-5.4 ha ottenuto 52.9% in questo benchmark.

Informazioni su GPT-5.4

Scopri le capacita di GPT-5.4, le funzionalita e come puo aiutarti a ottenere risultati migliori.

La frontiera del reasoning a lunga context window

GPT-5.4 rappresenta l'evoluzione ad alte prestazioni della serie GPT-5, caratterizzata dalla sua context window da 1,05 milioni di tokens, leader del settore. Questo model è specificamente progettato per gestire dataset estesi, come massicci repository di codice o log storici pluriennali, senza perdere la capacità di eseguire un reasoning ad alta fedeltà. Una funzione di spicco è il "Mid-Response Steering" interattivo, che consente agli utenti di monitorare visivamente e regolare il piano di pensiero del model in tempo reale, assicurando che l'output si allinei perfettamente a intenti complessi e multi-step.

Intelligenza unificata e azione autonoma

Tecnicamente, GPT-5.4 unifica i punti di forza nel coding di livello mondiale delle precedenti branche specifiche per Codex con le sfumature creative della serie GPT-5 standard. Include una modalità "Thinking" specializzata con livelli di effort regolabili (Standard, Extended e Heavy) che utilizza un processo di chain-of-thought rinforzato per risolvere problemi scientifici e logici di livello PhD. Oltre al testo, GPT-5.4 introduce capacità native di computer use, ottenendo un punteggio del 75% nei task OSWorld-Verified interpretando screenshot visivi ad alta fedeltà ed eseguendo clic basati su coordinate.

Efficienza e affidabilità

OpenAI riporta una significativa diminuzione del 33% degli errori a livello di affermazioni rispetto ai suoi predecessori, rendendo GPT-5.4 una scelta primaria per agentic autonomi e supporto decisionale ad alto rischio. Nonostante la sua potenza, è progettato per l'efficienza energetica e di tokens, consentendo un'elaborazione di context lunghi più economica rispetto alle iterazioni precedenti. Che si tratti di gestire l'intera codebase di un'impresa o di agire come un agente di scheduling autonomo, GPT-5.4 stabilisce un nuovo standard per l'affidabilità e le performance agentic nel panorama dell'AI generativa.

GPT-5.4

Casi d'uso per GPT-5.4

Scopri i diversi modi in cui puoi usare GPT-5.4 per ottenere ottimi risultati.

Refactoring di codebase di grandi dimensioni

Ingestione e analisi di centinaia di file sorgente simultaneamente per garantire la coerenza tra i moduli e identificare bug semantici profondi in interi repository.

Scheduling agentic autonomo

Interazione con email e calendari tramite grounding visivo per coordinare autonomamente programmi di eventi complessi e inviare comunicazioni di follow-up.

Progettazione architettonica ad alta fedeltà

Generazione di scene 3D intricate e piani strutturali, come stazioni della metropolitana funzionali, utilizzando oltre 1.000 righe di codice preciso e pronto per la simulazione.

Pianificazione scientifica a lungo termine

Utilizzo dell'Extreme Reasoning per risolvere problemi scientifici di livello PhD ed eseguire analisi multi-step che richiedono ore di gestione coerente dello stato.

Investigazione di incidenti di cybersecurity

Elaborazione di enormi quantità di dati di log grezzi in una singola sessione con context window da 1,05M per identificare, investigare e segnalare autonomamente violazioni della sicurezza.

Mid-Response Steering interattivo

Correzione della rotta del model durante la fase di 'thinking' interna per regolare scelte architettoniche o percorsi logici senza dover riavviare il prompt.

Punti di forza

Limitazioni

Context window da 1,05M all'avanguardia: Fornisce una capacità leader del settore per applicare il reasoning su enormi dataset e codebase in un unico prompt senza perdita immediata di coerenza.
Degradazione della context window lunga: Le performance su task di reasoning ad alta complessità calano significativamente una volta che la context window supera la soglia dei 256K tokens.
Accuratezza di reasoning estremo: Raggiunge una conoscenza scientifica di livello PhD (84,2% su GPQA) e punteggi matematici perfetti (100% su AIME 2025) utilizzando la modalità di reasoning ad alto effort.
Schema di versionamento confuso: La complessa lineup di varianti 5.1, 5.2 Thinking, 5.3 Codex e 5.4 crea un carico cognitivo significativo per gli sviluppatori API e gli utenti Chat.
Interazione UI autonoma: Il grounding visivo state-of-the-art consente al model di interagire con software e browser con un'accuratezza del 75% sul benchmark OSWorld.
Alta latency in modalità Heavy: Le modalità di reasoning a massimo effort possono richiedere oltre 8 minuti per elaborare la chain-of-thought interna, rendendole inadatte per task interattivi in tempo reale.
Efficienza energetica e di tokens: Progettato come il frontier model più efficiente di OpenAI finora, riducendo il costo energetico richiesto per reasoning complessi rispetto alla release GPT-5.2.
Alignment eccessivo: Un fine-tuning aggressivo sulla sicurezza può portare a comportamenti oppositivi in cui il model contraddice inutilmente l'utente su argomenti fattuali innocui.

Avvio rapido API

openai/gpt-5.4

Visualizza documentazione
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su GPT-5.4

Guarda cosa pensa la community di GPT-5.4

GPT-5 sta tornando in modo travolgente... ogni singola riga di codice generata era perfettamente funzionante.
immortalsol
reddit
La funzione principale è ovviamente la context window da 1M, rispetto ai circa 200k supportati da altri models.
Developer
hackernews
Wow, GPT 5.4 è incredibilmente buono. Dovrebbe essere un salto alla versione 6.0. Difficile credere che Codex sia arrivato fin qui.
Rahul Sood
twitter
GPT-5.4 ottiene punteggi altissimi (94.0) su NYT Connections. Indovina tutto al primo colpo.
senko
hackernews
GPT-5.4 è ora sull'Artificial Analysis Intelligence Index... Al pari di Gemini 3.1 Pro.
AiBattle
twitter
La profondità del reasoning è finalmente al livello in cui può gestire problemi architettonici su scala enterprise.
CloudArchitect99
reddit

Video su GPT-5.4

Guarda tutorial, recensioni e discussioni su GPT-5.4

Una context window da 1 milione e 50.000 tokens... questa è una context window lunghissima.

In 5 minuti e 22 secondi di thinking, abbiamo ricevuto il risultato... ha testato il tutto in modo più agentic.

Aggiornata la capacità di analizzare immagini ad alta fedeltà... fino a 10,24 milioni di pixel totali.

Il model esegue effettivamente ricerche sul web per verificare la propria logica.

Questo è un salto enorme per i workflow agentic dove lo stato deve persistere.

GPT 5.4 ha tutto... hanno praticamente detto, okay, 5.2 e GPT 5.3 Codex, fate un figlio.

Le capacità di coding sono incredibili. È essenzialmente impeccabile.

Il gusto nel front-end è molto indietro rispetto a Opus 4.6 e Gemini 3.1 Pro.

Sembra avere una comprensione molto migliore delle sfumature degli intenti degli sviluppatori.

Il prezzo è competitivo considerando la dimensione della context window da 1M.

Sta chiaramente mettendo pressione su OpenAI per rispondere con un model che eguagli quella capacità di 1 milione di context.

Il fatto che questo model sia in grado di creare questo clone di Minecraft in un colpo solo è semplicemente straordinario.

Stiamo vedendo una riduzione del 33% nei tassi di allucinazione fattuale.

Le modalità di reasoning sono categorizzate nei livelli Standard, Extended e Heavy.

Il grounding visivo sul benchmark OSWorld è attualmente leader del settore.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per GPT-5.4

Consigli esperti per aiutarti a ottenere il massimo da GPT-5.4 e raggiungere risultati migliori.

Regolare l'effort di reasoning

Utilizza i livelli di effort di reasoning Standard, Extended o Heavy a seconda della complessità del task per bilanciare i costi computazionali e la qualità dell'output.

Monitorare il piano iniziale

Quando utilizzi la variante Thinking, osserva il piano iniziale; puoi intervenire a metà della generazione se il percorso logico proposto dal model sembra errato.

Prompt caching strategico

Posiziona blocchi di context ampi e statici all'inizio del tuo prompt per sfruttare il prompt caching automatico di OpenAI e risparmiare sui costi.

Gestire la stabilità della context window

Sebbene la context window da 1,05M sia robusta, le performance risultano più stabili entro i primi 256K tokens; mantieni i riassunti critici vicino alla fine del prompt.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Domande frequenti su GPT-5.4

Trova risposte alle domande comuni su GPT-5.4