openai

GPT-5.4

GPT-5.4 è il frontier model di OpenAI con una context window da 1,05M e Extreme Reasoning. Eccelle nell'interazione UI autonoma e nell'analisi di dati...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 marzo 2026
Contesto
1.1Mtoken
Output max
128Ktoken
Prezzo input
$2.50/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
84.2%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. GPT-5.4 ha ottenuto 84.2% in questo benchmark.
HLE
42%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. GPT-5.4 ha ottenuto 42% in questo benchmark.
MMLU
91%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. GPT-5.4 ha ottenuto 91% in questo benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. GPT-5.4 ha ottenuto 76% in questo benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. GPT-5.4 ha ottenuto 56.7% in questo benchmark.
IFEval
92%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. GPT-5.4 ha ottenuto 92% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. GPT-5.4 ha ottenuto 100% in questo benchmark.
MATH
88.6%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. GPT-5.4 ha ottenuto 88.6% in questo benchmark.
GSM8k
99%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. GPT-5.4 ha ottenuto 99% in questo benchmark.
MGSM
96%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. GPT-5.4 ha ottenuto 96% in questo benchmark.
MathVista
74%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. GPT-5.4 ha ottenuto 74% in questo benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. GPT-5.4 ha ottenuto 52.8% in questo benchmark.
HumanEval
85.1%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. GPT-5.4 ha ottenuto 85.1% in questo benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. GPT-5.4 ha ottenuto 72.5% in questo benchmark.
MMMU
84.2%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. GPT-5.4 ha ottenuto 84.2% in questo benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. GPT-5.4 ha ottenuto 61% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. GPT-5.4 ha ottenuto 89% in questo benchmark.
DocVQA
94%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. GPT-5.4 ha ottenuto 94% in questo benchmark.
Terminal-Bench
55%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. GPT-5.4 ha ottenuto 55% in questo benchmark.
ARC-AGI
52.9%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. GPT-5.4 ha ottenuto 52.9% in questo benchmark.

Informazioni su GPT-5.4

Scopri le capacita di GPT-5.4, le funzionalita e come puo aiutarti a ottenere risultati migliori.

La frontiera del reasoning a contesto esteso

GPT-5.4 rappresenta l'evoluzione ad alte prestazioni della serie GPT-5. È dotato di una context window da 1,05 milioni di token leader del settore. Questo modello gestisce dataset estesi, come enormi repository di codice o log storici pluriennali, senza perdere fedeltà nel reasoning. Il Mid-Response Steering interattivo consente agli utenti di monitorare e regolare il piano di pensiero del modello in tempo reale, garantendo che l'output si allinei perfettamente con intenti complessi e multi-step.

Intelligenza unificata e azione autonoma

Tecnicamente, GPT-5.4 unisce i punti di forza nella programmazione di livello mondiale delle precedenti branche Codex con le sfumature creative della serie GPT-5 standard. Dispone di una modalità Thinking specializzata con livelli di impegno regolabili (Standard, Extended e Heavy). Utilizza un processing chain-of-thought rinforzato per risolvere problemi scientifici e logici di livello PhD. Oltre al testo, GPT-5.4 introduce funzionalità native di computer use, raggiungendo un punteggio del 75% nelle attività verificate OSWorld interpretando screenshot visivi ed eseguendo clic basati su coordinate.

Efficienza e affidabilità

OpenAI segnala una diminuzione del 33% negli errori di livello claim rispetto ai predecessori, rendendo GPT-5.4 una scelta primaria per agenti autonomi e supporto decisionale ad alta posta in gioco. È progettato per l'efficienza energetica e dei token, consentendo un'elaborazione a contesto esteso più economica rispetto alle iterazioni precedenti. Che si tratti di gestire un'intera codebase aziendale o di agire come agente di pianificazione autonomo, GPT-5.4 stabilisce un nuovo standard per affidabilità e prestazioni agentic.

GPT-5.4

Casi d'uso per GPT-5.4

Scopri i diversi modi in cui puoi usare GPT-5.4 per ottenere ottimi risultati.

Refactoring di codice su larga scala

Riscrittura sistematica di codebase legacy che superano le 300.000 righe con rigorosa aderenza agli standard architetturali.

Modellazione finanziaria autonoma

Costruzione di complessi modelli a tre prospetti in cui l'AI riconcilia conti economici, stati patrimoniali e flussi di cassa.

System design interattivo

Sviluppo di simulazioni 3D o giochi basati sulla fisica guidando il percorso logico del modello durante il processo di generazione.

Agentic Computer Use

Esecuzione di attività desktop multi-step come inserimento massivo di dati, gestione email e test software tramite interazione nativa con l'interfaccia.

Analisi legale a contesto esteso

Riferimento incrociato tra centinaia di documenti legali per identificare incongruenze o estrarre clausole specifiche con elevata accuratezza di richiamo.

Supporto alla ricerca di livello PhD

Risoluzione di complesse dimostrazioni matematiche e problemi scientifici utilizzando la modalità Heavy Reasoning per catene logiche verificate.

Punti di forza

Limitazioni

Contesto massivo da 1,05M: Offre una capacità leader del settore per l'analisi profonda di enormi codebase e set di documenti senza degrado del contesto.
Latenza di reasoning: L'attivazione della modalità Heavy Thinking può comportare tempi di attesa di diversi minuti per logiche complesse o generazioni di codice estese.
Thinking interattivo: La navigazione unica durante la risposta consente agli utenti di guidare i percorsi di reasoning, riducendo significativamente le generazioni e i token sprecati.
Rate limiting: Durante il rollout iniziale, gli utenti potrebbero riscontrare limiti di messaggi aggressivi o bug temporanei dell'account man mano che la capacità scala.
Computer Use nativo: L'interazione UI ad alta precisione (75% su OSWorld) consente al modello di lavorare direttamente all'interno di ambienti desktop e browser.
Scaling non lineare: In alcuni compiti creativi, è emerso che le modalità di reasoning più leggere superano quelle pesanti in termini di dettagli estetici.
Efficienza estrema dei token: L'architettura ottimizzata offre prestazioni da frontier del 2026 con latenza e consumo energetico inferiori rispetto alle versioni precedenti di GPT-5.
Context rot a 1M: Sebbene la finestra sia ampia, l'accuratezza del recupero diminuisce significativamente passando da 256K a 1M di token.

Avvio rapido API

openai/gpt-5.4

Visualizza documentazione
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su GPT-5.4

Guarda cosa pensa la community di GPT-5.4

GPT 5.4 in Codex è un miglioramento enorme... l'ho visto effettivamente lavorare per 150 minuti di fila senza perdere il contesto.
ArchMeta1868
reddit
Le capacità di design 3D di GPT 5.4 non hanno rivali. Il modo in cui ha gestito trasparenza e fisica nel mio simulatore di navi era incredibilmente accurato.
AI_Creative_Daily
twitter
La correzione del percorso in tempo reale è incredibile. Posso effettivamente vedere dove sta andando il modello e correggerlo prima che sprechi token.
dev_guru_99
reddit
Ha battuto gli umani l'83% delle volte in 44 lavori diversi. Avvocato, contabile, analista finanziario, amministratore.
Josh Kale
twitter
OpenAI ha finalmente risolto il collo di bottiglia dell'output. 128k token di output sono un sogno per gli sviluppatori che creano applicazioni full-stack.
TheCodeChannel
youtube
La latenza del computer use c'è ancora, ma la precisione è abbastanza alta da gestire complessi workflow SAP, il che è pazzesco.
enterprise_sysadmin
hackernews

Video su GPT-5.4

Guarda tutorial, recensioni e discussioni su GPT-5.4

GPT 5.4 è qui e potremmo davvero avere un nuovo miglior modello sul pianeta.

Il Thinking di GPT 5.4 può ora fornire un piano iniziale... ti permette di guidare il modello.

Questo elemento interattivo risolve il problema della scatola nera dei modelli di reasoning.

La velocità rispetto a o1-preview è giorno e notte per le attività standard.

Stai vedendo un reasoning che sembra davvero coerente in lunghe conversazioni.

GPT 5.4... non è stato creato per chattare. È stato creato per lavorare.

Caricamento deferred... ridotto l'utilizzo totale di token del 47% senza perdita di accuratezza.

La funzionalità di computer use traccia gli elementi UI con un sistema basato su coordinate.

L'ho testato con una codebase Java legacy e ha effettivamente compreso le dipendenze tra i file.

Ci stiamo muovendo verso un mondo in cui l'AI è il controller del sistema operativo.

1 milione e 50.000 token di context window. È una context window molto lunga.

Navigalo mentre sta pensando, che è decisamente più efficiente da usare.

Il prezzo è elevato ma per ampi set di documenti, è l'unico modello che funziona.

La modalità Thinking può essere regolata in base alla complessità del tuo prompt.

Sembra più affidabile nel richiamo fattuale rispetto a qualsiasi versione precedente di GPT.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per GPT-5.4

Consigli esperti per aiutarti a ottenere il massimo da GPT-5.4 e raggiungere risultati migliori.

Regola l'impegno di Thinking

Utilizza i parametri Standard, Extended o Heavy per bilanciare la necessità di precisione rispetto alla velocità di generazione e ai costi.

Revisiona il piano di Thinking

Monitora il piano iniziale fornito dal modello e utilizza il Mid-Response Steering per correggerlo se la logica devia.

Sfrutta il caricamento deferred dei tool

Per i workflow agentic, usa il registro di caricamento deferred per ridurre i costi dei token iniziali fino al 47%.

Usa i contratti di completezza

Definisci esplicitamente cosa significhi "completato" nel tuo prompt per rendere il modello più persistente durante attività a lunga esecuzione.

Visione a massima risoluzione

Carica immagini ad alta fedeltà fino a 10,24M di pixel per ispezioni visive precise di elementi UI o diagrammi tecnici.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Domande frequenti su GPT-5.4

Trova risposte alle domande comuni su GPT-5.4