openai

GPT-5.2

GPT-5.2 è il modello flagship di OpenAI per task professionali, dotato di una context window da 400K, capacità di programmazione d'élite e deep reasoning...

openai logoopenaiGPT-511 dicembre 2025
Contesto
400Ktoken
Output max
100Ktoken
Prezzo input
$1.75/ 1M
Prezzo output
$14.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
93%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. GPT-5.2 ha ottenuto 93% in questo benchmark.
HLE
45%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. GPT-5.2 ha ottenuto 45% in questo benchmark.
MMLU
88%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. GPT-5.2 ha ottenuto 88% in questo benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. GPT-5.2 ha ottenuto 83% in questo benchmark.
SimpleQA
58%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. GPT-5.2 ha ottenuto 58% in questo benchmark.
IFEval
95%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. GPT-5.2 ha ottenuto 95% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. GPT-5.2 ha ottenuto 100% in questo benchmark.
MATH
98%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. GPT-5.2 ha ottenuto 98% in questo benchmark.
GSM8k
99%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. GPT-5.2 ha ottenuto 99% in questo benchmark.
MGSM
98%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. GPT-5.2 ha ottenuto 98% in questo benchmark.
MathVista
78%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. GPT-5.2 ha ottenuto 78% in questo benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. GPT-5.2 ha ottenuto 80% in questo benchmark.
HumanEval
95%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. GPT-5.2 ha ottenuto 95% in questo benchmark.
LiveCodeBench
80%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. GPT-5.2 ha ottenuto 80% in questo benchmark.
MMMU
75%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. GPT-5.2 ha ottenuto 75% in questo benchmark.
MMMU Pro
65%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. GPT-5.2 ha ottenuto 65% in questo benchmark.
ChartQA
93%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. GPT-5.2 ha ottenuto 93% in questo benchmark.
DocVQA
95%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. GPT-5.2 ha ottenuto 95% in questo benchmark.
Terminal-Bench
60%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. GPT-5.2 ha ottenuto 60% in questo benchmark.
ARC-AGI
52.9%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. GPT-5.2 ha ottenuto 52.9% in questo benchmark.

Informazioni su GPT-5.2

Scopri le capacita di GPT-5.2, le funzionalita e come puo aiutarti a ottenere risultati migliori.

GPT-5.2 è il modello di reasoning flagship di OpenAI, progettato per il lavoro intellettuale professionale ad alto rischio e l'ingegneria autonoma. Rilasciato l'11 dicembre 2025, segna un'evoluzione significativa rispetto alla serie GPT-4 e GPT-o1 integrando una Thinking mode dedicata con controlli dello sforzo (Medium, High, Extra High). Ciò consente al modello di fermarsi e verificare la logica multi-step prima di generare una risposta.

Con una massiccia context window da 400K e un richiamo vicino al 100%, è progettato per code review di alto livello, refactoring complesso e ricerca scientifica. L'architettura del modello è costruita per supportare flussi di lavoro agentic, caratterizzata da chiamate a strumenti native e visione multimodale in grado di elaborare simultaneamente diagrammi tecnici complessi e codebase.

Sebbene eccella nella precisione logica e nei benchmark ingegneristici, raggiungendo un punteggio del 100% su AIME 2025, adotta un tono più formale e meccanico rispetto ai concorrenti come Claude. Attualmente ha un prezzo di 1,75$ per milione di input tokens e 14,00$ per milione di output tokens, rendendolo un'alternativa conveniente per task di deep reasoning che in precedenza richiedevano un'elevata supervisione umana.

GPT-5.2

Casi d'uso per GPT-5.2

Scopri i diversi modi in cui puoi usare GPT-5.2 per ottenere ottimi risultati.

Refactoring ingegneristici complessi

Esecuzione di refactoring profondi su codebase critiche per le performance, mantenendo rigidi invarianti di tipo e coerenza architetturale.

Task autonomi su terminale

Esecuzione di flussi di lavoro CLI multi-step e gestione di deployment cloud complessi grazie alle alte performance negli ambienti Terminal-Bench.

Sintesi di conoscenza di livello PhD

Analisi simultanea di centinaia di fonti tecniche e articoli accademici per creare report di ricerca completi su argomenti scientifici di nicchia.

Risoluzione di bug di concorrenza

Identificazione e risoluzione di sottili race condition o memory leak che richiedono un'inferenza logica di alto livello su lunghi segmenti di codice.

Elaborazione meccanica del codice

Gestione di migrazioni di codice ripetitive su larga scala in interi repository, senza la pigrizia spesso osservata negli LLM general-purpose.

Revisione tecnica senior

Agire come un ingegnere senior virtuale per rivedere piani di progettazione e identificare edge case logici per sistemi in produzione.

Punti di forza

Limitazioni

Precisione ingegneristica superiore: Ha raggiunto un punteggio del 77,3% su Terminal-Bench 2.0, superando i concorrenti nei task complessi di riga di comando.
Alta latenza di risposta: Il significativo carico di lavoro per il reasoning rende il modello notevolmente più lento rispetto alle iterazioni precedenti, portando a tempi di attesa lunghi.
Reasoning matematico d'élite: Ha ottenuto il 100% nel benchmark AIME 2025, dimostrando capacità matematiche di livello competitivo senza strumenti esterni.
Tono UX artificiale: Criticato dagli utenti per una disponibilità pretenziosa ed eccessivamente strutturata che appare meno naturale rispetto alla serie Claude.
Basso tasso di allucinazioni: I test della community e i benchmark interni mostrano una riduzione del 30% nelle invenzioni fattuali rispetto alle precedenti generazioni flagship.
Processo di pensiero opaco: A differenza di alcuni modelli di reasoning trasparenti, GPT-5.2 spesso nasconde la sua chain-of-thought interna, fornendo solo la risposta finale verificata.
Persistenza prolungata del task: In grado di sostenere sessioni di lavoro autonomo attivo per oltre due ore, rendendolo ideale per attività di sviluppo su larga scala.
Costi di reasoning premium: Il prezzo di 14,00$ per l'output può aumentare rapidamente durante lunghi task di reasoning in cui vengono addebitati volumi elevati di thinking tokens.

Avvio rapido API

openai/gpt-5.2

Visualizza documentazione
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su GPT-5.2

Guarda cosa pensa la community di GPT-5.2

GPT 5.2 in Codex è un enorme miglioramento, è più propenso a gestire quei task meccanici che normalmente renderebbero i modelli pigri.
ArchMeta1868
reddit
La maggiore deliberazione e il tempo speso a verificare i fatti dell'output sono encomiabili... l'affidabilità è migliorata notevolmente.
Thomas Randall
techopedia
Il modello che alimenta la ricerca approfondita ha mostrato un approccio quasi umano, cercando efficacemente informazioni specializzate quando necessario.
OpenAI Official
twitter
L'attenzione di OpenAI verso la 'cura dell'utente' strutturata sembra una maschera aziendale per un nucleo freddo rispetto alle discussioni naturali di Claude.
Sviluppatore Anonimo
hackernews
Finalmente un modello che non diventa pigro a metà di un refactor da 500 righe.
CodeWizard
reddit
Il parametro reasoning effort è il vero MVP per i problemi di logica complessi.
AIBuilder
twitter

Video su GPT-5.2

Guarda tutorial, recensioni e discussioni su GPT-5.2

È pazzesco. Guardate questo one shot.

Il design non mi convince molto in GPT 5.2... ha fatto molto peggio di Gemini 3.

Il richiamo del contesto è quasi perfetto nell'intero range di 400k.

Sembra molto più un motore di reasoning che un chatbot.

La latenza è l'unico vero problema per alcune app in tempo reale.

GPT 5.2 ora può creare fogli di calcolo e presentazioni completamente formattati direttamente dentro ChatGPT.

È come se il modello fosse finalmente maturato e avesse iniziato a prendere sul serio il proprio lavoro.

Usa l'impostazione di reasoning alto solo per i task pesanti dal punto di vista logico.

Le allucinazioni sono diminuite significativamente rispetto alla serie 4o.

I flussi di lavoro agentic sono finalmente praticabili senza doverli monitorare costantemente.

GPT 5.2 è effettivamente il 40% più costoso del 5.1, ma è comunque significativamente più economico di Opus.

GPT 5.2 ha impiegato 11 minuti e 20 secondi [per costruire l'app]. Quindi il doppio del tempo [rispetto a Opus].

La qualità dell'output è molto più alta quando permetti alla modalità thinking di girare.

Ha gestito il refactor multi-file senza perdere le definizioni di tipo.

Se hai bisogno di velocità pura, questo non è il modello che fa per te.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per GPT-5.2

Consigli esperti per aiutarti a ottenere il massimo da GPT-5.2 e raggiungere risultati migliori.

Sfrutta il Thinking Effort

Usa il parametro reasoning_effort (medium, high, xhigh) per adattare il tempo di deliberazione del modello alla complessità del task.

Abilita Codex per la persistenza

Quando lavori su grandi repository, usa l'ambiente dedicato Codex per mantenere sessioni di elaborazione attive fino a 150 minuti.

Fornisci il contesto in modo mirato

Fornisci documentazione di background ricca nei system prompt, poiché il modello lavora al meglio quando viene interrogato sul contesto di cui ha bisogno.

Itera sui requisiti

Istruisci esplicitamente il modello a eseguire controlli di verifica rispetto alla codebase attuale per garantire che i requisiti siano convalidati.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Domande frequenti su GPT-5.2

Trova risposte alle domande comuni su GPT-5.2