openai

GPT-5.2 Pro

GPT-5.2 Pro è il flagship reasoning model di OpenAI del 2025 con Extended Thinking per prestazioni SOTA in matematica, coding e lavoro di conoscenza esperta.

openai logoopenaiGPT-52025-12-11
Contesto
400Ktoken
Output max
128Ktoken
Prezzo input
$21.00/ 1M
Prezzo output
$168.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
93.2%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. GPT-5.2 Pro ha ottenuto 93.2% in questo benchmark.
HLE
36.6%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. GPT-5.2 Pro ha ottenuto 36.6% in questo benchmark.
MMLU
89.6%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. GPT-5.2 Pro ha ottenuto 89.6% in questo benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. GPT-5.2 Pro ha ottenuto 82% in questo benchmark.
SimpleQA
52%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. GPT-5.2 Pro ha ottenuto 52% in questo benchmark.
IFEval
93.5%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. GPT-5.2 Pro ha ottenuto 93.5% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. GPT-5.2 Pro ha ottenuto 100% in questo benchmark.
MATH
97%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. GPT-5.2 Pro ha ottenuto 97% in questo benchmark.
GSM8k
99.2%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. GPT-5.2 Pro ha ottenuto 99.2% in questo benchmark.
MGSM
96%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. GPT-5.2 Pro ha ottenuto 96% in questo benchmark.
MathVista
76.5%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. GPT-5.2 Pro ha ottenuto 76.5% in questo benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. GPT-5.2 Pro ha ottenuto 80% in questo benchmark.
HumanEval
94.5%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. GPT-5.2 Pro ha ottenuto 94.5% in questo benchmark.
LiveCodeBench
78%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. GPT-5.2 Pro ha ottenuto 78% in questo benchmark.
MMMU
79.5%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. GPT-5.2 Pro ha ottenuto 79.5% in questo benchmark.
MMMU Pro
79.5%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. GPT-5.2 Pro ha ottenuto 79.5% in questo benchmark.
ChartQA
91.2%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. GPT-5.2 Pro ha ottenuto 91.2% in questo benchmark.
DocVQA
94.8%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. GPT-5.2 Pro ha ottenuto 94.8% in questo benchmark.
Terminal-Bench
55.6%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. GPT-5.2 Pro ha ottenuto 55.6% in questo benchmark.
ARC-AGI
54.2%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. GPT-5.2 Pro ha ottenuto 54.2% in questo benchmark.

Informazioni su GPT-5.2 Pro

Scopri le capacita di GPT-5.2 Pro, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Un nuovo standard nell'intelligenza ragionata

GPT-5.2 Pro rappresenta il livello ad alto calcolo dei modelli di OpenAI focalizzati sul reasoning. È progettato specificamente per flussi di lavoro aziendali che richiedono ricerca scientifica di livello dottorato e complessa inference logica. A differenza dei modelli linguistici standard, utilizza un'architettura di calcolo sofisticata durante l'inference che consente agli utenti di scalare lo sforzo di riflessione del modello. Ciò permette al sistema di scomporre internamente i problemi, verificare la propria logica e superare i prior statistici che spesso portano a errori nei modelli più piccoli.

Specializzato per la precisione tecnica

Pur condividendo l'addestramento principale con la più ampia famiglia GPT-5, la variante Pro si distingue per la sua massiccia context window di 400.000 token e tassi di allucinazione significativamente inferiori. È stato documentato come un collaboratore affidabile nella fisica teorica e nelle dimostrazioni matematiche ad alto rischio. Le sue prestazioni su benchmark resistenti alla contaminazione come ARC-AGI-2 e GPQA Diamond lo stabiliscono come un motore di processo primario per agenti autonomi che devono gestire istruzioni tecniche e multi-fase senza l'intervento umano.

Prestazioni e output aziendali

Il modello è caratterizzato dalla sua rigorosa aderenza a istruzioni complesse e da un tono conversazionale professionale. È il primo modello a superare costantemente esperti del settore umano con oltre 14 anni di esperienza su benchmark di compiti lavorativi specializzati. Con una capacità di generazione fino a 128.000 tokens, segna un cambiamento significativo rispetto alla pigrizia osservata nelle generazioni precedenti, rendendolo capace di produrre interi moduli di codice o report di ricerca esaustivi in un unico passaggio.

GPT-5.2 Pro

Casi d'uso per GPT-5.2 Pro

Scopri i diversi modi in cui puoi usare GPT-5.2 Pro per ottenere ottimi risultati.

Ingegneria del software autonoma

Risoluzione di problemi GitHub complessi e multi-file ed esecuzione di refactoring di interi moduli con un tasso di successo dell'84,5% su SWE-Bench Verified.

Matematica olimpionica

Risoluzione del 100% dei problemi della competizione AIME 2025 e contributo con dimostrazioni originali a questioni aperte nella teoria dell'apprendimento statistico.

Orchestrazione di agenti aziendali

Funzionamento come motore di processo ad alto calcolo in grado di sequenziare decine di strumenti per gestire modelli finanziari e logistici a più fasi.

Ricerca scientifica di livello dottorato

Analisi di problemi di fisica, chimica e biologia con un punteggio GPQA del 93,2%, superando molti esperti umani della materia.

Sintesi di documenti a lungo contesto

Elaborazione fino a 400.000 tokens di dati d'archivio per generare report legali completi o manuali tecnici.

Simulazione 3D interattiva

Generazione di simulazioni 3D da migliaia di righe in Three.js o C++, inclusa la complessa fisica delle particelle e la logica meccanica.

Punti di forza

Limitazioni

Precisione matematica perfetta: Ottiene un tasso di risoluzione impeccabile del 100% sul benchmark AIME 2025, esaurendo il segnale negli esami di matematica moderni di livello competitivo.
Prezzi proibitivi: A 168 $ per milione di output tokens, il modello è circa 16 volte più costoso di GPT-5.1, limitandone l'uso a flussi di lavoro ad alto rischio.
Coding state-of-the-art: Raggiunge un tasso di risoluzione dell'84,5% su SWE-Bench Verified, funzionando efficacemente come uno sviluppatore junior in grado di gestire backlog di bug non banali.
Mancanza di funzionalità di memoria: Non supporta le Saved Memories e lo storico delle chat di riferimento, funzionalità standard nei modelli ChatGPT 5.2 di livello inferiore.
Reasoning astratto avanzato: Triplica le prestazioni ARC-AGI-2 del suo predecessore (54,2% contro 17,6%), indicando una svolta nella gestione di attività di induzione di regole inedite.
Latenza significativa: Il deep reasoning interno può causare al modello tempi di attesa superiori a 15 minuti su un singolo prompt, specialmente in modalità di sforzo xhigh.
Massima capacità di output 128K: Progettato per generare interi libri, repository di codice o report scientifici esaustivi in un unico passaggio di inference.
Errori nella selezione dei frame: Occasionale incapacità di sovrascrivere i prior statistici in compiti di senso comune, anche quando identifica correttamente i vincoli logici nelle tracce di pensiero.

Avvio rapido API

openai/gpt-5.2-pro

Visualizza documentazione
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Progetta un modello di leveraged buyout per un'operazione di take-private.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su GPT-5.2 Pro

Guarda cosa pensa la community di GPT-5.2 Pro

Il reasoning c'era; la conclusione semplicemente non ne conseguiva. Se questo non ti fa riflettere, dovrebbe.
Ok_Entrance_4380
reddit
GPT-5.2 Pro ha derivato un nuovo risultato in fisica teorica che ha superato il controllo degli esperti, cosa che 5.1 non riusciva a fare.
kevinweil
twitter
GPT-5.2 Pro sta iniziando ad assomigliare a uno sviluppatore junior in grado di gestire una parte non banale dell'issue tracker.
Due_Woodpecker2882
reddit
OpenAI ammette che il modello Pro manca di memoria. Per me, come accademico, è devastante.
Oldschool728603
hackernews
La logica è impeccabile ma la latenza mi fa sentire come se stessi collaborando con un genio molto lento.
User123
reddit
Finalmente un modello che non allucina durante una semplice contrazione tensoriale.
PhysicsProf
hackernews

Video su GPT-5.2 Pro

Guarda tutorial, recensioni e discussioni su GPT-5.2 Pro

si vociferano punteggi IQ Mensa Norvegia tra 145 e 147

ha prodotto oltre 24.000 righe di codice

inclusione di un'opzione per il tempo di riflessione selezionabile

il prezzo del livello Pro è destinato rigorosamente ai budget aziendali

questo modello ha risolto l'intero backlog di sviluppo in un pomeriggio

riduzione del 30% delle allucinazioni

il layout generale è sorprendentemente buono rispetto a dove eravamo con 5.1

Esattamente 300 parole. È la prima volta che fornisco un limite di parole e lo ha centrato esattamente

Le capacità di visione sui progetti architettonici sono impareggiabili

Sembra significativamente più freddo e robotico rispetto al 5.1

GPT5 Pro da 200 $ ha riflettuto per 25 minuti e 36 secondi

assegnando il doppio del calcolo di inference

ha convertito un problema complicato... in un diverso tipo di meccanismo da un campo chiamato analisi complessa

è praticamente un dottorato in scatola per 200 $ al mese

la traccia di pensiero mostra che sta effettivamente verificando i propri passaggi

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per GPT-5.2 Pro

Consigli esperti per aiutarti a ottenere il massimo da GPT-5.2 Pro e raggiungere risultati migliori.

Scalare lo sforzo di reasoning

Utilizza il parametro API reasoning_effort e impostalo su xhigh per le attività in cui la coerenza logica è più importante della velocità di generazione.

Gestire i prior statistici

Se il modello cade in trappole dettate dal senso comune, fornisci un suggerimento di contesto per attivare il suo strato di reasoning attivo e superare i suoi addestramenti di base.

Utilizzare l'output massivo

Richiedi intere directory di progetto o file di documentazione completi in un unico prompt per sfruttare il budget di output di 128K.

Sfruttare l'integrazione di tool

Abilita sempre il function calling per le attività di visione; le prestazioni multimodal del modello aumentano quando può utilizzare strumenti per verificare i dati visivi.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Domande frequenti su GPT-5.2 Pro

Trova risposte alle domande comuni su GPT-5.2 Pro