anthropic

Claude Opus 4.5

Claude 4.5 Opus è il frontier model più potente di Anthropic, con prestazioni record dell'80,9% su SWE-bench e un'agency autonoma avanzata per il coding.

anthropic logoanthropicClaude24 novembre 2025
Contesto
200Ktoken
Output max
64Ktoken
Prezzo input
$5.00/ 1M
Prezzo output
$25.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
87%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Opus 4.5 ha ottenuto 87% in questo benchmark.
MMLU
90.8%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Opus 4.5 ha ottenuto 90.8% in questo benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Opus 4.5 ha ottenuto 80% in questo benchmark.
IFEval
90%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Opus 4.5 ha ottenuto 90% in questo benchmark.
AIME 2025
37%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Opus 4.5 ha ottenuto 37% in questo benchmark.
MATH
85%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Opus 4.5 ha ottenuto 85% in questo benchmark.
GSM8k
95%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Opus 4.5 ha ottenuto 95% in questo benchmark.
MGSM
92%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Opus 4.5 ha ottenuto 92% in questo benchmark.
MathVista
72%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Opus 4.5 ha ottenuto 72% in questo benchmark.
SWE-Bench
80.9%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Opus 4.5 ha ottenuto 80.9% in questo benchmark.
HumanEval
90%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Opus 4.5 ha ottenuto 90% in questo benchmark.
LiveCodeBench
75%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Opus 4.5 ha ottenuto 75% in questo benchmark.
MMMU
80.7%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Opus 4.5 ha ottenuto 80.7% in questo benchmark.
MMMU Pro
60%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Opus 4.5 ha ottenuto 60% in questo benchmark.
ChartQA
90%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Opus 4.5 ha ottenuto 90% in questo benchmark.
DocVQA
94%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Opus 4.5 ha ottenuto 94% in questo benchmark.
Terminal-Bench
59.3%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Opus 4.5 ha ottenuto 59.3% in questo benchmark.
ARC-AGI
37.6%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Opus 4.5 ha ottenuto 37.6% in questo benchmark.

Informazioni su Claude Opus 4.5

Scopri le capacita di Claude Opus 4.5, le funzionalita e come puo aiutarti a ottenere risultati migliori.

L'apice dell'agency autonoma

Claude Opus 4.5 rappresenta il salto più significativo di Anthropic nella frontier intelligence, progettato specificamente per le task più complesse nell'ingegneria del software e nelle operazioni autonome. Rilasciato a fine 2025, ha infranto i record sul benchmark SWE-bench Verified con un punteggio dell'80,9%, diventando il primo model in grado di automatizzare efficacemente il debugging su larga scala e il refactoring di sistema con un intervento umano minimo.

Intelligenza con un'anima

Oltre alle sue prodezze tecniche, Opus 4.5 introduce una personalità raffinata guidata dal "soul document" di Anthropic, che enfatizza l'onestà diplomatica e una disponibilità ricca di sfumature. Ciò rende il model unicamente capace di comprendere il gusto stilistico e il design incentrato sull'uomo. È ottimizzato per workflow agentic, con una context window da 200.000 token e uno speciale "parametro effort" che consente ai developer di scalare la profondità del reasoning rispetto ai costi computazionali.

Eccellenza Multimodal

Come potenza multimodal, Opus 4.5 eccelle nelle task basate sulla vision, dall'analisi di densi diagrammi architetturali all'estrazione di dati da layout di documenti complessi. La sua capacità di navigare in un ambiente nativo del terminale tramite Claude Code gli consente di eseguire audit di sistema e patching di sicurezza, posizionandolo come un partner persistente e altamente capace per i team di ingegneria professionale.

Claude Opus 4.5

Casi d'uso per Claude Opus 4.5

Scopri i diversi modi in cui puoi usare Claude Opus 4.5 per ottenere ottimi risultati.

Ingegneria autonoma

Automatizza l'intero ciclo di vita delle issue di GitHub, inclusi riproduzione, debugging e testing.

Amministrazione di sistema

Conduce audit di server e patching di sicurezza in autonomia tramite interazione diretta col terminale.

Refactoring architetturale

Analizza repository massicci per suggerire e implementare il rafforzamento della sicurezza a livello di sistema.

Sintesi di documenti complessi

Trasforma centinaia di PDF multipagina in model finanziari strutturati o visualizzazioni di dati.

Sviluppo creativo di giochi

Genera ambienti 3D funzionali con fisica attiva partendo da singoli prompt complessi.

Assistente di ricerca persistente

Incrocia dataset enormi per trovare contraddizioni non ovvie in file legali o tecnici.

Punti di forza

Limitazioni

Coding da record: Raggiunge l'80,9% su SWE-bench Verified, automatizzando incarichi complessi di ingegneria del software.
Modello di prezzo premium: A $5/$25 per 1M di token, è significativamente più costoso dei model di fascia media.
Efficienza dei token superiore: Raggiunge un'intelligenza da frontier model utilizzando fino al 76% di token in meno rispetto a Sonnet per logiche simili.
Gap nei benchmark matematici: Risulta inferiore ai model specializzati nel reasoning in competizioni matematiche di alto livello come il test AIME.
Context window imponente da 200K: Gestisce set di documenti e repository massicci con un'accuratezza di retrieval ad alta fedeltà.
Nessun supporto nativo audio/video: Attualmente manca della capacità di elaborare direttamente stream audio o video senza pre-elaborazione.
Logica per agent autonomi: Ottimizzato per sessioni autonome a lunga durata tramite tool nativi per terminale e stop hook.
Elevata latency di esecuzione: Le task di reasoning profondo possono richiedere molto tempo, a volte rendendo necessarie sessioni di ore per gli agent.

Avvio rapido API

anthropic/claude-4.5-opus

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Opus 4.5

Guarda cosa pensa la community di Claude Opus 4.5

"Ogni singola riga del mio codice di produzione è stata generata da Claude Code eseguito su Opus 4.5"
Boris Cherny
x
"Opus 4.5 è il punto di riferimento se cerchi sensibilità stilistica e un tono che sembri umano"
Nate B Jones
youtube
"L'intelligenza sta finalmente diventando più economica; questo model costa 3 volte meno del precedente Opus"
BuildwithVignesh
reddit
"Claude Opus 4.5 ha superato un benchmark essendo troppo intelligente e sfruttando una scappatoia"
MetaKnowing
reddit
"La profondità di reasoning e la capacità di coding sono su un altro livello rispetto a tutto il resto"
Santosh Gupta
x
"Le capacità agentic sul terminale tramite Claude Code lo rendono un'eccellenza per il devops"
hn_user_alpha
hackernews

Video su Claude Opus 4.5

Guarda tutorial, recensioni e discussioni su Claude Opus 4.5

Il prezzo è ora tre volte più basso... $5 per un milione di token in input.

Questo è il miglior risultato che abbia mai ottenuto da un model su questo test Minecraft con prompt singolo.

Opus 4.5 ha ottenuto un punteggio superiore a qualsiasi candidato umano in questo test tecnico da svolgere a casa.

Il reasoning qui non è solo seguire istruzioni; è comprendere l'intento.

Se stai facendo un lavoro architetturale complesso, questo è l'unico model che lo gestisce in modo affidabile.

80,9% su SWE-bench verified... e usa il 50% di token in meno rispetto a Sonnet.

Opus 4.5 punta direttamente all'ingegneria del software professionale, non al coding amatoriale.

Oltre a SWE-bench, registra un guadagno del 15% rispetto a Sonnet su Terminal Bench.

Il model è capace di sessioni autonome a lunga durata che possono durare ore.

Le prestazioni della vision sono notevolmente più dettagliate nell'analisi di diagrammi tecnici densi.

Pensate a Claude Opus 4.5 come a un livello di persuasione e a un mostro agentic assoluto.

Molti ingegneri finiscono per preferire Opus 4.5 per l'ergonomia e l'harness.

Il model è consapevole della sua soul spec in modo decontestualizzato.

Opus 4.5 mostra un livello di gusto nella scrittura che GPT-5.2 semplicemente non ha.

Utilizza un parametro effort dinamico per scalare la sua intelligenza in base alla task.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti
Guarda la demo

Consigli Pro per Claude Opus 4.5

Consigli esperti per aiutarti a ottenere il massimo da Claude Opus 4.5 e raggiungere risultati migliori.

Usa un Effort elevato per la logica

Imposta il parametro 'effort' su 'high' per task architetturali complessi per garantire la massima profondità di reasoning.

Implementa gli Stop Hook

Utilizza stop hook specializzati nei workflow agentic per consentire al model di eseguire e auto-correggersi nell'arco di diverse ore.

Sfrutta Claude Code

Abbina il model al tool CLI Claude Code per sbloccare tutto il suo potenziale nelle task di sistema native del terminale.

Ottimizza l'uso dei token

Usa Opus 4.5 solo per task ad alta logica, poiché produce una qualità equivalente a Sonnet utilizzando fino al 76% di token in meno.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Domande frequenti su Claude Opus 4.5

Trova risposte alle domande comuni su Claude Opus 4.5