anthropic

Claude Sonnet 4.5

Claude Sonnet 4.5 di Anthropic offre prestazioni di codifica leader a livello mondiale (77,2% SWE-bench) e una context window da 200K, ottimizzata per la...

AI CodingAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29 settembre 2025
Contesto
200Ktoken
Output max
64Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImageAudioVideo
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
83%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Sonnet 4.5 ha ottenuto 83% in questo benchmark.
HLE
34%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Sonnet 4.5 ha ottenuto 34% in questo benchmark.
MMLU
89%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Sonnet 4.5 ha ottenuto 89% in questo benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Sonnet 4.5 ha ottenuto 78% in questo benchmark.
SimpleQA
52%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Sonnet 4.5 ha ottenuto 52% in questo benchmark.
IFEval
88%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Sonnet 4.5 ha ottenuto 88% in questo benchmark.
AIME 2025
87%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Sonnet 4.5 ha ottenuto 87% in questo benchmark.
MATH
87%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Sonnet 4.5 ha ottenuto 87% in questo benchmark.
GSM8k
98%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Sonnet 4.5 ha ottenuto 98% in questo benchmark.
MGSM
92%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Sonnet 4.5 ha ottenuto 92% in questo benchmark.
MathVista
72%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Sonnet 4.5 ha ottenuto 72% in questo benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Sonnet 4.5 ha ottenuto 77% in questo benchmark.
HumanEval
94%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Sonnet 4.5 ha ottenuto 94% in questo benchmark.
LiveCodeBench
68%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Sonnet 4.5 ha ottenuto 68% in questo benchmark.
MMMU
78%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Sonnet 4.5 ha ottenuto 78% in questo benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Sonnet 4.5 ha ottenuto 55% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Sonnet 4.5 ha ottenuto 89% in questo benchmark.
DocVQA
92%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Sonnet 4.5 ha ottenuto 92% in questo benchmark.
Terminal-Bench
50%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Sonnet 4.5 ha ottenuto 50% in questo benchmark.
ARC-AGI
14%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Sonnet 4.5 ha ottenuto 14% in questo benchmark.

Informazioni su Claude Sonnet 4.5

Scopri le capacita di Claude Sonnet 4.5, le funzionalita e come puo aiutarti a ottenere risultati migliori.

**La frontiera dell'intelligenza agentica**

Claude 4.5 Sonnet rappresenta un importante progresso nell'intelligenza di frontiera, ottimizzato per l'era degli autonomous AI agents. Rilasciato a fine 2025, è un model di hybrid reasoning che consente agli sviluppatori di passare dall'esecuzione ad alta velocità per task di routine al pensiero esteso per sfide logiche complesse. È leader nei benchmark per l'uso del computer e l'orchestrazione di strumenti, rendendolo il motore preferito per agent basati su terminale e ingegneria del software su più file.

**Precisione e riduzione delle allucinazioni**

L'architettura del model privilegia la logica e la precisione, riducendo la sicofantia e le allucinazioni osservate nelle serie precedenti. Con un limite di output di 64.000 token e una context window di 200.000 token, può elaborare interi repository generando file applicativi completi in un unico passaggio. Introduce checkpoint nativi per i flussi di lavoro agentici, consentendo ai sistemi di tornare indietro e correggere autonomamente gli errori senza intervento umano.

**Abilità multimodale e di reasoning**

Oltre allo sviluppo software, Sonnet 4.5 eccelle nell'analisi multimodale di documenti e nella modellazione finanziaria. La sua logica interna privilegia il contesto architettonico, consentendogli di mappare sistemi su larga scala in modo più efficace rispetto ai predecessori. Che si tratti di elaborare note scritte a mano o di implementare integrazioni API, il model mantiene un'elevata precisione fattuale e un rigoroso rispetto delle istruzioni in task di lungo periodo.

Claude Sonnet 4.5

Casi d'uso per Claude Sonnet 4.5

Scopri i diversi modi in cui puoi usare Claude Sonnet 4.5 per ottenere ottimi risultati.

Ingegneria del software autonoma

Gestione dello sviluppo end-to-end, dai requisiti iniziali ai commit automatizzati utilizzando interfacce terminale.

Automazione basata su GUI

Automatizzazione della navigazione web e dell'inserimento dati in applicazioni legacy utilizzando le funzionalità native di computer use.

Orchestrazione multi-agent

Delega di task specializzati a sub-agent come revisori e builder all'interno di un loop di pianificazione centrale.

Refactoring di codice complesso

Riprogettazione di basi di codice multi-file mantenendo la coerenza su 200.000 token di contesto attivo.

Analisi finanziaria dettagliata

Analisi di report trimestrali e fogli di calcolo con visione artificiale per identificare discrepanze e approfondimenti sugli investimenti.

Visualizzazione dati interattiva

Generazione di grafici dinamici da set di dati complessi utilizzando l'esecuzione di codice integrata e la costruzione in tempo reale.

Punti di forza

Limitazioni

Computer Use nativo: Il model interagisce con i sistemi operativi tramite il movimento del cursore e la manipolazione della GUI con un'accuratezza del 61,4%.
Nessun input audio nativo: Il model non può elaborare direttamente file audio come modalità nativa e richiede strumenti di trascrizione esterni.
Performance di codifica d'élite: Raggiunge il 77,2% su SWE-bench Verified, superando tutti gli altri model nella risoluzione di problemi GitHub.
Costo dei token di reasoning: I token utilizzati durante l'extended thinking interno vengono fatturati come token di output, aumentando il costo per query complesse.
Orizzonte di task di 30 ore: L'architettura consente 30 ore di lavoro autonomo continuo mantenendo stato e concentrazione.
Latenza nella modalità Thinking: Quando l'extended thinking è abilitato, il model può impiegare diversi minuti per elaborare piani architettonici complessi.
Limite di output 64K: La massiccia capacità di output consente di generare intere architetture applicative in una singola chiamata API.
Varianza in matematica competitiva: Sebbene leader nella programmazione, occasionalmente segue model di reasoning specializzati in specifici benchmark di programmazione competitiva.

Avvio rapido API

anthropic/claude-4-5-sonnet

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analizza questa base di codice per difetti di sicurezza." }
  ],
});

console.log(response.content[0].text);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Sonnet 4.5

Guarda cosa pensa la community di Claude Sonnet 4.5

Claude 4.5 Sonnet è disponibile ovunque oggi, il miglior model di programmazione al mondo.
ClaudeOfficial
reddit
Questo risolve uno dei problemi di scalabilità più fastidiosi con le configurazioni MCP. Vedevo il contesto evaporare prima ancora che iniziasse il lavoro reale.
Simon Willison
twitter
Claude Code-Sonnet 4.5 è molto avanti rispetto a Gemini 3.0 Pro per complessi task di refactoring in container Docker.
Comfortable-Friend96
reddit
Il pattern: gli errori diventano documentazione. Aggiungi una regola a CLAUDE.md e non accade mai più.
Boris Cherny
twitter
La modalità di reasoning ibrido è un salvavita per il debugging di logiche asincrone complesse dove i model normali si limitano a girare in loop.
AsyncDev
hackernews
La parità di prezzo con 3.5 Sonnet rende questo un facile aggiornamento per tutte le nostre pipeline agentiche di produzione.
StartupFounder2025
reddit

Video su Claude Sonnet 4.5

Guarda tutorial, recensioni e discussioni su Claude Sonnet 4.5

Questo nuovo model 4.5 Sonnet sta superando persino Opus 4.1 nel test Swaybench verified

È stato in grado di mantenere il focus per oltre 30 ore su complessi task multi-fase

È in testa al benchmark di computer use OS world con un punteggio del 61,4%

Il motore di reasoning interno gestisce gli ambienti Python con molta più stabilità rispetto al 3.5

L'integrazione con il terminale appare molto più solida con quasi zero comandi shell allucinati

Sonnet 4.5 è ora leader nell'uso di strumenti agentici... un salto del 20%, il che è davvero entusiasmante

Claude code con Sonnet 4.5 ha terminato l'intera implementazione di Stripe in 15 minuti

Claude Sonnet 4.5 è stato molto più veloce e decisamente migliore

Il toggle per il thinking ti consente di dedicare più capacità di calcolo a specifici blocchi di codice

Mantiene il contesto perfettamente anche quando sei 150.000 token dentro un progetto enorme

È il model con le migliori prestazioni di sempre quando controlla il tuo computer

Riduzione dei tassi di errore per la programmazione dal 9% a praticamente zero

Claude imagine potrebbe essere la funzionalità più bella... un'esperienza di creazione app in tempo reale

L'integrazione MCP gli consente di cercare strumenti senza consumare il tuo contesto di prompt

La latenza della visione è significativamente ridotta durante l'analisi di layout UI complessi

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude Sonnet 4.5

Consigli esperti per aiutarti a ottenere il massimo da Claude Sonnet 4.5 e raggiungere risultati migliori.

Abilita la ricerca strumenti MCP

Utilizza la ricerca strumenti del Model Context Protocol per ridurre l'utilizzo del contesto dell'85% e lasciare spazio ai file attivi.

Sfrutta i checkpoint agentici

Utilizza il comando /checkpoint nelle interfacce terminale per salvare i progressi prima di importanti refactoring per un rollback istantaneo.

Budgeting del contesto

Cancella la cronologia tra task non correlati per evitare la corruzione del contesto e mantenere un'elevata accuratezza logica.

Gerarchia del System Prompt

Definisci la persona del model e i vincoli rigorosi di output in un file di configurazione dedicato per una coerenza tra agent.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Domande frequenti su Claude Sonnet 4.5

Trova risposte alle domande comuni su Claude Sonnet 4.5