anthropic

Claude Sonnet 4.5

Claude 4.5 Sonnet di Anthropic offre prestazioni di coding leader a livello mondiale (77,2% su SWE-bench) e una context window da 200K, ottimizzata per il...

Coding AIAI agenticReasoning ibridoAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
Contesto
200Ktoken
Output max
64Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImageAudioVideo
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
83%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Sonnet 4.5 ha ottenuto 83% in questo benchmark.
HLE
34%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Sonnet 4.5 ha ottenuto 34% in questo benchmark.
MMLU
89%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Sonnet 4.5 ha ottenuto 89% in questo benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Sonnet 4.5 ha ottenuto 78% in questo benchmark.
SimpleQA
52%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Sonnet 4.5 ha ottenuto 52% in questo benchmark.
IFEval
88%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Sonnet 4.5 ha ottenuto 88% in questo benchmark.
AIME 2025
87%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Sonnet 4.5 ha ottenuto 87% in questo benchmark.
MATH
87%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Sonnet 4.5 ha ottenuto 87% in questo benchmark.
GSM8k
98%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Sonnet 4.5 ha ottenuto 98% in questo benchmark.
MGSM
92%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Sonnet 4.5 ha ottenuto 92% in questo benchmark.
MathVista
72%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Sonnet 4.5 ha ottenuto 72% in questo benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Sonnet 4.5 ha ottenuto 77% in questo benchmark.
HumanEval
94%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Sonnet 4.5 ha ottenuto 94% in questo benchmark.
LiveCodeBench
68%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Sonnet 4.5 ha ottenuto 68% in questo benchmark.
MMMU
78%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Sonnet 4.5 ha ottenuto 78% in questo benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Sonnet 4.5 ha ottenuto 55% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Sonnet 4.5 ha ottenuto 89% in questo benchmark.
DocVQA
92%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Sonnet 4.5 ha ottenuto 92% in questo benchmark.
Terminal-Bench
50%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Sonnet 4.5 ha ottenuto 50% in questo benchmark.
ARC-AGI
14%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Sonnet 4.5 ha ottenuto 14% in questo benchmark.

Prova Claude Sonnet 4.5 gratis

Chatta con Claude Sonnet 4.5 gratuitamente. Testa le sue capacita, fai domande ed esplora cosa puo fare questo modello AI.

Prompt
Risposta
Claude Sonnet 4.5

La tua risposta AI apparira qui

Informazioni su Claude Sonnet 4.5

Scopri le capacita di Claude Sonnet 4.5, le funzionalita e come puo aiutarti a ottenere risultati migliori.

**La Frontiera dell'Intelligenza agentic**

Claude Sonnet 4.5 rappresenta il salto più significativo di Anthropic nella frontier intelligence, ottimizzato specificamente per l'era degli agent AI autonomi. Rilasciato a fine 2025, è il primo vero model di reasoning ibrido del settore, che consente agli sviluppatori di passare dall'esecuzione ad alta velocità per i task di routine all'extended reasoning per le sfide logiche complesse. Ha superato notevolmente i precedenti benchmark nell'uso del computer e nell'orchestrazione di tool, diventando il motore preferito per gli agent basati su CLI e l'ingegneria del software multi-file.

**Precisione e Riduzione delle Allucinazioni**

Il model è costruito su un'architettura che privilegia la logica del "misura due volte, taglia una volta", riducendo significativamente la sicofania e le allucinazioni osservate nella serie 3.5. Con un massiccio limite di output di 64.000 tokens e una input window di 200.000 tokens, può ingerire interi repository generando file completi di applicazioni in un unico passaggio. Introduce inoltre checkpoint nativi per i workflow agentic, consentendo agli agent di tornare indietro e correggere autonomamente i propri errori.

**Eccellenza Multimodal e nel reasoning**

Oltre al coding, Sonnet 4.5 domina nell'analisi documentale multimodal e nella modellazione finanziaria complessa. La sua logica interna è addestrata per dare priorità al contesto architetturale, permettendogli di mappare codebase su larga scala meglio di qualsiasi predecessore. Che si tratti di elaborare note manoscritte o di implementare un'integrazione Stripe completa, Sonnet 4.5 mantiene un elevato livello di accuratezza fattuale e di rispetto delle istruzioni.

Claude Sonnet 4.5

Casi d'uso per Claude Sonnet 4.5

Scopri i diversi modi in cui puoi usare Claude Sonnet 4.5 per ottenere ottimi risultati.

Ingegneria del Software Autonoma

Usa Claude Sonnet 4.5 per navigare in codebase complessi, implementare feature su più file ed eseguire test in modo indipendente.

Agent per l'uso del computer

Distribuisci il model per controllare desktop e browser web per l'estrazione di dati, la navigazione in sistemi legacy o task amministrativi ripetitivi.

Ricerca agentic enterprise

Orchestra query di ricerca multi-step e sintetizza informazioni disparate da documentazione interna e dal web in tempo reale.

Modellazione Finanziaria Complessa

Sfrutta il suo punteggio AIME dell'87% per eseguire deduzioni logiche approfondite su report finanziari e dati di mercato.

Perfezionamento di contenuti tecnici

Converti requisiti di alto livello in PRD professionali, specifiche tecniche e codebase pronti per il copia-incolla.

Analisi documentale multimodal

Elabora migliaia di pagine di grafici, note manoscritte e diagrammi tecnici con capacità di vision state-of-the-art.

Punti di forza

Limitazioni

Potenza nel coding agentic: Attuale detentore del record mondiale su SWE-bench Verified con una percentuale di successo del 77,2% su issue reali di GitHub.
Limiti di utilizzo: Gli utenti professionali segnalano spesso di raggiungere rapidamente i limiti di utilizzo settimanali nel piano Pro da 20 $/mese.
Velocità incredibile: Opera a 40-60 tokens al secondo, rendendolo significativamente più veloce dei precedenti frontier models per l'uso interattivo.
Latency di ricerca: La navigazione web agentic (BrowseComp) rimane un punto debole rispetto a modelli di ricerca specializzati.
Flessibilità del reasoning ibrido: Il primo model a bilanciare efficacemente la modalità 'fast chat' con l'extended thinking per catene logiche complesse.
Lacune di conoscenza di nicchia: Difficoltà in task visivi altamente specializzati, come l'identificazione di specifici trick di skateboard (29% di accuratezza su SkateBench).
Finestra di output massiccia: Un limite di 64.000 tokens in output consente la generazione di intere feature multi-file in una singola chiamata API.
Costi agentic: L'esecuzione del model in modo autonomo in modalità CLI può consumare 50-100 $ in tokens per una singola sessione complessa di sviluppo app.

Avvio rapido API

anthropic/claude-sonnet-4.5

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Sonnet 4.5

Guarda cosa pensa la community di Claude Sonnet 4.5

"Claude Sonnet 4.5 è il nuovo re del coding AI... sembra davvero, davvero promettente"
James Montemagno
youtube
"Sonnet 4.5 sta facendo un ottimo lavoro... è stato molto più veloce e sensibilmente migliore"
Cole Medin
youtube
"Sono rimasto sbalordito da Sonnet 4.5... questo model progetta pagine assolutamente splendide"
Savage Reviews
youtube
"L'agent basato su CLI è uno 'sviluppatore che vive nel tuo terminale'... può leggere codebase ed eseguire test autonomamente"
DevUser_99
reddit
"Il prezzo rimane lo stesso della 3.5, ma la funzione 'Checkpoints' lo rende 10 volte più prezioso per i workflow professionali"
AgentArchitect
x
"Con il 77,2% su SWE-bench, questo è il primo model che sembra davvero un Senior Engineer"
HackerNewsReader
hackernews

Video su Claude Sonnet 4.5

Guarda tutorial, recensioni e discussioni su Claude Sonnet 4.5

Anthropic sostiene che questo sia il 'miglior code model al mondo' con miglioramenti sostanziali nel reasoning, nella matematica e nell'uso del computer.

Mentre GPT-5 potrebbe essere migliore per la pianificazione di alto livello, Claude 4.5 Sonnet è attualmente il model più 'piacevole' da usare per l'implementazione.

La velocità è semplicemente incredibile, rendendo il coding interattivo molto più fluido.

Gestisce modifiche su più file con un livello di precisione mai visto prima.

La riduzione delle allucinazioni lo rende un partner affidabile per il codice di produzione.

Claude Sonnet 4.5 è molto più veloce e sensibilmente migliore di GPT-5 Codex.

Ha completato l'intera implementazione di Stripe in 15 minuti... oltre due volte più veloce di Opus 4.1.

La capacità di seguire istruzioni complesse di tool-calling è il suo ingrediente segreto.

Vedo meno problemi di 'sicofania' in cui il model concorda semplicemente con le mie cattive idee.

Questo è il primo model di cui mi fiderei davvero per eseguire un agent basato su CLI senza supervisione.

Questa è una delle migliori landing page, se non LA migliore, che io abbia mai visto creare da un prompt.

È una forza della natura... sta progettando pagine assolutamente sbalorditive con un codice davvero, davvero pulito.

Le capacità di vision per l'interpretazione del design della UI sono state notevolmente potenziate.

Sembra che comprenda i requisiti estetici, non solo quelli tecnici.

Sonnet 4.5 è ufficialmente il nuovo benchmark per il front-end engineering creativo.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti
Guarda la demo

Consigli Pro

Consigli esperti per aiutarti a ottenere il massimo da questo modello e raggiungere risultati migliori.

Sfrutta CLAUDE.md

Usa un file CLAUDE.md nella root del tuo repository per fornire al model brevi riassunti e indicazioni; questo riduce lo spreco di tokens del 30%.

Toggle per il reasoning ibrido

Usa il parametro thinking nelle tue chiamate API solo per task ad alta intensità logica per risparmiare su latency e costi durante le operazioni di routine.

La cartella .claude/context

Crea un file .claude/context.md per memorizzare le decisioni architetturali; il model è addestrato specificamente per dare priorità a questo percorso per la mappatura del codebase.

Prompt Caching

Abilita il prompt caching per la documentazione statica o codebase di grandi dimensioni per risparmiare fino al 90% sui costi di input per le query ripetute.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Domande frequenti

Trova risposte alle domande comuni su questo modello