anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 offre performance d'avanguardia per coding e computer use con una massiccia context window da 1M di token a soli $3/1M di token.

Agentic AIMultimodalCodingComputer UseLong Context
anthropic logoanthropicClaude 417 Febbraio 2026
Contesto
1.0Mtoken
Output max
64Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImageAudioVideo
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
89.9%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Sonnet 4.6 ha ottenuto 89.9% in questo benchmark.
HLE
49%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Sonnet 4.6 ha ottenuto 49% in questo benchmark.
MMLU
89.3%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Sonnet 4.6 ha ottenuto 89.3% in questo benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Sonnet 4.6 ha ottenuto 79.2% in questo benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Sonnet 4.6 ha ottenuto 48.5% in questo benchmark.
IFEval
89.5%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Sonnet 4.6 ha ottenuto 89.5% in questo benchmark.
AIME 2025
83%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Sonnet 4.6 ha ottenuto 83% in questo benchmark.
MATH
85.3%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Sonnet 4.6 ha ottenuto 85.3% in questo benchmark.
GSM8k
96.4%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Sonnet 4.6 ha ottenuto 96.4% in questo benchmark.
MGSM
92.8%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Sonnet 4.6 ha ottenuto 92.8% in questo benchmark.
MathVista
68.7%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Sonnet 4.6 ha ottenuto 68.7% in questo benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Sonnet 4.6 ha ottenuto 79.6% in questo benchmark.
HumanEval
92.1%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Sonnet 4.6 ha ottenuto 92.1% in questo benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Sonnet 4.6 ha ottenuto 72.4% in questo benchmark.
MMMU
74.2%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Sonnet 4.6 ha ottenuto 74.2% in questo benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Sonnet 4.6 ha ottenuto 75.6% in questo benchmark.
ChartQA
88.1%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Sonnet 4.6 ha ottenuto 88.1% in questo benchmark.
DocVQA
93.4%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Sonnet 4.6 ha ottenuto 93.4% in questo benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Sonnet 4.6 ha ottenuto 59.1% in questo benchmark.
ARC-AGI
58.3%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Sonnet 4.6 ha ottenuto 58.3% in questo benchmark.

Informazioni su Claude Sonnet 4.6

Scopri le capacita di Claude Sonnet 4.6, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Intelligenza Agentic ad alte performance

Claude Sonnet 4.6 è il model più versatile di Anthropic, progettato per fungere da motore principale per workflow aziendali complessi e agenti autonomi. Rilasciato il 17 febbraio 2026, introduce funzionalità di computer use a livello umano e una context window da 1 milione di token. L'architettura del model bilancia la velocità dei sistemi di fascia media con la profondità di reasoning tipica della classe Opus, rendendolo una scelta sostenibile per ambienti di produzione ad alto volume.

Adaptive Thinking e Multimodalità

Al centro della sua architettura tecnica, Sonnet 4.6 utilizza un meccanismo di Adaptive Thinking. Ciò consente agli sviluppatori di scalare lo sforzo di reasoning interno in base ai requisiti specifici di un'attività, ottimizzando sia per una latenza inferiore al secondo sia per una profonda verifica logica. Il model è nativamente multimodal e offre performance allo stato dell'arte nell'elaborazione di testo, immagini ad alta risoluzione e file audio. Eccelle nell'interpretazione di documentazione tecnica densa e dati visivi complessi, come progetti architettonici o grafici finanziari.

Lo standard di settore per il coding

Con un record di 79,6% su SWE-bench Verified, Sonnet 4.6 è diventato la scelta predefinita per l'automazione dell'ingegneria del software. La sua capacità di ragionare su vasti codebase all'interno della context window da 1M di token gli consente di risolvere bug su più file e pianificare refactoring architetturali con un intervento umano minimo. Offrendo un'intelligenza vicina al livello di Opus a $3 per milione di token di input, rimuove le barriere finanziarie precedentemente associate al deployment di sistemi AI realmente autonomi.

Claude Sonnet 4.6

Casi d'uso per Claude Sonnet 4.6

Scopri i diversi modi in cui puoi usare Claude Sonnet 4.6 per ottenere ottimi risultati.

Software Engineering Autonomo

Risoluzione di complessi problemi GitHub su più file ed esecuzione di refactoring di interi repository usando la precisione del 79,6% su SWE-bench.

Computer Use a livello umano

Navigazione diretta di software desktop e interfacce web per completare attività amministrative multi-step senza integrazioni API personalizzate.

Analisi documentale su larga scala

Revisione di migliaia di pagine di contratti legali o documenti di ricerca simultaneamente all'interno della context window da 1 milione di token.

Intelligenza Finanziaria e Previsioni

Elaborazione di earnings call e report trimestrali per identificare sottili anomalie di mercato usando il reasoning adattivo ad alto sforzo.

Supporto tecnico multimodal

Interpretazione di diagrammi tecnici complessi, foto di circuiti e registrazioni audio per fornire passaggi di troubleshooting precisi.

Strategia di Business Agentic

Pianificazione ed esecuzione di operazioni a lungo termine sfruttando i punteggi top-tier sui benchmark basati su logica e strategia.

Punti di forza

Limitazioni

Accuratezza nel coding d'élite: Definisce lo standard del settore con il 79,6% su SWE-bench Verified, superando tutti gli altri model di fascia media e molti flagship model.
Mancanza di input video nativo: Richiede l'estrazione manuale dei frame per l'elaborazione visiva di file video, aumentando la complessità dei workflow multimediali.
Capacità di contesto impareggiabile: La window da 1 milione di token permette l'ingestione di intere librerie tecniche o basi di codice massicce senza degrado delle performance.
Maggiore latency di reasoning: L'utilizzo del reasoning adattivo ad alto sforzo aumenta significativamente il time-to-first-token rispetto all'inference standard.
Computer Use autonomo: Raggiunge un punteggio del 72,5% su OSWorld, permettendo al model di navigare interfacce GUI complesse e strumenti software come operatore virtuale.
Costi elevati di output reasoning: Sebbene il pricing dell'input sia competitivo, i task di reasoning a massimo sforzo possono consumare grandi quantità di token di output, aumentando i costi.
Rapporto qualità-prezzo ottimizzato: Offre livelli di intelligenza vicini a Opus a 1/5 del costo, rendendolo la scelta più economica per il deployment di agenti su larga scala.
Rumore nel recupero del contesto: Al limite di 1M di token, il model può occasionalmente soffrire di una minore concentrazione se il contesto è riempito con dati irrilevanti.

Avvio rapido API

anthropic/claude-sonnet-4-6

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analizza questo repository per identificare colli di bottiglia architetturali." }
  ],
});

console.log(response.content[0].text);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Sonnet 4.6

Guarda cosa pensa la community di Claude Sonnet 4.6

Il contesto è rumore. Le window più grandi sono una trappola. Dai agli agenti solo il segnale stretto e curato di cui hanno bisogno.
Logical-Storm-1180
reddit
Questo è Claude Sonnet 4.6: il nostro Sonnet più capace finora. È un upgrade completo in termini di coding, computer use e agent planning.
Claude
twitter
Il rapporto prestazioni-costo di Claude Sonnet 4.6 è straordinario, è difficile sottovalutare quanto velocemente si stiano evolvendo questi model.
Replit
youtube
Sonnet 4.6 è ora live in Claude Code. È più economico di Opus 4.6 e si avvicina all'intelligenza di livello Opus.
Boris Cherny
twitter
Claude 4.6 è il nuovo leader nelle performance agentic, leggermente davanti a Opus 4.6 nei compiti di knowledge work del mondo reale.
Artificial Analysis
twitter
Il fatto che questo model possa navigare un'interfaccia computer con un'accuratezza del 72% elimina praticamente il bisogno della maggior parte delle API su misura.
DevOpsGuru
hackernews

Video su Claude Sonnet 4.6

Guarda tutorial, recensioni e discussioni su Claude Sonnet 4.6

Sonnet 4.6 è arrivato e potrebbe sostituire Opus nel 90% del lavoro quotidiano.

Ma la parte migliore è che è il 40% più economico rispetto a Opus 4.6.

I risultati su SWE-bench sono incredibili per un model di fascia media.

Puoi effettivamente dargli in pasto un'intera codebase e non perde il filo.

Lo sforzo di adaptive thinking ti permette di bilanciare velocità e logica profonda.

I primi utenti riportano prestazioni quasi umane nella manipolazione di fogli di calcolo complessi.

Questo model è circa due volte più veloce rispetto a Opus.

La context window da 1 milione di token è attualmente in beta ma funziona molto bene.

Naviga interfacce software senza bisogno di integrazioni API specifiche.

La capacità di coding su Python e JavaScript è praticamente al soffitto.

Anthropic afferma che la nuova context window è abbastanza grande da contenere intere codebase e ragionare efficacemente su tutto quel contesto.

Opus 4.6 è l'opzione 'bomba atomica'... ma ora abbiamo finalmente un bisturi, il che è una notizia fantastica.

Il computer use è la caratteristica distintiva qui, muove effettivamente il mouse e digita.

Gli analisti finanziari adoreranno la profondità di reasoning per la revisione dei documenti.

È la prima volta che un model 'Sonnet' sembra il migliore della categoria.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude Sonnet 4.6

Consigli esperti per aiutarti a ottenere il massimo da Claude Sonnet 4.6 e raggiungere risultati migliori.

Ottimizzare l'Adaptive Thinking

Usa la modalità di reasoning 'adaptive' per risparmiare sui costi delle query semplici, riservando lo sforzo 'max' per compiti matematici e logici.

Implementare il Context Compaction

Abilita il prompt caching e le funzioni di compaction per gestire la window da 1M di token in modo efficiente ed evitare costi ridondanti.

Ancoraggio comportamentale strutturato

Utilizza un file markdown di progetto centrale per mantenere una source of truth persistente per le decisioni architetturali del model.

Estrazione frame video

Poiché il video nativo non è supportato, estrai i fotogrammi chiave a 1fps per un'analisi visiva accurata dei contenuti video.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Domande frequenti su Claude Sonnet 4.6

Trova risposte alle domande comuni su Claude Sonnet 4.6