anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 offre prestazioni frontier model per il coding e il computer use con una massiccia context window da 1M di tokens a soli $3 per 1M di tokens.

Agentic AIMultimodalCodingComputer UseLong Context
anthropic logoanthropicClaude17 febbraio 2026
Contesto
1.0Mtoken
Output max
64Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImageAudioVideo
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
89.9%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Sonnet 4.6 ha ottenuto 89.9% in questo benchmark.
HLE
49%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Sonnet 4.6 ha ottenuto 49% in questo benchmark.
MMLU
89.3%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Sonnet 4.6 ha ottenuto 89.3% in questo benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Sonnet 4.6 ha ottenuto 79.2% in questo benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Sonnet 4.6 ha ottenuto 48.5% in questo benchmark.
IFEval
89.5%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Sonnet 4.6 ha ottenuto 89.5% in questo benchmark.
AIME 2025
83%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Sonnet 4.6 ha ottenuto 83% in questo benchmark.
MATH
85.3%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Sonnet 4.6 ha ottenuto 85.3% in questo benchmark.
GSM8k
96.4%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Sonnet 4.6 ha ottenuto 96.4% in questo benchmark.
MGSM
92.8%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Sonnet 4.6 ha ottenuto 92.8% in questo benchmark.
MathVista
68.7%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Sonnet 4.6 ha ottenuto 68.7% in questo benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Sonnet 4.6 ha ottenuto 79.6% in questo benchmark.
HumanEval
92.1%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Sonnet 4.6 ha ottenuto 92.1% in questo benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Sonnet 4.6 ha ottenuto 72.4% in questo benchmark.
MMMU
74.2%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Sonnet 4.6 ha ottenuto 74.2% in questo benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Sonnet 4.6 ha ottenuto 75.6% in questo benchmark.
ChartQA
88.1%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Sonnet 4.6 ha ottenuto 88.1% in questo benchmark.
DocVQA
93.4%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Sonnet 4.6 ha ottenuto 93.4% in questo benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Sonnet 4.6 ha ottenuto 59.1% in questo benchmark.
ARC-AGI
58.3%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Sonnet 4.6 ha ottenuto 58.3% in questo benchmark.

Informazioni su Claude Sonnet 4.6

Scopri le capacita di Claude Sonnet 4.6, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Un salto generazionale nell'intelligenza

Claude Sonnet 4.6 è il model di Anthropic più capace e versatile fino ad oggi, progettato per fungere da cavallo di battaglia ad alte prestazioni per workflow complessi di aziende e sviluppatori. Rilasciato il 17 febbraio 2026, rappresenta un importante salto generazionale rispetto alla serie 4.5, introducendo funzionalità di computer use a livello umano e una massiccia context window da 1 milione di tokens in beta. Il model è ottimizzato per task agentic, il che significa che non si limita a elaborare testo, ma può pianificare ed eseguire autonomamente operazioni multi-fase in vari ambienti software.

Sofisticazione tecnica e multimodalità

Tecnicamente, Sonnet 4.6 colma il divario tra la velocità dei model di fascia media e il reasoning profondo della classe Opus. Presenta l'Adaptive Thinking, che gli consente di scalare lo sforzo di reasoning interno in base alla complessità del task. Questo model è diventato il nuovo standard predefinito per gli utenti Claude Free e Pro, offrendo un'intelligenza di livello flagship nel coding, nell'analisi finanziaria e nella comprensione dei documenti. È un model nativo multimodal a tutti gli effetti, che supporta input di testo, immagini, audio e video per elaborare una varietà di task multimediali con un'accuratezza state-of-the-art.

Il nuovo standard di settore per gli agenti

Con il suo rapporto prestazioni-prezzo d'élite, Sonnet 4.6 si posiziona come il motore principale per gli agenti AI. Raggiunge punteggi leader del settore su SWE-bench Verified (79,6%) e OSWorld-Verified (72,5%), dimostrando la sua superiore capacità di navigare in problemi reali di ingegneria del software e task complessi del sistema operativo. Fornendo un'intelligenza vicina a Opus a una frazione del costo, consente agli sviluppatori di costruire sistemi autonomi che in precedenza erano proibitivi dal punto di vista computazionale o finanziario.

Claude Sonnet 4.6

Casi d'uso per Claude Sonnet 4.6

Scopri i diversi modi in cui puoi usare Claude Sonnet 4.6 per ottenere ottimi risultati.

Ingegneria del software autonoma

Utilizzo di Claude Code per rifattorizzare interi repository e implementare funzionalità complesse con un contesto esteso a tutto il repository.

Computer Use a livello umano

Automazione di software legacy e workflow web vedendo lo schermo e interagendo tramite mouse e tastiera virtuali.

Comprensione di documenti finanziari

Analisi di migliaia di pagine di documenti e tabelle per ragionare su strategie di investimento o rischi complessi.

Simulazione aziendale in tempo reale

Esecuzione di simulazioni agentic in cui il model gestisce un'attività virtuale e ottimizza la redditività.

Scrittura tecnica multilingue

Generazione di documentazione tecnica in decine di lingue mantenendo una perfetta conformità alle specifiche architetturali.

Generazione di UI/UX frontend

Creazione di interfacce dashboard moderne e curate con focus su tipografia, teoria del colore e layout responsive.

Punti di forza

Limitazioni

Coding leader del settore: Raggiunge un punteggio state-of-the-art del 79,6% su SWE-bench Verified, superando i concorrenti nella risoluzione di problemi reali su GitHub.
Latenza nella modalità Thinking: Budget elevati di thinking tokens aumentano il time-to-first-token, rendendolo meno ideale per chat istantanee in tempo reale.
Rapporto prestazioni-prezzo d'élite: Offre livelli di intelligenza vicini a Opus a un costo 5 volte inferiore, rendendolo la scelta più economica per l'automazione su larga scala.
Attrito dovuto ai rate limit: Gli utenti Free e Pro incontrano limiti di messaggi aggressivi durante sessioni intense, rendendo necessario il passaggio alla API.
Navigazione del computer a livello umano: Ottiene il 72,5% su OSWorld-Verified, mostrando un enorme miglioramento nella navigazione di software complessi senza API.
Decadimento del contesto sopra i 150k: Nonostante la context window da 1M, il model può ancora occasionalmente perdere dettagli specifici a metà di prompt molto grandi.
Potenza di reasoning adattiva: Include una modalità Thinking scalabile che consente agli sviluppatori di aumentare lo sforzo di reasoning per problemi logici difficili.
Vulnerabilità alla prompt injection: La funzionalità Computer Use comporta rischi in cui siti web malevoli potrebbero tentare di dirottare la sessione del browser virtuale del model.

Avvio rapido API

anthropic/claude-sonnet-4-6

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Sonnet 4.6

Guarda cosa pensa la community di Claude Sonnet 4.6

Claude Sonnet 4.6 ha raggiunto il 94% nel nostro benchmark assicurativo, rendendolo il model più performante che abbiamo testato per il computer use.
Swami Sivasubramanian
twitter
L'entusiasmo è giustificato, questo è senza dubbio il migliore (e più divertente) LLM che abbia mai usato! Una spanna sopra quello che ho visto finora.
WolframRavenwolf
reddit
Claude Sonnet 4.6 è esilarante, non solo 'divertente a tratti'. Fondamentalmente caloroso, onesto e prosociale.
Anton P.
twitter
Sonnet 4.6 è molto meglio di Cline per i task di coding. Non sto nemmeno più aprendo i file manualmente.
semibaron
hackernews
La context window da 1M è una svolta per la migrazione della codebase. Ho appena caricato l'intero stack legacy.
DevOpsDan
reddit
Gestisce fogli di calcolo complessi e moduli web con una precisione quasi inquietante. La beta di Computer Use è finalmente pronta.
AI_Insights_Daily
youtube

Video su Claude Sonnet 4.6

Guarda tutorial, recensioni e discussioni su Claude Sonnet 4.6

Sonnet 4.6 ha ottenuto un punteggio più alto nel valore GDP, che misura task significativi nel mondo reale.

Sta diventando sempre più difficile persino sapere se questi modelli siano capaci di attività CBRN.

Il rapporto velocità/intelligenza qui è essenzialmente impareggiabile da qualsiasi altro model sul mercato.

Anthropic si sta chiaramente concentrando sul lato agentic con questo rilascio.

La struttura dei costi lo rende il nuovo standard predefinito per qualsiasi sviluppatore API ad alto volume.

Questo model è circa due volte più veloce rispetto al model Opus del mese scorso.

In conclusione, ragazzi, questo model è il miglior affare per il coding aziendale.

Le capacità di visione per interpretare diagrammi architetturali complessi sono notevolmente migliorate.

Sono stato in grado di fornirgli 50 file e ha rifattorizzato perfettamente l'intera logica di routing.

Sembra molto più umano nel suo stile di comunicazione rispetto a GPT-4o.

In realtà sta battendo Opus 4.6 in alcune aree, pur avendo un prezzo inferiore del 40%.

Man mano che riempiamo la context window, una volta raggiunti i 150.000 tokens, l'efficacia tende a calare.

La funzione di reasoning adattivo consente fondamentalmente di passare dalla velocità alla logica profonda.

Questa release sembra il primo vero model 'agent-first' di Anthropic.

Lo userei per tutto, tranne forse per la scrittura creativa di livello assoluto.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude Sonnet 4.6

Consigli esperti per aiutarti a ottenere il massimo da Claude Sonnet 4.6 e raggiungere risultati migliori.

Sfrutta la Context Compaction

Abilita la funzionalità di Compaction nella API per riassumere automaticamente la cronologia delle conversazioni più vecchie nelle sessioni lunghe.

Usa i Thinking Tokens in modo strategico

Per la matematica o la logica complessa, imposta un budget più elevato per i thinking tokens per consentire al model di esplorare più percorsi di reasoning.

Prompt per la conformità alle specifiche (SPEC)

Chiedi esplicitamente al model di seguire le moderne best practice architetturali, poiché tende naturalmente a utilizzare strumenti aggiornati.

Utilizza gli Artifacts per la UI

Incoraggia il model a usare gli Artifacts della UI per separare le generazioni di codice dal thread della chat per un'iterazione in tempo reale.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Domande frequenti su Claude Sonnet 4.6

Trova risposte alle domande comuni su Claude Sonnet 4.6