anthropic

Claude Opus 4.6

Claude Opus 4.6 è il flagship model di Anthropic con un context window da 1M di token, Adaptive Thinking e prestazioni di coding e reasoning di classe mondiale.

ReasoningCodingMultimodalAgentic AIEnterprise
anthropic logoanthropicClaude5 febbraio 2026
Contesto
200Ktoken
Output max
128Ktoken
Prezzo input
$5.00/ 1M
Prezzo output
$25.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
91%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Opus 4.6 ha ottenuto 91% in questo benchmark.
HLE
53%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Opus 4.6 ha ottenuto 53% in questo benchmark.
MMLU
91%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Opus 4.6 ha ottenuto 91% in questo benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Opus 4.6 ha ottenuto 82% in questo benchmark.
SimpleQA
72%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Opus 4.6 ha ottenuto 72% in questo benchmark.
IFEval
94%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Opus 4.6 ha ottenuto 94% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Opus 4.6 ha ottenuto 100% in questo benchmark.
MATH
93%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Opus 4.6 ha ottenuto 93% in questo benchmark.
GSM8k
99%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Opus 4.6 ha ottenuto 99% in questo benchmark.
MGSM
96%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Opus 4.6 ha ottenuto 96% in questo benchmark.
MathVista
75%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Opus 4.6 ha ottenuto 75% in questo benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Opus 4.6 ha ottenuto 81% in questo benchmark.
HumanEval
95%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Opus 4.6 ha ottenuto 95% in questo benchmark.
LiveCodeBench
76%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Opus 4.6 ha ottenuto 76% in questo benchmark.
MMMU
77%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Opus 4.6 ha ottenuto 77% in questo benchmark.
MMMU Pro
77%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Opus 4.6 ha ottenuto 77% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Opus 4.6 ha ottenuto 89% in questo benchmark.
DocVQA
93%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Opus 4.6 ha ottenuto 93% in questo benchmark.
Terminal-Bench
65%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Opus 4.6 ha ottenuto 65% in questo benchmark.
ARC-AGI
69%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Opus 4.6 ha ottenuto 69% in questo benchmark.

Informazioni su Claude Opus 4.6

Scopri le capacita di Claude Opus 4.6, le funzionalita e come puo aiutarti a ottenere risultati migliori.

La Nuova Frontiera dell'Intelligenza

Claude Opus 4.6 rappresenta un salto significativo nelle capacità dei large language model, progettato specificamente per i task cognitivi più impegnativi. Rilasciato il 5 febbraio 2026, introduce l'Adaptive Thinking, una funzionalità rivoluzionaria che consente al model di scalare dinamicamente il proprio impegno di reasoning in base alla complessità della query. Ciò garantisce che, mentre le query semplici rimangono efficienti, i puzzle logici complessi e i task ingegneristici critici ricevano l'elaborazione profonda richiesta.

Costruito per l'Era Agentic

Progettato per andare oltre la semplice chat, Opus 4.6 è un concentrato di potenza per i workflow agentic autonomi. Con punteggi leader del settore su Terminal-Bench 2.0 e SWE-Bench Verified, può navigare in ambienti informatici, gestire il debugging software multi-fase e orchestrare progetti complessi con un intervento umano minimo. Il suo context window ampliato a 1 milione di token (disponibile in beta) gli consente di mantenere simultaneamente in memoria interi ecosistemi tecnici.

Casi d'uso per Claude Opus 4.6

Scopri i diversi modi in cui puoi usare Claude Opus 4.6 per ottenere ottimi risultati.

Workflow di agent autonomi

Orchestrazione di task agentic multi-fase in ambienti desktop visuali utilizzando un reasoning di livello OSWorld.

Full-Stack Vibe Coding

Generazione di intere applicazioni funzionali come giochi 3D o dashboard complesse partendo da un singolo prompt di alto livello.

Gestione di repository su larga scala

Analisi e refactoring di massicce codebase utilizzando il context window da 1M di token e il Model Context Protocol.

Ricerca scientifica profonda

Sintesi di informazioni a livello di dottorato in biologia, chimica e fisica con prestazioni elite su GPQA Diamond.

Analisi finanziaria esperta

Esecuzione di modellazione finanziaria agentic e sintesi di dati multi-fonte per processi decisionali di livello enterprise.

Pianificazione a lungo termine

Gestione di progetti complessi della durata di un mese o simulazioni che richiedono un uso coerente dei tool e il rispetto dei task.

Punti di forza

Limitazioni

Reasoning agentic d'élite: Prestazioni state-of-the-art su Terminal-Bench 2.0 (65%) e OSWorld per gli agent autonomi.
Latenza API più elevata: Quando si utilizza il massimo impegno di reasoning o context window massicci, il model può essere significativamente più lento rispetto alle varianti Sonnet.
Capacità di context massiccia: Il context window da 1M di token (beta) consente l'elaborazione di intere librerie o grandi repository software senza perdita di focus.
Modello di pricing premium: Con $5/$25 per milione di token, rimane un'opzione ad alto costo per gli sviluppatori rispetto ai model flash o small ottimizzati.
Adaptive Thinking dinamico: La capacità di scalare l'impegno nel reasoning garantisce prestazioni ottimali sia per query rapide che per problemi matematici profondi.
Complessità di integrazione: Funzionalità come l'Adaptive Thinking richiedono implementazioni API aggiornate e una conoscenza più approfondita dei toolset specifici di Anthropic.
Padronanza tecnica superiore: Eccezionali capacità in matematica e scienze, con un punteggio perfetto del 100% su AIME 2025 e del 91% su GPQA Diamond.
Output multimodale limitato: Sebbene l'input di vision sia di classe mondiale, il model attualmente manca di capacità native di generazione audio e video in tempo reale.

Avvio rapido API

anthropic/claude-opus-4-6

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

const message = await anthropic.messages.create({
  model: "claude-4-6-opus-20260205",
  max_tokens: 128000,
  messages: [
    { role: "user", content: "Create a fully functional 3D physics simulator using Three.js." }
  ],
});

console.log(message.content[0].text);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Opus 4.6

Guarda cosa pensa la community di Claude Opus 4.6

"Claude Opus 4.6 è incredibilmente potente. Pensate a Deep Research + reasoning avanzato + serie capacità di coding."
Awa K. Penn
x
"Supera il reasoning xhigh di GPT-5.2... un enorme salto rispetto al punteggio del 4,6% di Opus 4.5!"
Minyang Tian
x
"Questo model è fortissimo nel coding al momento... non si perde nei dettagli."
Dinmukhanbet Aizharykov
x
"Lo uso da una settimana e il mantenimento del contesto è spaventosamente buono."
CodeMaster99
reddit
"L'adaptive thinking è una svolta per la gestione dei costi su task complessi."
AI_Strategy_Expert
hackernews
"Opus 4.6 è fondamentalmente uno stagista AGI che ascolta davvero i tuoi feedback."
TechVlogger2026
youtube

Video su Claude Opus 4.6

Guarda tutorial, recensioni e discussioni su Claude Opus 4.6

Questo model ha superato ogni altro frontier system in circolazione... è su un altro livello di potenza.

Pensate a un'enorme libreria di documenti: il software ricorda effettivamente la nota a piè di pagina a pagina 400.

Il model decide effettivamente quanto deve lavorare in base alla difficoltà... cambiando marcia.

È la prima volta che vedo un'IA capire davvero il 'vibe' di un requisito ingegneristico complesso.

Questo è chiaramente costruito per gli sviluppatori enterprise che hanno bisogno di accuratezza zero-shot rispetto alla velocità.

Claude ha un nuovo flagship model con Opus 4.6... Spoiler: è semplicemente migliore di qualsiasi cosa io abbia visto finora.

Questo model è molto più autonomo di qualsiasi cosa precedente... il potere agentic è reale.

La mia sensazione personale è che questo sarebbe potuto essere Opus 5. Ecco quanto mi è piaciuto come si comporta.

Sembra che abbiano finalmente risolto il problema del 'drifting' nelle conversazioni lunghe.

Il selettore dell'adaptive thinking è la funzione più sottovalutata del 2026.

È Opus 4.6, per il quale personalmente sono entusiasta perché uso sempre i model Opus.

Mi ha dato tutti questi ottimi controlli... Questo è di gran lunga il miglior risultato per questo test, con un margine enorme.

Un singolo prompt... ha creato un gioco completamente funzionante che vedrei bene persino pubblicato su Steam.

Il modo in cui richiama i tool è molto più affidabile ora, non ha allucinazioni sugli argomenti.

Per i progetti di coding complessi, ha ufficialmente sostituito del tutto il mio setup precedente.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude Opus 4.6

Consigli esperti per aiutarti a ottenere il massimo da Claude Opus 4.6 e raggiungere risultati migliori.

Sfrutta l'Adaptive Thinking

Usa il parametro di thinking per passare tra diversi livelli di impegno per bilanciare costo e profondità cognitiva per i vari task.

Context Compaction

Per i task agentic a lunga durata, abilita la funzione beta di context compaction per mantenere le prestazioni senza superare i limiti di token.

Utilizza i tool MCP

Associa Opus 4.6 al Model Context Protocol per dare al model accesso sicuro a filesystem locali e database.

App complesse One-Shot

Fornisci un system prompt completo; Opus 4.6 è in grado di generare file da oltre 1.000 righe con precisione in un colpo solo.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M

Domande frequenti su Claude Opus 4.6

Trova risposte alle domande comuni su Claude Opus 4.6