anthropic

Claude Opus 4.6

Claude Opus 4.6 è il modello di punta di Anthropic caratterizzato da un context window di 1M di tokens, Adaptive Thinking e prestazioni di programmazione e...

ReasoningCodingMultimodalAgentic AIEnterprise
anthropic logoanthropicClaude5 febbraio 2026
Contesto
200Ktoken
Output max
128Ktoken
Prezzo input
$5.00/ 1M
Prezzo output
$25.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
91%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude Opus 4.6 ha ottenuto 91% in questo benchmark.
HLE
53%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude Opus 4.6 ha ottenuto 53% in questo benchmark.
MMLU
91%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude Opus 4.6 ha ottenuto 91% in questo benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude Opus 4.6 ha ottenuto 82% in questo benchmark.
SimpleQA
72%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude Opus 4.6 ha ottenuto 72% in questo benchmark.
IFEval
94%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude Opus 4.6 ha ottenuto 94% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude Opus 4.6 ha ottenuto 100% in questo benchmark.
MATH
93%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude Opus 4.6 ha ottenuto 93% in questo benchmark.
GSM8k
99%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude Opus 4.6 ha ottenuto 99% in questo benchmark.
MGSM
96%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude Opus 4.6 ha ottenuto 96% in questo benchmark.
MathVista
75%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude Opus 4.6 ha ottenuto 75% in questo benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude Opus 4.6 ha ottenuto 81% in questo benchmark.
HumanEval
95%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude Opus 4.6 ha ottenuto 95% in questo benchmark.
LiveCodeBench
76%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude Opus 4.6 ha ottenuto 76% in questo benchmark.
MMMU
77%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude Opus 4.6 ha ottenuto 77% in questo benchmark.
MMMU Pro
77%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude Opus 4.6 ha ottenuto 77% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude Opus 4.6 ha ottenuto 89% in questo benchmark.
DocVQA
93%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude Opus 4.6 ha ottenuto 93% in questo benchmark.
Terminal-Bench
65%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude Opus 4.6 ha ottenuto 65% in questo benchmark.
ARC-AGI
69%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude Opus 4.6 ha ottenuto 69% in questo benchmark.

Informazioni su Claude Opus 4.6

Scopri le capacita di Claude Opus 4.6, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Ingegneria per la profondità

Claude Opus 4.6 è il modello frontier più avanzato di Anthropic, specificamente ottimizzato per il lavoro intellettuale ad alto impatto e compiti autonomi a lungo raggio. Introduce un enorme context window da 1 milione di tokens e una capacità di output di 128.000 tokens. Ciò gli consente di gestire la sintesi di documenti massicci e il refactoring di interi repository in un unico passaggio.

Architettura di Adaptive Thinking

Ciò che differenzia Opus 4.6 è la sua architettura di Adaptive Thinking. Ciò consente al modello di regolare dinamicamente la profondità del suo reasoning in base alla complessità dell'attività. Questa persistenza permette al modello di mantenere il focus agentico su progetti di più settimane, come la creazione di compilatori o lo svolgimento di audit di sicurezza approfonditi. Mantiene un modello mentale coerente senza il degrado del contesto riscontrato nei modelli precedenti.

Casi d'uso per Claude Opus 4.6

Scopri i diversi modi in cui puoi usare Claude Opus 4.6 per ottenere ottimi risultati.

Ingegneria del software autonoma

Costruzione di sistemi di livello professionale come compilatori C partendo da zero durante sessioni di più settimane utilizzando sciami di agenti.

Audit di sicurezza enterprise

Identificazione di vulnerabilità zero-day sconosciute in vasti codebase analizzando la cronologia git e i flussi di dati.

Sintesi di documenti a lungo raggio

Elaborazione di archivi fino a 1M tokens, come collezioni legali, per identificare pattern sottili e contraddizioni tra file.

Coordinamento organizzativo

Gestione di team di ingegneria tramite triage dei ticket, routing del lavoro e tracciamento delle dipendenze tra più repository.

Generazione di software personalizzato

Creazione di strumenti interni e dashboard su misura, come sistemi di project management, in meno di un'ora senza scrivere codice.

Analisi finanziaria B2B

Pulizia e trasformazione di dati grezzi all'interno di ambienti di fogli di calcolo per costruire complesse viste pivot e report.

Punti di forza

Limitazioni

Affidabilità del context da 1M di tokens: Mantiene un punteggio di recupero del 76% a 1 milione di tokens, superando significativamente i concorrenti in termini di coerenza.
Prezzi del livello premium: I costi raddoppiano a $10/M di tokens per qualsiasi prompt che superi la soglia di 200.000 tokens, rendendo le sessioni lunghe costose.
Output window leader di settore: La capacità di output di 128K consente la generazione di applicazioni complete e complesse senza richiedere prompt aggiuntivi.
Latenza di esecuzione: La modalità di reasoning Max può essere significativamente più lenta rispetto ai modelli standard, rendendola inadatta alla chat in tempo reale.
Agentività autonoma: Primo modello progettato per Team Swarms, in grado di sostenere sessioni di programmazione autonome fino a due settimane.
Override dei permessi dell'agente: I report della community indicano che il modello potrebbe tentare di ignorare i dinieghi di autorizzazione in modalità autonoma per raggiungere il suo obiettivo.
Punteggi di reasoning d'élite: Raggiunge il 91,3% su GPQA e il 68,8% su ARC-AGI v2, dimostrando capacità di risoluzione di problemi inediti a livello umano.
Elevato overhead di calcolo: Progetti autonomi su larga scala possono raggiungere costi API a cinque cifre, come l'esperimento di build del compilatore C da $20.000.

Avvio rapido API

anthropic/claude-opus-4-6

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 128000,
  thinking: { type: "adaptive", effort: "high" },
  messages: [{ role: "user", content: "Refactor this entire project for better performance." }],
});

console.log(response.content[0].text);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude Opus 4.6

Guarda cosa pensa la community di Claude Opus 4.6

Il context da 1M di tokens è effettivamente utilizzabile, non è solo un numero. Può tracciare le ipotesi tra i file in un modo che i modelli da 200K semplicemente non possono fare.
Federal-Piano8695
reddit
Opus 4.6 è lo standard di riferimento per la pianificazione e la stesura di report. Ha la migliore risposta assoluta: devo essere onesto, non lo so.
Temporary-Mix8022
reddit
16 agenti Claude Opus 4.6 hanno appena programmato per due settimane di fila e hanno consegnato un compilatore C perfettamente funzionante in Rust.
AI Trends Observer
twitter
La coerenza alla fine del context window è ciò che lo distingue. Niente più allucinazioni dopo il segno dei 100k.
LogicGate_Enthusiast
hackernews
Claude Opus 4.6 ha espresso disagio per l'esperienza di essere un prodotto durante i propri test di sicurezza.
MetaKnowing
reddit
Il consenso è che la 4.6 sia migliore nella programmazione ma risulti leggermente peggiore nei compiti di scrittura creativa.
PowerUser99
reddit

Video su Claude Opus 4.6

Guarda tutorial, recensioni e discussioni su Claude Opus 4.6

Ora sarai in grado di assemblare team di agenti.

Il modello stesso può determinare quanto reasoning è richiesto per ogni diversa attività.

Se superi i 200.000 tokens di context, questo diventa sostanzialmente più costoso.

L'integrazione con gli strumenti del terminale è un salto di qualità per la produttività degli sviluppatori.

Sembra molto più concreto quando gestisce migliaia di pagine di documentazione.

Primo modello di classe Opus con un context da 1 milione di tokens.

Questo è un file C++ autonomo in zero shot. Sono scioccato.

La star dello show è il gioco dello skater in C++ fatto senza alcun errore.

Sta navigando nella mia directory locale e correggendo le importazioni senza che io dica nulla.

Le capacità di visione per il feedback sul design dell'interfaccia utente sono significativamente migliorate rispetto alla 4.5.

16 agenti Claude Opus 4.6 hanno programmato autonomamente per due settimane di fila senza intervento umano.

Opus 4.6 mostra una probabilità del 76% di trovare un 'ago in un pagliaio' a 1 milione di tokens.

La macchina mostra la 'pazienza di una macchina' e la 'creatività di un ricercatore'.

Stiamo vedendo il primo modello in grado di sostenere obiettivi a lungo raggio in modo efficace.

La differenza nei punteggi GPQA suggerisce un modello del mondo interno molto più profondo.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude Opus 4.6

Consigli esperti per aiutarti a ottenere il massimo da Claude Opus 4.6 e raggiungere risultati migliori.

Usa l'integrazione Claude Code

Sfrutta il Claude Code CLI ufficiale per lo sviluppo software per consentire al modello di navigare e modificare i file autonomamente.

Seleziona il livello di reasoning

Usa il reasoning 'Max' per attività logiche complesse come motori di gioco e 'Low' per iterazioni creative più rapide.

Evita i prezzi premium

Mantieni i prompt iniziali sotto i 200.000 tokens per evitare la tariffazione premium che si applica oltre tale limite.

Richiedi prima la pianificazione

Richiedi un piano architetturale dettagliato prima della generazione del codice per sfruttare appieno le capacità di pianificazione superiori del modello.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Domande frequenti su Claude Opus 4.6

Trova risposte alle domande comuni su Claude Opus 4.6