anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet è il primo model di hybrid reasoning di Anthropic, con capacità di coding state-of-the-art, una context window di 200k e thinking visibile.

anthropic logoanthropicClaude 324 febbraio 2025
Contesto
200Ktoken
Output max
128Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
84.8%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude 3.7 Sonnet ha ottenuto 84.8% in questo benchmark.
HLE
34%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude 3.7 Sonnet ha ottenuto 34% in questo benchmark.
MMLU
89%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude 3.7 Sonnet ha ottenuto 89% in questo benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude 3.7 Sonnet ha ottenuto 74% in questo benchmark.
SimpleQA
42%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude 3.7 Sonnet ha ottenuto 42% in questo benchmark.
IFEval
93.2%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude 3.7 Sonnet ha ottenuto 93.2% in questo benchmark.
AIME 2025
54.8%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude 3.7 Sonnet ha ottenuto 54.8% in questo benchmark.
MATH
96.2%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude 3.7 Sonnet ha ottenuto 96.2% in questo benchmark.
GSM8k
97%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude 3.7 Sonnet ha ottenuto 97% in questo benchmark.
MGSM
92%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude 3.7 Sonnet ha ottenuto 92% in questo benchmark.
MathVista
70%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude 3.7 Sonnet ha ottenuto 70% in questo benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude 3.7 Sonnet ha ottenuto 70.3% in questo benchmark.
HumanEval
94%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude 3.7 Sonnet ha ottenuto 94% in questo benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude 3.7 Sonnet ha ottenuto 65% in questo benchmark.
MMMU
75%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude 3.7 Sonnet ha ottenuto 75% in questo benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude 3.7 Sonnet ha ottenuto 55% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude 3.7 Sonnet ha ottenuto 89% in questo benchmark.
DocVQA
94%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude 3.7 Sonnet ha ottenuto 94% in questo benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude 3.7 Sonnet ha ottenuto 35.2% in questo benchmark.
ARC-AGI
12%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude 3.7 Sonnet ha ottenuto 12% in questo benchmark.

Prova Claude 3.7 Sonnet gratis

Chatta con Claude 3.7 Sonnet gratuitamente. Testa le sue capacita, fai domande ed esplora cosa puo fare questo modello AI.

Prompt
Risposta
anthropic/claude-3-7-sonnet-20250219

La tua risposta AI apparira qui

Informazioni su Claude 3.7 Sonnet

Scopri le capacita di Claude 3.7 Sonnet, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Hybrid Reasoning e Trasparenza

Claude 3.7 Sonnet rappresenta un cambiamento epocale nell'architettura degli LLM, essendo il primo model di 'hybrid reasoning' di Anthropic. Permette in modo unico agli utenti di passare da risposte standard a bassa latency a una modalità 'extended thinking' che mostra la propria chain-of-thought interna. Questa trasparenza offre agli utenti una finestra chiara sulla logica del model, rendendolo particolarmente efficace per il troubleshooting complesso e i task di reasoning ad alto rischio.

Padronanza nell'Ingegneria del Software

Progettato con un forte focus sull'ingegneria del software e su output pronti per la produzione, il model ha stabilito nuovi standard del settore su benchmark come SWE-Bench Verified. Eccelle nel 'vibe coding', dove gli sviluppatori descrivono l'intento ad alto livello e il model gestisce l'implementazione su più file. Gestisce refactor complessi e decisioni architetturali con una precisione che supera i precedenti frontier model.

Context Massiccio e Strumenti Agentic

Con una massiccia context window da 200.000 token e un set di strumenti agentic chiamato Claude Code, si trasforma da semplice chatbot in un partner tecnico collaborativo. È in grado di gestire interi cicli di vita del progetto, dalla revisione iniziale della documentazione ai workflow git automatizzati e all'esecuzione dei test, garantendo che lo sviluppo rimanga rapido e privo di bug.

Claude 3.7 Sonnet

Casi d'uso per Claude 3.7 Sonnet

Scopri i diversi modi in cui puoi usare Claude 3.7 Sonnet per ottenere ottimi risultati.

Vibe Coding

Costruire software funzionale da zero descrivendo l'intento in linguaggio naturale.

Debugging Avanzato

Utilizzare l'extended thinking per analizzare log complessi e fornire correzioni precise in un colpo solo.

Analisi di Large Context

Revisionare e rifattorizzare intere codebase o lunghe documentazioni tecniche in un unico prompt.

Sviluppo Agentic

Potenziare strumenti basati su terminale come Claude Code per automatizzare i workflow git e l'esecuzione dei test.

Generazione UI Frontend

Creare componenti React e Svelte eleganti e manutenibili con un senso estetico del design integrato.

Ricerca Fattuale

Analizzare enormi documenti PDF e dataset con alta precisione e bassi tassi di allucinazione.

Punti di forza

Limitazioni

Coding Leader del Settore: Ha raggiunto un punteggio state-of-the-art del 70,3% su SWE-bench Verified, risolvendo problemi reali su GitHub con un'accuratezza senza precedenti.
Latenza di Risposta: L'attivazione della modalità 'extended thinking' aumenta significativamente la latency del primo token rispetto alle risposte standard del model.
Reasoning Visibile: Il primo model a offrire un 'extended thinking' visibile e controllabile dall'utente per il problem-solving complesso e ad alto rischio.
Prezzo Premium: I costi di output di $15 per 1M di token rimangono considerevolmente più alti rispetto alla maggior parte delle alternative 'mini' o open-weights.
Integrazione Agentic: Ottimizzato specificamente per il tool-use e l'interazione CLI tramite il framework Claude Code per l'automazione di task end-to-end.
Assenza di Audio/Video Nativi: A differenza di GPT-4o o Gemini 2.0, manca di capacità native di elaborazione di input audio e video.
Gusto Superiore per il Design: Genera costantemente codice UI più elegante, accessibile e manutenibile rispetto ad altri frontier model.
Costo Computazionale: Sessioni di deep reasoning possono consumare rapidamente il budget di token e i limiti di context durante refactor di codebase su larga scala.

Avvio rapido API

anthropic/claude-3-7-sonnet-20250219

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude 3.7 Sonnet

Guarda cosa pensa la community di Claude 3.7 Sonnet

"Claude 3.7 Sonnet è il miglior model AI per il coding al mondo; mi ha lasciato a bocca aperta su task impegnativi."
rawcell4772
reddit
"Con un singolo prompt, ha centrato tutto perfettamente in un complesso progetto TypeScript."
rawcell4772
reddit
"Claude Code con Sonnet 3.7 è molto meglio di Cline e attualmente è lo strumento migliore."
peterkrueck
reddit
"Il salto di qualità con model top-tier come il 3.7 è stato trasformativo per le mie prospettive."
lurking_horrors
reddit
"Claude 3.7 è pura dinamite... colpisce in modo diverso... assolutamente il migliore di sempre"
Fireship
youtube
"La modalità reasoning di Claude 3.7 è un cambio di paradigma completo per il debugging della logica."
DevLead99
x

Video su Claude 3.7 Sonnet

Guarda tutorial, recensioni e discussioni su Claude 3.7 Sonnet

Il nuovo model 3.7 ha assolutamente schiacciato tutti gli altri... ora è in grado di risolvere il 70,3% dei problemi su GitHub

L'uso di un linguaggio fortemente tipizzato insieme al TDD sono modi per l'AI di convalidare che il codice scritto sia effettivamente valido

Il model è incredibilmente intelligente nel seguire le istruzioni

Le performance su SWE-bench sono davvero folli

Il reasoning visibile è una svolta per la trasparenza

Claude 3.7 Sonnet... è probabilmente il miglior LLM per la generazione di codice

Se usi l'API, puoi generare 128.000 token in un colpo solo

Il limite di output di 128k è un aggiornamento massiccio

Il suo gusto nel design per i componenti frontend non ha eguali

Il tool use e le capacità agentic sono fondamentali per questo model

Il reasoning dovrebbe essere una capacità integrata dei frontier model piuttosto che un model interamente separato

Claude 3.7 riesce a superare quei model [DeepSeek, o3] in misura piuttosto significativa

La latency è leggermente superiore in modalità reasoning

Batte DeepSeek R1 in diversi task di esecuzione delle istruzioni

Anthropic si è concentrata molto su output pronti per la produzione

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti
Guarda la demo

Consigli Pro

Consigli esperti per aiutarti a ottenere il massimo da questo modello e raggiungere risultati migliori.

Budget di Thinking

Utilizza la modalità 'extended thinking' specificamente per la logica complessa o la pianificazione dell'architettura per ottenere risultati di qualità superiore.

Controllo del Context

Usa regolarmente /clear o riavvia le chat per risparmiare sui costi del context ed evitare che il model diventi meno reattivo.

Verifica

Chiedi a Claude di scrivere ed eseguire test per il proprio codice utilizzando lo strumento Claude Code per garantire la stabilità in produzione.

Specifiche in Markdown

Fornisci i requisiti delle feature in file Markdown strutturati per una migliore aderenza alle istruzioni durante progetti di grandi dimensioni.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Domande frequenti

Trova risposte alle domande comuni su questo modello