anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet è il primo modello di reasoning ibrido di Anthropic, che offre capacità di programmazione all'avanguardia, un context window da 200k e un...

anthropic logoanthropicClaude 324 febbraio 2025
Contesto
200Ktoken
Output max
128Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
84.8%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Claude 3.7 Sonnet ha ottenuto 84.8% in questo benchmark.
HLE
34%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Claude 3.7 Sonnet ha ottenuto 34% in questo benchmark.
MMLU
89%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Claude 3.7 Sonnet ha ottenuto 89% in questo benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Claude 3.7 Sonnet ha ottenuto 74% in questo benchmark.
SimpleQA
42%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Claude 3.7 Sonnet ha ottenuto 42% in questo benchmark.
IFEval
93.2%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Claude 3.7 Sonnet ha ottenuto 93.2% in questo benchmark.
AIME 2025
54.8%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Claude 3.7 Sonnet ha ottenuto 54.8% in questo benchmark.
MATH
96.2%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Claude 3.7 Sonnet ha ottenuto 96.2% in questo benchmark.
GSM8k
97%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Claude 3.7 Sonnet ha ottenuto 97% in questo benchmark.
MGSM
92%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Claude 3.7 Sonnet ha ottenuto 92% in questo benchmark.
MathVista
70%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Claude 3.7 Sonnet ha ottenuto 70% in questo benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Claude 3.7 Sonnet ha ottenuto 70.3% in questo benchmark.
HumanEval
94%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Claude 3.7 Sonnet ha ottenuto 94% in questo benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Claude 3.7 Sonnet ha ottenuto 65% in questo benchmark.
MMMU
75%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Claude 3.7 Sonnet ha ottenuto 75% in questo benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Claude 3.7 Sonnet ha ottenuto 55% in questo benchmark.
ChartQA
89%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Claude 3.7 Sonnet ha ottenuto 89% in questo benchmark.
DocVQA
94%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Claude 3.7 Sonnet ha ottenuto 94% in questo benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Claude 3.7 Sonnet ha ottenuto 35.2% in questo benchmark.
ARC-AGI
12%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Claude 3.7 Sonnet ha ottenuto 12% in questo benchmark.

Informazioni su Claude 3.7 Sonnet

Scopri le capacita di Claude 3.7 Sonnet, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Design a Reasoning Ibrido

Claude 3.7 Sonnet utilizza una nuova architettura che permette agli utenti di scegliere tra velocità e profondità. È il primo modello a offrire un selettore per il thinking esteso, consentendo al sistema di elaborare logiche complesse prima di fornire una risposta. Questa trasparenza consente agli sviluppatori di vedere esattamente come il modello giunge a una conclusione, riducendo il rischio di errori nascosti nel lavoro tecnico.

Risoluzione di problemi tecnici

Questo modello è progettato per l'ingegneria software di alto livello. Ottiene un punteggio del 62,1% sul benchmark SWE-bench Verified, dimostrando una forte capacità di risolvere problemi reali su GitHub. Se utilizzato con strumenti come Claude Code, gestisce la modifica di file e l'esecuzione di comandi su repository di grandi dimensioni. Gestisce task di matematica e programmazione con una precisione che eguaglia o supera gli attuali modelli di reasoning di punta.

Capacità di contesto massiva

Con un context window da 200.000 tokens, il modello elabora ampi set di documentazione o basi di codice in una sola volta. Supporta fino a 128.000 tokens di output quando la modalità di thinking è attiva, rendendolo utile per generare script lunghi o report dettagliati. Il modello è inoltre multimodal, il che significa che può interpretare grafici e diagrammi insieme al testo.

Claude 3.7 Sonnet

Casi d'uso per Claude 3.7 Sonnet

Scopri i diversi modi in cui puoi usare Claude 3.7 Sonnet per ottenere ottimi risultati.

Software Engineering Agentic

Utilizzo dello strumento terminale per correggere bug e rifattorizzare codice in strutture di file complesse.

Verifica di prove matematiche

Risoluzione di problemi matematici difficili lasciando che il modello rifletta sui passaggi logici.

Analisi di repository

Estrazione di dati e identificazione di pattern da intere basi di codice tecniche in un unico prompt.

Parsing di dati visivi

Conversione di grafici complessi, diagrammi di flusso e schemi tecnici in dati strutturati JSON.

Pianificazione dell'architettura di sistema

Progettazione di sistemi software con verifiche logiche dettagliate utilizzando la modalità di thinking estesa.

Flussi di lavoro Git automatizzati

Gestione di messaggi di commit, code review ed esecuzione di test tramite l'uso di strumenti agentic.

Punti di forza

Limitazioni

Opzioni di reasoning ibrido: Il primo modello che consente agli utenti di alternare tra risposte standard rapide e modalità di reasoning profondo.
Latenza del reasoning: L'attivazione della modalità thinking aumenta sensibilmente il tempo di risposta del modello.
Coding Agent di alto livello: Prestazioni di punta su SWE-bench Verified con un punteggio del 62,1% nella risoluzione di problemi di produzione.
Costo del thinking: I reasoning tokens interni sono fatturati alla tariffa di 15 $ per milione di output, il che incide sui task prolungati.
Capacità di output estrema: Genera fino a 128.000 tokens in una singola risposta, facilitando la generazione massiva di codice e documenti.
Nessun supporto video: A differenza di alcuni competitor, non può acquisire o analizzare nativamente file video tramite API.
Logica trasparente: Il chain-of-thought esternalizzato permette agli utenti di controllare e sottoporre a debug il processo di reasoning interno del modello.
Data di taglio della conoscenza: I dati di addestramento arrivano solo fino a ottobre 2024, perdendo gli sviluppi più recenti del settore.

Avvio rapido API

anthropic/claude-3-7-sonnet

Visualizza documentazione
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analizza questo difetto architetturale..." }],
});

console.log(message.content);

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Claude 3.7 Sonnet

Guarda cosa pensa la community di Claude 3.7 Sonnet

Claude Code con 3.7 Sonnet è praticamente uno sviluppatore junior sotto steroidi nel mio terminale. È la prima volta che un'AI agentic sembra reale.
dev_guru_99
reddit
Il reasoning ibrido è un aggiornamento importante. Non ho sempre bisogno che rifletta per 30 secondi, ma quando faccio debug, è incredibile.
TechLead_X
twitter
Anthropic è riuscita a creare un modello che compete con o1 in matematica rimanendo utile per la chat quotidiana.
logic_fanatic
hackernews
Claude fornisce report completi, formattati in modo impeccabile con citazioni in meno di cinque minuti.
ThinkingDeeplyAI_mod
reddit
Il limite di output a 128k è una funzione sottovalutata. Finalmente un modello che non si interrompe a metà di uno script lungo.
code_monk_42
reddit
Claude 3.7 + MCP è quanto di più vicino a Jarvis esista al momento. Usa i miei strumenti locali correttamente.
julie_codes_it
twitter

Video su Claude 3.7 Sonnet

Guarda tutorial, recensioni e discussioni su Claude 3.7 Sonnet

Claude 3.7 è davvero potente. Il nuovo modello base ha superato se stesso diventando ancora più bravo a programmare.

Il nuovo modello 3.7 ha stracciato ogni altro modello, incluso OpenAI o3 mini.

È in grado di risolvere il 70% delle issue su GitHub.

Il thinking esteso permette al modello di riflettere su un problema prima di generare il codice.

È un enorme passo avanti per l'esperienza degli sviluppatori.

I chatbot ti danno consigli, ma Claude Code agisce. Può creare file, costruire siti web e installare pacchetti.

Il thinking esteso è Claude che riflette prima di compiere qualsiasi azione.

Lo strumento è ottimizzato per l'ambiente terminale.

La connettività MCP è ciò che davvero lo distingue da ChatGPT standard.

Il modello comprende l'intento dietro comandi del terminale vaghi.

L'integrazione con il terminale tramite Claude Code è un livello di agency che non abbiamo mai visto prima.

La capacità di Claude 3.7 Sonnet di mostrare il proprio processo di pensiero è molto più trasparente rispetto alla concorrenza.

Su SWE-bench Verified, raggiunge un notevole 62%.

Il reasoning ibrido significa che non paghi la penalità di latenza quando non ne hai bisogno.

Mantiene l'elevata qualità di scrittura dei precedenti modelli Claude.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Claude 3.7 Sonnet

Consigli esperti per aiutarti a ottenere il massimo da Claude 3.7 Sonnet e raggiungere risultati migliori.

Imposta i budget di reasoning

Utilizza il parametro thinking dell'API per limitare il numero di reasoning tokens e gestire i costi.

Revisione dei thought blocks

Controlla il chain-of-thought interno nelle risposte per verificare la logica di quesiti complessi.

Usa i connettori MCP

Collega il modello a database locali e cloud storage per avere un contesto di progetto in tempo reale.

Aggiornamento del contesto

Utilizza comandi di sintesi durante lunghi cicli agentic per mantenere il context window focalizzato sui dati rilevanti.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Domande frequenti su Claude 3.7 Sonnet

Trova risposte alle domande comuni su Claude 3.7 Sonnet