anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet is Anthropic's eerste hybrid reasoning model, met state-of-the-art coding-capaciteiten, een 200k context window en zichtbare reasoning.

anthropic logoanthropicClaude 3February 24, 2025
Context
200Ktokens
Max output
128Ktokens
Invoerprijs
$3.00/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
84.8%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Claude 3.7 Sonnet scoorde 84.8% op deze benchmark.
HLE
34%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Claude 3.7 Sonnet scoorde 34% op deze benchmark.
MMLU
89%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Claude 3.7 Sonnet scoorde 89% op deze benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Claude 3.7 Sonnet scoorde 74% op deze benchmark.
SimpleQA
42%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Claude 3.7 Sonnet scoorde 42% op deze benchmark.
IFEval
93.2%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Claude 3.7 Sonnet scoorde 93.2% op deze benchmark.
AIME 2025
54.8%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Claude 3.7 Sonnet scoorde 54.8% op deze benchmark.
MATH
96.2%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Claude 3.7 Sonnet scoorde 96.2% op deze benchmark.
GSM8k
97%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Claude 3.7 Sonnet scoorde 97% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Claude 3.7 Sonnet scoorde 92% op deze benchmark.
MathVista
70%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Claude 3.7 Sonnet scoorde 70% op deze benchmark.
SWE-Bench
70.3%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Claude 3.7 Sonnet scoorde 70.3% op deze benchmark.
HumanEval
94%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Claude 3.7 Sonnet scoorde 94% op deze benchmark.
LiveCodeBench
65%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Claude 3.7 Sonnet scoorde 65% op deze benchmark.
MMMU
75%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Claude 3.7 Sonnet scoorde 75% op deze benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Claude 3.7 Sonnet scoorde 55% op deze benchmark.
ChartQA
89%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Claude 3.7 Sonnet scoorde 89% op deze benchmark.
DocVQA
94%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Claude 3.7 Sonnet scoorde 94% op deze benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Claude 3.7 Sonnet scoorde 35.2% op deze benchmark.
ARC-AGI
12%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Claude 3.7 Sonnet scoorde 12% op deze benchmark.

Probeer Claude 3.7 Sonnet gratis

Chat gratis met Claude 3.7 Sonnet. Test de mogelijkheden, stel vragen en ontdek wat dit AI-model kan.

Prompt
Antwoord
anthropic/claude-3-7-sonnet-20250219

Je AI-antwoord verschijnt hier

Over Claude 3.7 Sonnet

Leer over de mogelijkheden van Claude 3.7 Sonnet, functies en hoe het je kan helpen betere resultaten te behalen.

Hybrid Reasoning en Transparantie

Claude 3.7 Sonnet vertegenwoordigt een mijlpaal in LLM-architectuur als Anthropic's eerste 'hybrid reasoning' model. Het stelt gebruikers op unieke wijze in staat om te schakelen tussen standaard responsen met lage latency en een 'extended thinking'-modus die de interne chain-of-thought weergeeft. Deze transparantie biedt gebruikers een duidelijk venster in de logica van het model, wat het bijzonder effectief maakt voor complexe probleemoplossing en kritische reasoning-taken.

Meesterschap in Software Engineering

Ontworpen met een sterke focus op software engineering en productie-klare outputs, heeft het model nieuwe industriestandaarden gezet op benchmarks zoals SWE-bench Verified. Het excelleert in 'vibe coding', waarbij ontwikkelaars op hoog niveau intenties beschrijven en het model de implementatie over meerdere bestanden afhandelt. Het verwerkt complexe refactors en architecturale beslissingen met een precisie die eerdere frontier models overtreft.

Enorm Context Window en Agentic Tools

Met een massaal context window van 200.000 tokens en een agentic toolset genaamd Claude Code, transformeert het van een eenvoudige chatbot naar een collaboratieve technische partner. Het is in staat om volledige projectlevenscycli te beheren, van initiële documentatie-review tot geautomatiseerde git-workflows en test-executie, waardoor softwareontwikkeling snel en foutvrij blijft.

Claude 3.7 Sonnet

Gebruikscases voor Claude 3.7 Sonnet

Ontdek de verschillende manieren waarop je Claude 3.7 Sonnet kunt gebruiken voor geweldige resultaten.

Vibe Coding

Functionele software vanaf nul opbouwen door de intentie in natuurlijke taal te beschrijven.

Geavanceerd Debuggen

Gebruikmaken van extended thinking om complexe logs te analyseren en nauwkeurige one-shot fixes te leveren.

Grootschalige Context-analyse

Het reviewen en refactoren van volledige codebases of lijvige technische documentatie in een enkele prompt.

Agentic Development

Het aansturen van terminal-gebaseerde tools zoals Claude Code om git-workflows en test-executie te automatiseren.

Frontend UI-generatie

Het creëren van elegante, onderhoudbare React- en Svelte-componenten met een ingebouwd design-gevoel.

Feitelijk Onderzoek

Het analyseren van enorme PDF-documenten en datasets met een hoge nauwkeurigheid en lage hallucinatie-frequenties.

Sterke punten

Beperkingen

Toonaangevende Coding-capaciteiten: Behaalde een state-of-the-art score van 70,3% op SWE-bench Verified, waarbij echte GitHub-issues werden opgelost met ongekende nauwkeurigheid.
Respons-latency: Het inschakelen van de 'extended thinking'-modus verhoogt de tijd tot de eerste token aanzienlijk in vergelijking met standaard model-responsen.
Zichtbare Reasoning: Het eerste model dat zichtbare, door de gebruiker controleerbare 'extended thinking' biedt voor complexe probleemoplossing waarbij veel op het spel staat.
Premium Prijsstelling: Output-kosten van $15 per 1M tokens blijven aanzienlijk hoger dan de meeste 'mini' of open-weights alternatieven.
Agentic Integratie: Specifiek geoptimaliseerd voor tool-use en CLI-interactie via het Claude Code agent-framework voor end-to-end taakautomatisering.
Geen Native Audio/Video: In tegenstelling tot GPT-4o of Gemini 2.0 ontbreken native verwerkingsmogelijkheden voor audio- en video-input.
Superieur Design-gevoel: Genereert consistent elegantere, toegankelijkere en beter onderhoudbare UI-code vergeleken met andere frontier models.
Computationele Kosten: Deep reasoning-sessies kunnen snel token-budgetten en context-limieten verbruiken tijdens grootschalige refactors van codebases.

API snelstart

anthropic/claude-3-7-sonnet-20250219

Bekijk documentatie
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Claude 3.7 Sonnet

Bekijk wat de community denkt over Claude 3.7 Sonnet

"Claude 3.7 Sonnet is het beste coding AI-model ter wereld; het verbaasde me bij uitdagende taken."
rawcell4772
reddit
"Met een enkele prompt deed hij alles perfect in een complex TypeScript-project."
rawcell4772
reddit
"Claude Code met Sonnet 3.7 is veel beter dan Cline en momenteel de beste tool."
peterkrueck
reddit
"De sprong in kwaliteit met topmodellen zoals 3.7 is transformatief geweest voor mijn vooruitzichten."
lurking_horrors
reddit
"Claude 3.7 is echt bizar... hits different... highkey goated op God no cap"
Fireship
youtube
"De reasoning-modus van Claude 3.7 is een complete paradigmaverschuiving voor het debuggen van logica."
DevLead99
x

Video's over Claude 3.7 Sonnet

Bekijk tutorials, reviews en discussies over Claude 3.7 Sonnet

Het nieuwe 3.7-model verpletterde absoluut alle andere modellen... nu in staat om 70,3% van de GitHub-issues op te lossen

Het gebruik van een sterk getypeerde taal samen met TDD zijn manieren voor de AI om te valideren dat de code die het schrijft daadwerkelijk geldig is

Het model is ongelooflijk slim in het opvolgen van instructies

De prestaties op SWE-bench zijn echt krankzinnig

Zichtbare reasoning is een gamechanger voor transparantie

Claude 3.7 Sonnet... het is waarschijnlijk het beste LLM voor codegeneratie

Als je de API gebruikt, kun je 128.000 tokens in één keer uitvoeren

De output-limiet van 128k is een enorme upgrade

Het design-gevoel voor frontend-componenten is ongeëvenaard

Tool-use en agentic mogelijkheden vormen de kern van dit model

Reasoning zou een geïntegreerde capaciteit van frontier models moeten zijn in plaats van een volledig afzonderlijk model

Claude 3.7 slaagt erin om die modellen [DeepSeek, o3] met een aanzienlijke marge te overtreffen

De latency is iets hoger in de reasoning-modus

Het verslaat DeepSeek R1 op verschillende taken voor het opvolgen van instructies

Anthropic heeft zich echt gericht op productie-klare outputs

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows
Bekijk demo

Pro-tips

Experttips om je te helpen het maximale uit dit model te halen en betere resultaten te behalen.

Thinking-budget

Gebruik de 'extended thinking'-modus specifiek voor complexe logica of architectuurplanning om resultaten van hogere kwaliteit te krijgen.

Context-beheer

Gebruik regelmatig /clear of herstart chats om te besparen op context-kosten en te voorkomen dat het model traag wordt.

Verificatie

Vraag Claude om tests te schrijven en uit te voeren voor zijn eigen code met behulp van de Claude Code tool om productiestabiliteit te garanderen.

Markdown-specificaties

Lever feature-vereisten aan in gestructureerde Markdown-bestanden voor een betere opvolging van instructies tijdens grote projecten.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Veelgestelde vragen

Vind antwoorden op veelvoorkomende vragen over dit model