anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet is het eerste hybride reasoning model van Anthropic, met state-of-the-art programmeermogelijkheden, een 200k context window en zichtbaar...

anthropic logoanthropicClaude 324 februari 2025
Context
200Ktokens
Max output
128Ktokens
Invoerprijs
$3.00/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
84.8%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Claude 3.7 Sonnet scoorde 84.8% op deze benchmark.
HLE
34%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Claude 3.7 Sonnet scoorde 34% op deze benchmark.
MMLU
89%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Claude 3.7 Sonnet scoorde 89% op deze benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Claude 3.7 Sonnet scoorde 74% op deze benchmark.
SimpleQA
42%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Claude 3.7 Sonnet scoorde 42% op deze benchmark.
IFEval
93.2%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Claude 3.7 Sonnet scoorde 93.2% op deze benchmark.
AIME 2025
54.8%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Claude 3.7 Sonnet scoorde 54.8% op deze benchmark.
MATH
96.2%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Claude 3.7 Sonnet scoorde 96.2% op deze benchmark.
GSM8k
97%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Claude 3.7 Sonnet scoorde 97% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Claude 3.7 Sonnet scoorde 92% op deze benchmark.
MathVista
70%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Claude 3.7 Sonnet scoorde 70% op deze benchmark.
SWE-Bench
70.3%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Claude 3.7 Sonnet scoorde 70.3% op deze benchmark.
HumanEval
94%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Claude 3.7 Sonnet scoorde 94% op deze benchmark.
LiveCodeBench
65%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Claude 3.7 Sonnet scoorde 65% op deze benchmark.
MMMU
75%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Claude 3.7 Sonnet scoorde 75% op deze benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Claude 3.7 Sonnet scoorde 55% op deze benchmark.
ChartQA
89%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Claude 3.7 Sonnet scoorde 89% op deze benchmark.
DocVQA
94%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Claude 3.7 Sonnet scoorde 94% op deze benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Claude 3.7 Sonnet scoorde 35.2% op deze benchmark.
ARC-AGI
12%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Claude 3.7 Sonnet scoorde 12% op deze benchmark.

Over Claude 3.7 Sonnet

Leer over de mogelijkheden van Claude 3.7 Sonnet, functies en hoe het je kan helpen betere resultaten te behalen.

Hybride Reasoning Ontwerp

Claude 3.7 Sonnet gebruikt een nieuwe architectuur waarmee gebruikers kunnen kiezen tussen snelheid en diepgang. Het is het eerste model dat een schakelaar biedt voor extended thinking, waardoor het systeem complexe logica kan doorgronden voordat het een antwoord geeft. Deze transparantie laat developers precies zien hoe het model tot een conclusie komt, wat de kans op verborgen fouten in technisch werk verkleint.

Technisch Probleemoplossend Vermogen

Dit model is gebouwd voor software engineering op hoog niveau. Het scoort 62,1% op de SWE-bench Verified benchmark, wat een sterk vermogen aantoont om echte GitHub-issues op te lossen. In combinatie met tools zoals Claude Code beheert het bestandsbewerkingen en commando-uitvoering in grote repositories. Het verwerkt wiskunde- en programmeertaken met een precisie die de huidige topmodellen evenaart of overtreft.

Enorme Contextcapaciteit

Met een context window van 200.000 tokens verwerkt het model grote hoeveelheden documentatie of codebases in één keer. Het ondersteunt tot 128.000 tokens output wanneer de thinking-modus actief is, wat handig is voor het genereren van lange scripts of gedetailleerde rapporten. Het model is ook multimodal, wat betekent dat het grafieken en schema's kan interpreteren naast tekst.

Claude 3.7 Sonnet

Gebruikscases voor Claude 3.7 Sonnet

Ontdek de verschillende manieren waarop je Claude 3.7 Sonnet kunt gebruiken voor geweldige resultaten.

Agentic Software Engineering

Gebruik de terminal-tool om bugs te repareren en code te refactoren in complexe bestandsstructuren.

Wiskundige bewijsvoering

Moeilijke wiskundige problemen oplossen door het model de logische stappen te laten doorlopen.

Repository Analyse

Data extraheren en patronen identificeren uit volledige technische codebases in één prompt.

Visuele Data Parsing

Complexe grafieken, stroomdiagrammen en technische schema's omzetten naar gestructureerde JSON-data.

Systeemarchitectuur Planning

Softwaresystemen ontwerpen met gedetailleerde logische checks via de uitgebreide reasoning-modus.

Geautomatiseerde Git Workflows

Commit-berichten, code reviews en testuitvoering beheren via agentic tool use.

Sterke punten

Beperkingen

Hybride Thinking Opties: Het eerste model dat gebruikers laat schakelen tussen snelle standaardantwoorden en diepgaande reasoning-modi.
Reasoning Latency: Het inschakelen van de thinking-modus verhoogt de tijd die het model nodig heeft om te reageren aanzienlijk.
Premier Coding Agent: Topprestaties op SWE-bench Verified met een score van 62,1% voor het oplossen van productieproblemen.
Thinking Kosten: Interne reasoning tokens worden gefactureerd tegen het tarief van $15 per miljoen output tokens, wat kan oplopen bij langdurige taken.
Enorme Outputcapaciteit: Genereert tot 128.000 tokens in één antwoord, wat het genereren van omvangrijke code en documenten vergemakkelijkt.
Geen Video Ondersteuning: In tegenstelling tot sommige concurrenten kan het geen ruwe videobestanden native inlezen of analyseren via de API.
Transparante Logica: Geëxternaliseerde chain-of-thought stelt gebruikers in staat het interne reasoning-proces van het model te controleren en debuggen.
Knowledge Cutoff: De trainingsdata loopt slechts tot oktober 2024, waardoor recente ontwikkelingen in de sector ontbreken.

API snelstart

anthropic/claude-3-7-sonnet

Bekijk documentatie
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyseer deze architecturale fout..." }],
});

console.log(message.content);

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Claude 3.7 Sonnet

Bekijk wat de community denkt over Claude 3.7 Sonnet

Claude Code plus 3.7 Sonnet is in feite een junior developer op steroïden in mijn terminal. Het is de eerste keer dat agentic AI echt aanvoelde.
dev_guru_99
reddit
De hybride reasoning is een grote update. Ik heb niet altijd nodig dat het 30 seconden nadenkt, maar tijdens het debuggen is het ongelooflijk.
TechLead_X
twitter
Anthropic is erin geslaagd een model te maken dat concurreert met o1 op wiskunde, terwijl het bruikbaar blijft voor alledaagse chat.
logic_fanatic
hackernews
Claude levert uitgebreide, prachtig opgemaakte rapporten met bronvermeldingen in minder dan vijf minuten.
ThinkingDeeplyAI_mod
reddit
De 128k outputlimiet is een onderschatte functie. Eindelijk een model dat niet halverwege een lang script afbreekt.
code_monk_42
reddit
Claude 3.7 + MCP is momenteel het dichtste bij Jarvis. Het gebruikt mijn lokale tools daadwerkelijk correct.
julie_codes_it
twitter

Video's over Claude 3.7 Sonnet

Bekijk tutorials, reviews en discussies over Claude 3.7 Sonnet

Claude 3.7 is geweldig. Het nieuwe basismodel heeft zichzelf overtroffen en is nog beter geworden in programmeren.

Het nieuwe 3.7-model verpletterde absoluut alle andere modellen, inclusief OpenAI o3 mini.

Het is in staat om 70% van de GitHub-issues op te lossen.

Extended thinking stelt het model in staat om over een probleem na te denken voordat het code genereert.

Dit is een enorme winst voor de developer experience.

Chatbots geven je advies, maar Claude Code onderneemt actie. Het kan bestanden aanmaken, websites bouwen en packages installeren.

Extended thinking is Claude dat redeneert voordat het daadwerkelijk acties onderneemt.

De tool is geoptimaliseerd voor de terminal-omgeving.

MCP-connectiviteit is wat dit echt onderscheidt van de standaard ChatGPT.

Het model begrijpt de intentie achter vage terminal-commando's.

De integratie met de terminal via Claude Code biedt een niveau van agency dat we nog niet eerder hebben gezien.

Het vermogen van Claude 3.7 Sonnet om zijn denkproces te tonen is veel transparanter dan bij concurrenten.

Op SWE-bench Verified haalt het een indrukwekkende 62%.

Hybride reasoning betekent dat je de latency-straf niet betaalt wanneer je het niet nodig hebt.

Het behoudt de hoogwaardige schrijfstijl van eerdere Claude-modellen.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Claude 3.7 Sonnet

Experttips om je te helpen het maximale uit Claude 3.7 Sonnet te halen en betere resultaten te behalen.

Stel Reasoning Budgets in

Gebruik de API thinking-parameter om het aantal reasoning tokens te beperken en kosten te beheersen.

Controleer Thought Blocks

Bekijk de interne chain-of-thought in antwoorden om de logica van complexe vraagstukken te verifiëren.

Gebruik MCP Connectors

Verbind het model met lokale databases en cloudopslag voor real-time projectcontext.

Context Refreshing

Gebruik samenvattingscommando's in lange agentic loops om het context window gefocust te houden op relevante data.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Veelgestelde vragen over Claude 3.7 Sonnet

Vind antwoorden op veelvoorkomende vragen over Claude 3.7 Sonnet