anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet är Anthropics första hybrid reasoning model, som levererar state-of-the-art kodningsförmåga, ett 200k context window och synlig reasoning.

anthropic logoanthropicClaude 3February 24, 2025
Kontext
200Ktokens
Max utdata
128Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
84.8%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude 3.7 Sonnet fick 84.8% pa detta benchmark.
HLE
34%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude 3.7 Sonnet fick 34% pa detta benchmark.
MMLU
89%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude 3.7 Sonnet fick 89% pa detta benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude 3.7 Sonnet fick 74% pa detta benchmark.
SimpleQA
42%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude 3.7 Sonnet fick 42% pa detta benchmark.
IFEval
93.2%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude 3.7 Sonnet fick 93.2% pa detta benchmark.
AIME 2025
54.8%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude 3.7 Sonnet fick 54.8% pa detta benchmark.
MATH
96.2%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude 3.7 Sonnet fick 96.2% pa detta benchmark.
GSM8k
97%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude 3.7 Sonnet fick 97% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude 3.7 Sonnet fick 92% pa detta benchmark.
MathVista
70%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude 3.7 Sonnet fick 70% pa detta benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude 3.7 Sonnet fick 70.3% pa detta benchmark.
HumanEval
94%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude 3.7 Sonnet fick 94% pa detta benchmark.
LiveCodeBench
65%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude 3.7 Sonnet fick 65% pa detta benchmark.
MMMU
75%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude 3.7 Sonnet fick 75% pa detta benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude 3.7 Sonnet fick 55% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude 3.7 Sonnet fick 89% pa detta benchmark.
DocVQA
94%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude 3.7 Sonnet fick 94% pa detta benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude 3.7 Sonnet fick 35.2% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude 3.7 Sonnet fick 12% pa detta benchmark.

Prova Claude 3.7 Sonnet gratis

Chatta med Claude 3.7 Sonnet gratis. Testa kapaciteterna, stall fragor och utforska vad denna AI-modell kan gora.

Prompt
Svar
anthropic/claude-3-7-sonnet-20250219

Ditt AI-svar kommer att visas har

Om Claude 3.7 Sonnet

Lar dig om Claude 3.7 Sonnets kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Hybrid reasoning och transparens

Claude 3.7 Sonnet representerar ett historiskt skifte i LLM-arkitektur som Anthropics första 'hybrid reasoning' model. Den låter användare unikt växla mellan standardiserade svar med låg latency och ett läge för 'extended thinking' som visar dess interna chain-of-thought. Denna transparens ger användare en tydlig inblick i modellens logik, vilket gör den särskilt effektiv för komplex felsökning och kritiska reasoning-uppgifter.

Mästerskap inom software engineering

Designad med ett starkt fokus på software engineering och produktionsklara resultat, har denna model satt nya branschstandarder i benchmarks som SWE-bench Verified. Den briljerar inom 'vibe coding', där utvecklare beskriver övergripande avsikter och denna model hanterar implementeringen över flera filer. Den hanterar komplexa refaktoreringar och arkitektoniska beslut med en precision som överträffar tidigare frontier modeller.

Massivt context window och agentic-verktyg

Med ett massivt context window på 200 000 tokens och en uppsättning agentic-verktyg kallad Claude Code, förvandlas den från en enkel chatbot till en teknisk samarbetspartner. Den är kapabel att hantera hela projektlivscykler, från initial granskning av dokumentation till automatiserade git-arbetsflöden och testexekvering, vilket säkerställer att utvecklingen förblir snabb och buggfri.

Claude 3.7 Sonnet

Anvandningsfall for Claude 3.7 Sonnet

Upptack de olika satten du kan anvanda Claude 3.7 Sonnet for att uppna fantastiska resultat.

Vibe Coding

Bygga fungerande mjukvara från grunden genom att beskriva avsikten på naturligt språk.

Avancerad felsökning

Nyttja extended thinking för att analysera komplexa loggar och tillhandahålla exakta fixar direkt.

Analys av stora mängder data

Granska och refaktorera hela kodbaser eller omfattande teknisk dokumentation i en enda prompt.

Agentic development

Driva terminalbaserade verktyg som Claude Code för att automatisera git-arbetsflöden och testexekvering.

Generering av frontend-UI

Skapa eleganta och underhållbara React- och Svelte-komponenter med inbyggd designkänsla.

Faktasökning

Analysera massiva PDF-dokument och dataset med hög noggrannhet och låg risk för hallucinationer.

Styrkor

Begransningar

Branschledande kodning: Uppnådde state-of-the-art 70,3 % på SWE-bench Verified och löste verkliga GitHub-problem med oöverträffad precision.
Svarstid (latency): Att aktivera läget för 'extended thinking' ökar tiden till första token avsevärt jämfört med standardläget.
Synlig reasoning: Den första model som erbjuder synlig och användarkontrollerad 'extended thinking' för komplex och kritisk problemlösning.
Premiumprissättning: Kostnaden för output på $15 per 1M tokens är fortfarande betydligt högre än för de flesta 'mini'-modeller eller open-source-alternativ.
Agentic-integration: Särskilt optimerad för tool-use och CLI-interaktion via agent-ramverket Claude Code för automatisering av uppgifter från början till slut.
Inget inbyggt stöd för ljud/video: Till skillnad från GPT-4o eller Gemini 2.0 saknar den inbyggd förmåga att bearbeta ljud- och videoindata.
Överlägsen designkänsla: Genererar konsekvent mer elegant, tillgänglig och underhållbar UI-kod jämfört med andra frontier modeller.
Beräkningskostnad: Sessioner med djup reasoning kan snabbt förbruka budgeten för tokens och gränsen för context window vid storskalig refaktorering av kodbaser.

API snabbstart

anthropic/claude-3-7-sonnet-20250219

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Skriv en högpresterande Rust-funktion för matrismultiplikation." }],
});

console.log(msg.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude 3.7 Sonnet

Se vad communityt tycker om Claude 3.7 Sonnet

"Claude 3.7 Sonnet är den bästa kodnings-AI-model i världen; den golvade mig totalt på utmanande uppgifter."
rawcell4772
reddit
"Med en enda prompt satte den allt perfekt i ett komplext TypeScript-projekt."
rawcell4772
reddit
"Claude Code med Sonnet 3.7 är mycket bättre än Cline och är för närvarande det bästa verktyget."
peterkrueck
reddit
"Språnget i kvalitet med toppmodeller som 3.7 har varit transformerande för min framtidssyn."
lurking_horrors
reddit
"Claude 3.7 är helt sjuk, den träffar annorlunda... highkey goated on God no cap"
Fireship
youtube
"Claude 3.7:s reasoning-läge är ett fullständigt paradigmskifte för logisk felsökning."
DevLead99
x

Videor om Claude 3.7 Sonnet

Se handledningar, recensioner och diskussioner om Claude 3.7 Sonnet

Den nya 3.7-modellen krossade totalt alla andra modeller... kapabel att lösa 70,3 % av GitHub-problemen

Att använda ett starkt typat språk tillsammans med TDD är sätt för AI:n att validera att koden den skriver faktiskt är giltig

Denna model är otroligt smart på att följa instruktioner

Prestandan i SWE-bench är faktiskt helt galen

Synlig reasoning är en game changer för transparens

Claude 3.7 Sonnet... det är förmodligen den bästa LLM för kodgenerering

Om du använder API:et kan du få ut 128 000 tokens i ett svep

Output-gränsen på 128k är en massiv uppgradering

Dess designkänsla för frontend-komponenter är oöverträffad

Tool-use och agentic-förmågor är centrala för denna model

Reasoning bör vara en integrerad förmåga i frontier modeller snarare än en helt separat model

Claude 3.7 lyckas överträffa dessa modeller [DeepSeek, o3] med en ganska betydande marginal

Latency är något högre i reasoning-läget

Den slår DeepSeek R1 i flera uppgifter gällande att följa instruktioner

Anthropic har verkligen fokuserat på produktionsklara resultat

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips

Experttips for att hjalpa dig fa ut det mesta av denna modell och uppna battre resultat.

Budget för thinking

Använd läget för 'extended thinking' specifikt för komplex logik eller arkitekturplanering för att få resultat av högre kvalitet.

Context-kontroll

Använd regelbundet /clear eller starta om chattar för att spara på kostnader för tokens och förhindra att denna model blir långsam.

Verifiering

Be Claude skriva och köra tester för sin egen kod med hjälp av Claude Code för att säkerställa stabilitet i produktion.

Markdown-specifikationer

Tillhandahåll funktionskrav i strukturerade Markdown-filer för bättre efterlevnad av instruktioner under stora projekt.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Vanliga fragor

Hitta svar pa vanliga fragor om denna modell