anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet är Anthropics första hybrid reasoning-modell, med state-of-the-art programmeringskapacitet, ett 200k context window och synlig...

anthropic logoanthropicClaude 324 februari 2025
Kontext
200Ktokens
Max utdata
128Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
84.8%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude 3.7 Sonnet fick 84.8% pa detta benchmark.
HLE
34%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude 3.7 Sonnet fick 34% pa detta benchmark.
MMLU
89%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude 3.7 Sonnet fick 89% pa detta benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude 3.7 Sonnet fick 74% pa detta benchmark.
SimpleQA
42%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude 3.7 Sonnet fick 42% pa detta benchmark.
IFEval
93.2%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude 3.7 Sonnet fick 93.2% pa detta benchmark.
AIME 2025
54.8%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude 3.7 Sonnet fick 54.8% pa detta benchmark.
MATH
96.2%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude 3.7 Sonnet fick 96.2% pa detta benchmark.
GSM8k
97%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude 3.7 Sonnet fick 97% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude 3.7 Sonnet fick 92% pa detta benchmark.
MathVista
70%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude 3.7 Sonnet fick 70% pa detta benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude 3.7 Sonnet fick 70.3% pa detta benchmark.
HumanEval
94%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude 3.7 Sonnet fick 94% pa detta benchmark.
LiveCodeBench
65%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude 3.7 Sonnet fick 65% pa detta benchmark.
MMMU
75%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude 3.7 Sonnet fick 75% pa detta benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude 3.7 Sonnet fick 55% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude 3.7 Sonnet fick 89% pa detta benchmark.
DocVQA
94%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude 3.7 Sonnet fick 94% pa detta benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude 3.7 Sonnet fick 35.2% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude 3.7 Sonnet fick 12% pa detta benchmark.

Om Claude 3.7 Sonnet

Lar dig om Claude 3.7 Sonnets kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Design med hybrid reasoning

Claude 3.7 Sonnet använder en ny arkitektur som låter användare välja mellan hastighet och djup. Det är den första modellen som erbjuder ett reglage för utökad thinking, vilket gör att systemet kan arbeta igenom komplex logik innan ett svar ges. Denna transparens låter utvecklare se exakt hur modellen når en slutsats, vilket minskar risken för dolda fel i tekniskt arbete.

Teknisk problemlösning

Denna modell är byggd för mjukvaruutveckling på hög nivå. Den får 62,1 % på SWE-bench Verified, vilket visar en stark förmåga att åtgärda verkliga GitHub-issues. När den används med verktyg som Claude Code hanterar den filredigering och kommandoexekvering i stora kodbaser. Den hanterar matematiska och programmeringsrelaterade uppgifter med en precision som matchar eller överträffar nuvarande toppmodeller.

Massiv kapacitet för kontext

Med ett context window på 200 000 tokens bearbetar modellen stora mängder dokumentation eller kodbaser på en gång. Den stöder upp till 128 000 tokens i output när thinking-läget är aktiverat, vilket gör den användbar för att generera långa skript eller detaljerade rapporter. Modellen är även multimodal, vilket innebär att den kan tolka diagram och illustrationer parallellt med text.

Claude 3.7 Sonnet

Anvandningsfall for Claude 3.7 Sonnet

Upptack de olika satten du kan anvanda Claude 3.7 Sonnet for att uppna fantastiska resultat.

Agentic mjukvaruutveckling

Använd terminalverktyget för att fixa buggar och refaktorera kod i omfattande filstrukturer.

Verifiering av matematiska bevis

Lösa svåra matematiska problem genom att låta modellen arbeta igenom de logiska stegen.

Analys av arkiv

Extrahera data och identifiera mönster från hela tekniska kodbaser i en enda prompt.

Visuell dataanalys

Konvertera komplexa diagram, flödesscheman och tekniska illustrationer till strukturerad JSON-data.

Planering av systemarkitektur

Designa mjukvarusystem med detaljerade logikkontroller genom att använda läget för utökad thinking.

Automatiserade Git-arbetsflöden

Hantera commit-meddelanden, kodgranskningar och testkörningar genom agentic tool use.

Styrkor

Begransningar

Valmöjligheter för hybrid reasoning: Den första modellen som låter användare växla mellan snabba standardsvar och avancerade reasoning-lägen.
Reasoning-latens: Att aktivera thinking-läget ökar tiden det tar för modellen att svara avsevärt.
Ledande kodningsagent: Prestanda i toppklass på SWE-bench Verified med 62,1 % för att åtgärda problem i produktion.
Kostnad för thinking: Interna reasoning tokens debiteras till en kostnad av 15 USD per miljon tokens, vilket ökar kostnaden vid långa uppgifter.
Extrem output-kapacitet: Genererar upp till 128 000 tokens i ett enda svar, vilket underlättar generering av massiva mängder kod och dokumentation.
Inget videostöd: Till skillnad från vissa konkurrenter kan den inte nativt läsa in eller analysera råa videofiler via API:et.
Transparent logik: Externt synlig chain-of-thought gör att användare kan granska och debugga modellens interna resonemang.
Kunskapspaus: Träningsdatan sträcker sig endast fram till oktober 2024, vilket innebär att den missar den senaste utvecklingen.

API snabbstart

anthropic/claude-3-7-sonnet

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analysera denna arkitektoniska brist..." }],
});

console.log(message.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude 3.7 Sonnet

Se vad communityt tycker om Claude 3.7 Sonnet

Claude Code plus 3.7 Sonnet är i princip en juniorutvecklare på steroider i min terminal. Det är första gången agentic AI känns på riktigt.
dev_guru_99
reddit
Hybrid-reasoning är en stor uppdatering. Jag behöver inte alltid att den tänker i 30 sekunder, men när jag debuggar är det otroligt.
TechLead_X
twitter
Anthropic lyckades skapa en modell som konkurrerar med o1 i matte samtidigt som den förblir användbar för daglig chatt.
logic_fanatic
hackernews
Claude levererar omfattande, snyggt formaterade rapporter med källhänvisningar på under fem minuter.
ThinkingDeeplyAI_mod
reddit
Gränsen på 128k i output är en underskattad funktion. Äntligen en modell som inte bryter mitt i ett långt skript.
code_monk_42
reddit
Claude 3.7 + MCP är det närmaste vi kommer Jarvis just nu. Den använder faktiskt mina lokala verktyg korrekt.
julie_codes_it
twitter

Videor om Claude 3.7 Sonnet

Se handledningar, recensioner och diskussioner om Claude 3.7 Sonnet

Claude 3.7 är helt otrolig. Den nya basmodellen har överträffat sig själv och blivit ännu bättre på programmering.

Den nya 3.7-modellen krossade samtliga andra modeller, inklusive OpenAI o3 mini.

Den kan lösa 70 % av alla GitHub-issues.

Utökad thinking gör att modellen kan fundera över ett problem innan den genererar kod.

Detta är en enorm vinst för utvecklarupplevelsen.

Chatbottar ger dig råd, men Claude Code tar handling. Den kan skapa filer, bygga webbplatser och installera paket.

Utökad thinking innebär att Claude resonerar innan den faktiskt vidtar några åtgärder.

Verktyget är optimerat för terminalmiljön.

MCP-anslutning är det som verkligen skiljer detta från vanliga ChatGPT.

Modellen förstår avsikten bakom vaga terminalkommandon.

Integrationen med terminalen via Claude Code är en nivå av agency vi inte sett tidigare.

Claude 3.7 Sonnets förmåga att visa sin tankeprocess är betydligt mer transparent än konkurrenternas.

På SWE-bench Verified når den anmärkningsvärda 62 %.

Hybrid reasoning innebär att du inte betalar för latensen när du inte behöver den.

Den bibehåller den högkvalitativa skrivstilen från tidigare Claude-modeller.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Claude 3.7 Sonnet

Experttips for att hjalpa dig fa ut det mesta av Claude 3.7 Sonnet och uppna battre resultat.

Ställ in reasoning-budgetar

Använd API-parametern för thinking för att begränsa antalet reasoning tokens och kontrollera kostnaderna.

Granska tankeblock

Kontrollera den interna chain-of-thought i svaren för att verifiera logiken i komplexa frågor.

Använd MCP-kopplingar

Anslut modellen till lokala databaser och molnlagring för att ge den realtidskontext om dina projekt.

Uppdatera kontexten

Använd sammanfattningskommandon i långa agentic-loopar för att hålla fokus i context window på relevant data.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Vanliga fragor om Claude 3.7 Sonnet

Hitta svar pa vanliga fragor om Claude 3.7 Sonnet