anthropic

Claude Sonnet 4.5

Anthropic's Claude Sonnet 4.5 levererar världsledande kodning (77,2% SWE-bench) och ett 200K context window, optimerat för nästa generation av autonoma agenter.

AI-kodningAgentic AIHybrid ResonemangAnthropicMultimodal
anthropic logoanthropicClaude29 september 2025
Kontext
200Ktokens
Max utdata
64Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
83%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude Sonnet 4.5 fick 83% pa detta benchmark.
HLE
34%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Claude Sonnet 4.5 fick 34% pa detta benchmark.
MMLU
89%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude Sonnet 4.5 fick 89% pa detta benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude Sonnet 4.5 fick 78% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Claude Sonnet 4.5 fick 52% pa detta benchmark.
IFEval
88%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude Sonnet 4.5 fick 88% pa detta benchmark.
AIME 2025
87%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude Sonnet 4.5 fick 87% pa detta benchmark.
MATH
87%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude Sonnet 4.5 fick 87% pa detta benchmark.
GSM8k
98%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude Sonnet 4.5 fick 98% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude Sonnet 4.5 fick 92% pa detta benchmark.
MathVista
72%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude Sonnet 4.5 fick 72% pa detta benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude Sonnet 4.5 fick 77% pa detta benchmark.
HumanEval
94%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude Sonnet 4.5 fick 94% pa detta benchmark.
LiveCodeBench
68%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude Sonnet 4.5 fick 68% pa detta benchmark.
MMMU
78%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude Sonnet 4.5 fick 78% pa detta benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude Sonnet 4.5 fick 55% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude Sonnet 4.5 fick 89% pa detta benchmark.
DocVQA
92%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude Sonnet 4.5 fick 92% pa detta benchmark.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude Sonnet 4.5 fick 50% pa detta benchmark.
ARC-AGI
14%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude Sonnet 4.5 fick 14% pa detta benchmark.

Om Claude Sonnet 4.5

Lar dig om Claude Sonnet 4.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

**Framkanten för agentic intelligens**

Claude 4.5 Sonnet representerar ett stort framsteg inom frontier-modeller, optimerad för eran av autonoma AI-agenter. Den släpptes sent 2025 och är en hybrid resonemangsmodell som gör att utvecklare kan växla mellan höghastighetsexekvering för rutinuppgifter och utökat tänkande för komplexa logiska utmaningar. Den leder benchmarks inom computer use och verktygsorkestrering, vilket gör den till en föredragen motor för terminalbaserade agenter och mjukvaruutveckling med flera filer.

**Precision och minskade hallucinationer**

Modellarkitekturen prioriterar logik och precision, vilket minskar det "sycophancy" och de hallucinationer som observerats i tidigare serier. Med en 64 000-tokens output-gräns och ett 200 000-tokens input-fönster kan den bearbeta hela repositories samtidigt som den genererar kompletta applikationsfiler i en enda körning. Den introducerar native checkpoints för agentic arbetsflöden, vilket gör att system kan rulla tillbaka och korrigera misstag autonomt utan mänsklig inblandning.

**Multimodal och resonemangskapacitet**

Utöver mjukvaruutveckling utmärker sig Sonnet 4.5 i multimodal dokumentanalys och finansiell modellering. Dess interna logik prioriterar arkitektoniskt context, vilket gör att den kan kartlägga storskaliga system mer effektivt än sina föregångare. Oavsett om den bearbetar handskrivna anteckningar eller implementerar API-integrationer, bibehåller modellen hög faktamässig noggrannhet och strikt följsamhet till instruktioner genom långsiktiga uppgifter.

Claude Sonnet 4.5

Anvandningsfall for Claude Sonnet 4.5

Upptack de olika satten du kan anvanda Claude Sonnet 4.5 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Hantering av utveckling från början till slut, från initiala krav till automatiserade commits via terminalgränssnitt.

GUI-baserad automatisering

Automatisering av webbsurfning och datainmatning i äldre applikationer med hjälp av inbyggda computer use-funktioner.

Multi-agent-orkestrering

Delegering av specialiserade uppgifter till underagenter som granskare och byggare inom en central planeringsloop.

Komplex kodrefaktorering

Omstrukturering av kodbaser med flera filer samtidigt som konsekvens bibehålls över 200 000 tokens av aktivt context.

Nyanserad finansiell analys

Analys av kvartalsrapporter och kalkylblad med vision för att identifiera avvikelser och investeringsinsikter.

Interaktiv datavisualisering

Generering av dynamiska diagram från komplexa dataset med inbäddad kodexekvering och realtidsbygge.

Styrkor

Begransningar

Native Computer Use: Modellen interagerar med operativsystem via markörrörelser och GUI-manipulering med 61,4 procents noggrannhet.
Ingen native ljudinput: Modellen kan inte direkt bearbeta ljudfiler som en native modalitet och kräver externa transkriberingsverktyg.
Elite kodningsprestanda: Den uppnår 77,2 procent på SWE-bench Verified och leder alla andra modeller i att lösa GitHub-ärenden.
Kostnad för resonemangstokens: Tokens som används under internt Extended Thinking debiteras som output-tokens, vilket ökar kostnaden för komplexa frågor.
30-timmars uppgiftshorisont: Arkitekturen möjliggör 30 timmars kontinuerligt autonomt arbete samtidigt som status och fokus bibehålls.
Latens i Thinking Mode: När Extended Thinking är aktiverat kan det ta flera minuter för modellen att bearbeta komplexa arkitektoniska planer.
64K output-gräns: Massiv output-kapacitet gör det möjligt att generera hela applikationsarkitekturer i ett enda API-anrop.
Varians i matematisk tävling: Även om den leder inom kodning, ligger den ibland efter specialiserade resonemangsmodeller i specifika benchmarks för tävlingsprogrammering.

API snabbstart

anthropic/claude-4-5-sonnet

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude Sonnet 4.5

Se vad communityt tycker om Claude Sonnet 4.5

Claude 4.5 Sonnet är tillgänglig överallt idag, den bästa kodningsmodellen i världen.
ClaudeOfficial
reddit
Detta löser ett av de mest smärtsamma skalningsproblemen med MCP-uppsättningar. Jag såg hur context försvann innan något faktiskt arbete ens påbörjats.
Simon Willison
twitter
Claude Code-Sonnet 4.5 är långt före Gemini 3.0 Pro för komplexa Docker-refaktoreringsuppgifter.
Comfortable-Friend96
reddit
Mönstret: Misstag blir dokumentation. Du lägger till en regel i CLAUDE.md och det händer aldrig igen.
Boris Cherny
twitter
Hybrid resonemangsläge är en räddare i nöden för felsökning av komplex async-logik där vanliga modeller bara fastnar i loopar.
AsyncDev
hackernews
Prismässigt i paritet med 3.5 Sonnet gör detta till en enkel uppgradering för alla våra produktions-agent-pipelines.
StartupFounder2025
reddit

Videor om Claude Sonnet 4.5

Se handledningar, recensioner och diskussioner om Claude Sonnet 4.5

Den här nya 4.5 Sonnet-modellen presterar bättre än till och med Opus 4.1 på Swaybench verified-testet

Den lyckades bibehålla fokus i över 30 timmar på komplexa uppgifter i flera steg

Den leder OS World computer use-benchmark med ett resultat på 61,4 procent

Den interna resonemangsmotorn hanterar Python-miljöer med betydligt högre stabilitet än 3.5

Terminalintegrationen känns mycket tätare med nästan noll hallucinerade shell-kommandon

Sonnet 4.5 leder nu inom agentic tool use... ett hopp på 20 procent, vilket är väldigt spännande

Claude code med Sonnet 4.5 slutförde hela Stripe-implementeringen på 15 minuter

Claude Sonnet 4.5 var mycket snabbare och märkbart bättre

Thinking-reglaget gör att du kan lägga mer compute på specifika kodblock

Den behåller context perfekt även när du är 150 000 tokens in i ett massivt projekt

Det är den bäst presterande modellen någonsin när den styr din dator

Minskning av felmarginaler för kodning från 9 procent till i princip noll

Claude imagine är kanske den coolaste funktionen... en app-byggarupplevelse i realtid

MCP-integrationen gör att den kan söka efter verktyg utan att äta upp din prompt-context

Vision-latensen är avsevärt reducerad vid analys av komplexa UI-layouter

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Claude Sonnet 4.5

Experttips for att hjalpa dig fa ut det mesta av Claude Sonnet 4.5 och uppna battre resultat.

Aktivera MCP Tool Search

Använd Model Context Protocol Tool Search för att minska användningen av context med 85 procent och lämna utrymme för aktiva filer.

Utnyttja Agentic Checkpoints

Använd kommandot /checkpoint i terminalgränssnitt för att spara framsteg innan större refaktoreringar för omedelbar återställning.

Context Budgeting

Rensa historiken mellan orelaterade uppgifter för att förhindra "context rot" och upprätthålla hög logisk precision.

Hierarki för system prompt

Definiera modellens persona och strikta output-begränsningar i en dedikerad konfigurationsfil för konsekvens mellan agenter.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Vanliga fragor om Claude Sonnet 4.5

Hitta svar pa vanliga fragor om Claude Sonnet 4.5