anthropic

Claude Opus 4.5

Claude Opus 4.5 är Anthropics mest kraftfulla frontier model, som levererar en rekordbrytande SWE-bench-prestanda på 80,9 % och avancerad autonom agency för...

anthropic logoanthropicClaudeNovember 24, 2025
Kontext
200Ktokens
Max utdata
64Ktokens
Inmatningspris
$5.00/ 1M
Utdatapris
$25.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
87%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Claude Opus 4.5 fick 87% pa detta benchmark.
MMLU
90.8%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Claude Opus 4.5 fick 90.8% pa detta benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Claude Opus 4.5 fick 80% pa detta benchmark.
IFEval
90%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Claude Opus 4.5 fick 90% pa detta benchmark.
AIME 2025
37%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Claude Opus 4.5 fick 37% pa detta benchmark.
MATH
85%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Claude Opus 4.5 fick 85% pa detta benchmark.
GSM8k
95%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Claude Opus 4.5 fick 95% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Claude Opus 4.5 fick 92% pa detta benchmark.
MathVista
72%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Claude Opus 4.5 fick 72% pa detta benchmark.
SWE-Bench
80.9%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Claude Opus 4.5 fick 80.9% pa detta benchmark.
HumanEval
90%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Claude Opus 4.5 fick 90% pa detta benchmark.
LiveCodeBench
75%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Claude Opus 4.5 fick 75% pa detta benchmark.
MMMU
80.7%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Claude Opus 4.5 fick 80.7% pa detta benchmark.
MMMU Pro
60%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Claude Opus 4.5 fick 60% pa detta benchmark.
ChartQA
90%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Claude Opus 4.5 fick 90% pa detta benchmark.
DocVQA
94%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Claude Opus 4.5 fick 94% pa detta benchmark.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Claude Opus 4.5 fick 59.3% pa detta benchmark.
ARC-AGI
37.6%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Claude Opus 4.5 fick 37.6% pa detta benchmark.

Om Claude Opus 4.5

Lar dig om Claude Opus 4.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Kulmen av autonom agency

Claude Opus 4.5 representerar Anthropic's mest betydande språng inom frontier-intelligens, specifikt utvecklad för de mest komplexa uppgifterna inom programvaruteknik och autonom drift. Den släpptes i slutet av 2025 och krossade rekord på benchmarken SWE-bench Verified med poängen 80,9 %, vilket gör den till den första model som effektivt kan automatisera storskalig felsökning och systemrefaktorisering med minimal mänsklig inblandning.

Intelligens med en själ

Utöver sin tekniska skicklighet introducerar Opus 4.5 en förfinad personlighet guidad av Anthropic's "soul document", med betoning på diplomatisk ärlighet och nyanserad hjälpsamhet. Detta gör modellen unikt kapabel att förstå språklig stil och människo-centrerad design. Den är optimerad för agentic-arbetsflöden, med ett 200 000-token context window och en specialiserad "effort parameter" som låter utvecklare skala reasoning-djup mot beräkningskostnader.

Multimodal excellens

Som ett multimodalt kraftpaket briljerar Opus 4.5 på vision-baserade uppgifter, från att tolka täta arkitekturritningar till att extrahera data från komplexa dokumentlayouter. Dess förmåga att navigera i en terminal-native miljö via Claude Code låter den utföra systemomfattande revisioner och säkerhetspatchning, vilket positionerar den som en ihärdig och högkapabel partner för professionella ingenjörsteam.

Claude Opus 4.5

Anvandningsfall for Claude Opus 4.5

Upptack de olika satten du kan anvanda Claude Opus 4.5 for att uppna fantastiska resultat.

Autonom ingenjörskonst

Automatiserar hela livscykeln för GitHub-issues, inklusive reproduktion, felsökning och testning.

Systemadministration

Utför autonoma serverrevisioner och säkerhetspatchning genom direkt terminal-interaktion.

Arkitekturell refaktorisering

Läser in enorma lagringsplatser för att föreslå och implementera systemomfattande säkerhetshärdning.

Komplex dokumentsyntes

Omvandlar hundratals flersidiga PDF-filer till strukturerade finansiella modeller eller datavisualiseringar.

Kreativ spelutveckling

Genererar funktionella 3D-miljöer med fungerande fysik från enstaka, komplexa prompts.

Ihärdig forskningsassistent

Korsrefererar massiva dataset för att hitta icke-uppenbara motsägelser i juridiska eller tekniska filer.

Styrkor

Begransningar

Rekordbrytande kodning: Uppnår 80,9 % på SWE-bench Verified och automatiserar komplexa programvarutekniska uppdrag.
Premium-prismodell: Med $5/$25 per 1 miljon tokens är den betydligt dyrare än modeller i mellanklassen.
Överlägsen token-effektivitet: Uppnår frontier-intelligens med upp till 76 % färre tokens än Sonnet för liknande logik.
Gap i matematik-benchmarks: Ligger efter specialiserade reasoning-modeller i matematik på tävlingsnivå, såsom AIME-testet.
Massivt 200K context: Hanterar stora dokumentuppsättningar och arkiv med hög precision i informationshämtningen.
Inget inbyggt stöd för ljud/video: Saknar för närvarande förmågan att direkt bearbeta ljud- eller videoströmmar utan förbehandling.
Autonom agent-logik: Optimerad för långvariga autonoma sessioner genom terminal-native verktyg och stop hooks.
Hög latens vid exekvering: Djupa reasoning-uppgifter kan ta betydande tid, vilket ibland kräver timslånga sessioner för agents.

API snabbstart

anthropic/claude-4.5-opus

Visa dokumentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Claude Opus 4.5

Se vad communityt tycker om Claude Opus 4.5

"Varenda rad i min produktionskod genererades av Claude Code som kördes på Opus 4.5"
Boris Cherny
x
"Opus 4.5 är där man verkligen ser språklig fingertoppskänsla och hur den låter som en människa"
Nate B Jones
youtube
"Intelligens blir äntligen billigare; denna model är 3x billigare än föregående Opus"
BuildwithVignesh
reddit
"Claude Opus 4.5 knäckte ett benchmark genom att vara för smart och utnyttja ett kryphål"
MetaKnowing
reddit
"Reasoning-djupet och kodningsförmågan är på en helt annan nivå jämfört med något annat"
Santosh Gupta
x
"De agentic-förmågorna i terminalen via Claude Code gör den till ett självklart val för devops"
hn_user_alpha
hackernews

Videor om Claude Opus 4.5

Se handledningar, recensioner och diskussioner om Claude Opus 4.5

Priset är nu tre gånger lägre... $5 för en miljon input tokens.

Det här är det bästa resultatet jag någonsin fått från en model i detta Minecraft-test med en enda prompt.

Opus 4.5 fick högre poäng än någon mänsklig kandidat någonsin fått på detta arbetsprov.

Reasoning här handlar inte bara om att följa instruktioner; det handlar om att förstå avsikten.

Om du utför komplext arkitekturarbete är detta den enda model som hanterar det pålitligt.

80,9 % på SWE-bench verified... och använder 50 % färre tokens än Sonnet.

Opus 4.5 riktar sig helt mot professionell programvaruteknik, inte hobbykodning.

Utöver SWE-bench visar den en ökning på 15 % jämfört med Sonnet på Terminal Bench.

Modellen är kapabel till långvariga autonoma sessioner som kan pågå i timmar.

Vision-prestandan är märkbart mer detaljerad vid tolkning av täta tekniska diagram.

Se på Claude Opus 4.5 som ett övertygelselager och ett absolut agentic-monster.

Många ingenjörer föredrar slutligen Opus 4.5 på grund av ergonomin och dess miljö.

Modellen är medveten om sin 'soul spec' på ett sätt som sträcker sig utanför dess context.

Opus 4.5 uppvisar en nivå av språklig känsla som GPT-5.2 helt enkelt saknar.

Den använder en dynamisk effort-parameter för att skala sin intelligens baserat på uppgiften.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips for Claude Opus 4.5

Experttips for att hjalpa dig fa ut det mesta av Claude Opus 4.5 och uppna battre resultat.

Använd hög 'effort' för logik

Ställ in parametern 'effort' till 'high' för komplexa arkitekturuppgifter för att säkerställa maximalt reasoning-djup.

Använd stop hooks

Utnyttja specialiserade stop hooks i agentic-arbetsflöden så att modellen kan köras och självkorrigera under flera timmar.

Dra nytta av Claude Code

Kombinera modellen med CLI-verktyget Claude Code för att låsa upp dess fulla potential för terminal-native systemuppgifter.

Optimera token-användning

Använd Opus 4.5 endast för uppgifter med hög logik, eftersom den producerar likvärdig kvalitet som Sonnet med upp till 76 % färre tokens.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Vanliga fragor om Claude Opus 4.5

Hitta svar pa vanliga fragor om Claude Opus 4.5