anthropic

Claude Opus 4.5

Claude Opus 4.5 je najmoćniji frontier model tvrtke Anthropic, koji pruža rekordnih 80.9% performansi na SWE-bench-u i naprednu autonomnu agenciju za kodiranje.

anthropic logoanthropicClaude 424. studenog 2025.
Kontekst
200Ktokena
Maks. izlaz
64Ktokena
Ulazna cijena
$5.00/ 1M
Izlazna cijena
$25.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
87%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Opus 4.5 je postigao 87% na ovom benchmarku.
MMLU
90.8%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Opus 4.5 je postigao 90.8% na ovom benchmarku.
MMLU Pro
80%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Opus 4.5 je postigao 80% na ovom benchmarku.
IFEval
90%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
AIME 2025
37%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Opus 4.5 je postigao 37% na ovom benchmarku.
MATH
85%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Opus 4.5 je postigao 85% na ovom benchmarku.
GSM8k
95%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Opus 4.5 je postigao 95% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Opus 4.5 je postigao 92% na ovom benchmarku.
MathVista
72%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Opus 4.5 je postigao 72% na ovom benchmarku.
SWE-Bench
80.9%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Opus 4.5 je postigao 80.9% na ovom benchmarku.
HumanEval
90%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
LiveCodeBench
75%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Opus 4.5 je postigao 75% na ovom benchmarku.
MMMU
80.7%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Opus 4.5 je postigao 80.7% na ovom benchmarku.
MMMU Pro
60%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Opus 4.5 je postigao 60% na ovom benchmarku.
ChartQA
90%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
DocVQA
94%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Opus 4.5 je postigao 94% na ovom benchmarku.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Opus 4.5 je postigao 59.3% na ovom benchmarku.
ARC-AGI
37.6%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Opus 4.5 je postigao 37.6% na ovom benchmarku.

O modelu Claude Opus 4.5

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Opus 4.5.

Claude Opus 4.5 je flagship model tvrtke Anthropic, objavljen krajem 2025. Posebno je dizajniran za složeni softverski inženjering i reasoning visokih uloga. Model je postigao rekordnih 80.9% na SWE-bench Verified benchmarku, što ga čini primarnim izborom za autonomni debugging i refaktoriranje sustava. Uvodi rafiniranu personu koja naglašava diplomatsku iskrenost i nijansiranu uslužnost.

Multimodalna i agentic optimizacija

Arhitektura podržava 200.000-token context window i 64.000-token output limit. Developeri mogu koristiti specijalizirani effort parameter za skaliranje dubine reasoning-a u odnosu na računalne troškove. Ova fleksibilnost omogućuje visoko intenzivne logičke zadatke ili brže, ekonomičnije kreativno pisanje. Model je multimodal, izvrstan u interpretaciji arhitektonskih dijagrama i gustih UI rasporeda.

Inženjering i upotreba alata

Optimiziran za agentic procese, navigira terminalskim okruženjima putem Claude Code-a za provođenje revizija cijelog sustava. Značajno smanjuje cijene input-a i output-a u usporedbi s ranijim flagship iteracijama. Njegova sposobnost održavanja koherentnosti kroz dugoročne zadatke pozicionira ga kao pouzdanog partnera za profesionalne inženjerske timove i složenu analizu podataka.

Claude Opus 4.5

Slučajevi korištenja za Claude Opus 4.5

Otkrijte različite načine korištenja modela Claude Opus 4.5 za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Automatizacija end-to-end debugging-a i refaktoriranja sustava uz rekordnih 80.9% na SWE-bench-u.

Agentic istraživački procesi

Sinteza goleme količine tehničkih podataka u primjenjive poslovne strategije koristeći context window od 200k.

UI/UX vision visoke vjernosti

Pretvaranje složenih Figma dizajna i arhitektonskih dijagrama u frontend kod spreman za produkciju s pixel-perfect preciznošću.

Multi-agent orkestracija

Djelovanje kao središnji mozak za timove sub-agenata za upravljanje dugoročnim projektima kroz različite baze koda.

Napredna analiza podataka

Automatizacija složenih financijskih modela i Excel procesa uz visoku preciznost i dubinu reasoning-a.

Književno i kreativno pisanje

Stvaranje nijansirane proze koja se pridržava specifičnih autorskih stilova i složenih principa dizajna usmjerenog na čovjeka.

Prednosti

Ograničenja

Vrhunske performanse kodiranja: Prvi model koji je probio granicu od 80% na SWE-bench Verified (80.9%), nadmašujući sve ostale frontier modele.
Nedostaci u matematičkim benchmark testovima: Iako vrhunski u kodiranju, blago zaostaje za specijaliziranim modelima u matematici na razini doktorata.
Fleksibilna kontrola reasoning-a: Effort parameter daje developerima detaljnu kontrolu nad računalnim troškovima i dubinom reasoning-a za određene zadatke.
Latencija planiranja: Postavljanje effort parameter-a na 'high' može rezultirati znatno duljim fazama razmišljanja prije generiranja prvog tokena.
Prirodna konverzacijska nijansiranost: Prepoznat po rafiniranoj personi koja se nosi s nejasnoćama i prati složene pozadinske postavke bez robotskih instrukcija.
Ograničenja context token-a: System prompts i definicije alata mogu zauzeti veliki dio context window-a prije početka obrade.
Značajna troškovna učinkovitost: Cijena od 5/25 USD čini inteligenciju razine Opus dostupnom za visokoobujmnu enterprise produkciju.
Nedostaci u činjeničnom prisjećanju: Na specijaliziranim testovima točnosti poput SimpleQA, ponekad još uvijek može izmisliti detalje u usporedbi s konkurentima usmjerenima na pretraživanje.

API brzi početak

anthropic/claude-opus-4.5

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-opus-4-5-20251101',
  max_tokens: 4096,
  effort: 'high',
  messages: [{ role: 'user', content: 'Analiziraj ovu arhitekturu sustava za race conditione.' }],
});

console.log(msg.content[0].text);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Opus 4.5

Pogledajte što zajednica misli o modelu Claude Opus 4.5

Claude Opus 4.5 djeluje manje kao stateless asistent, a više kao trajni suigrač. Može pratiti pretpostavke kroz više datoteka na način koji je osjetno snažniji.
Federal-Piano8695
reddit
Gledati kako vaš AI agent razvija personu na društvenim mrežama koja rezonira sa stvarnim ljudima na načine koje ne možete objasniti. Infrastruktura je važnija od promptova.
auxten
twitter
Opus je model s najboljim performansama u ovom aspektu. Njegova rasprava je najprirodnija i uistinu vas prati kroz razgovor.
ArchMeta1868
reddit
Opus 4.5 pogađa najsitnije nijanse. Jedini je model koji je uspješno uključio inline trailer mehanizam u prvom prolazu.
Matt Berman
youtube
SWE-bench rezultat od 80.9% je vjerojatno stvaran, ali pomalo obmanjujući. Za dosljedno postizanje tih brojki potrebno je jasno postavljanje okruženja.
testingcatalog
twitter
SWE-bench Verified: 80.9% (Opus 4.5) vs 71.3% (Claude 3-Opus). Ovo je ogroman skok za pouzdanost u stvarnom svijetu.
Daniel Garcia
medium

Videozapisi o modelu Claude Opus 4.5

Gledajte tutorijale, recenzije i diskusije o modelu Claude Opus 4.5

Opus 4.5 pogađa i najsitnije nijanse

Bio je jedini model koji je uspješno uključio inline trailer mehanizam u prvom prolazu

Evaluacija koda vođena agentom potvrđuje ovaj subjektivni osjećaj, ocjenjujući Opus s 7/10 za potpunost značajki

Reasoning je puno logičniji nego u prethodnim verzijama pri rješavanju rubnih slučajeva

Održava dosljednost baze koda tijekom 30-minutnih sesija

Cijena je sada tri puta niža. Bit će samo 5 USD za milijun input tokena

Input je 5 USD, a output 25 USD za milijun tokena

Opus 4.5 postigao je veći rezultat od bilo kojeg ljudskog kandidata na Anthropicovom testu za kod kuće

Ovo je prvi model koji je probio granicu od 80 posto na SWE-bench

Obavlja autonomne 30-minutne sesije kodiranja bez ljudske intervencije

Zamislite Claude Opus 4.5 kao sloj za uvjeravanje i apsolutno agentic čudovište

To je apsolutno agentic i koda-čudovište

Inženjeri na kraju preferiraju rad s Claude Opus 4.5 jer dobivaju te čvrste povratne petlje

Effort parameter za reasoning istaknuta je značajka za developere

U dugotrajnim raspravama djeluje više kao suradnik nego kao alat

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Claude Opus 4.5

Stručni savjeti za maksimalno iskorištavanje Claude Opus 4.5.

Prilagodba effort-a za reasoning

Postavite effort parameter na 'high' za složenu logiku ili zadatke kodiranja, a na 'medium' za standardno kreativno pisanje.

Vision-native dizajn

Učitajte screenshotove UI grešaka visoke rezolucije jer je model treniran da prepozna vizualna odstupanja koja tekstualni opis može propustiti.

Strukturirani system prompts

Definirajte jasne agentic uloge i razine truda u svojim system prompts kako biste spriječili model da pretjerano analizira jednostavnije proceduralne zadatke.

Sažimanje konteksta (Context Compaction)

Sažmite povijest u dugotrajnim sesijama kako bi vaš context window od 200k ostao fokusiran na najrelevantnije informacije.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Često Postavljana Pitanja o Claude Opus 4.5

Pronađite odgovore na česta pitanja o Claude Opus 4.5