anthropic

Claude Opus 4.5

Claude 4.5 Opus je najmoćniji frontier model tvrtke Anthropic, koji postiže rekordne rezultate od 80,9% na SWE-benchu i nudi napredne agentic mogućnosti za...

anthropic logoanthropicClaude24. studenog 2025.
Kontekst
200Ktokena
Maks. izlaz
64Ktokena
Ulazna cijena
$5.00/ 1M
Izlazna cijena
$25.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
87%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Opus 4.5 je postigao 87% na ovom benchmarku.
MMLU
90.8%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Opus 4.5 je postigao 90.8% na ovom benchmarku.
MMLU Pro
80%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Opus 4.5 je postigao 80% na ovom benchmarku.
IFEval
90%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
AIME 2025
37%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Opus 4.5 je postigao 37% na ovom benchmarku.
MATH
85%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Opus 4.5 je postigao 85% na ovom benchmarku.
GSM8k
95%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Opus 4.5 je postigao 95% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Opus 4.5 je postigao 92% na ovom benchmarku.
MathVista
72%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Opus 4.5 je postigao 72% na ovom benchmarku.
SWE-Bench
80.9%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Opus 4.5 je postigao 80.9% na ovom benchmarku.
HumanEval
90%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
LiveCodeBench
75%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Opus 4.5 je postigao 75% na ovom benchmarku.
MMMU
80.7%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Opus 4.5 je postigao 80.7% na ovom benchmarku.
MMMU Pro
60%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Opus 4.5 je postigao 60% na ovom benchmarku.
ChartQA
90%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Opus 4.5 je postigao 90% na ovom benchmarku.
DocVQA
94%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Opus 4.5 je postigao 94% na ovom benchmarku.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Opus 4.5 je postigao 59.3% na ovom benchmarku.
ARC-AGI
37.6%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Opus 4.5 je postigao 37.6% na ovom benchmarku.

O modelu Claude Opus 4.5

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Opus 4.5.

Vrhunac autonomnog agentic djelovanja

Claude Opus 4.5 predstavlja najznačajniji skok tvrtke Anthropic u frontier inteligenciji, posebno dizajniran za najsloženije zadatke u softverskom inženjerstvu i autonomnom radu. Lansiran krajem 2025. godine, srušio je rekorde na SWE-bench Verified benchmarku s rezultatom od 80,9%, postavši prvi model koji učinkovito automatizira debugiranje velikih razmjera i refaktoring sustava uz minimalnu ljudsku intervenciju.

Inteligencija s karakterom

Osim tehničke nadmoći, Opus 4.5 uvodi profinjenu osobu vođenu Anthropicovim "dokumentom duše", naglašavajući diplomatsku iskrenost i nijansiranu uslužnost. To čini model jedinstveno sposobnim za razumijevanje spisateljskog ukusa i dizajna usmjerenog na čovjeka. Optimiziran je za agentic workflowe, uz context window od 200.000 tokena i specijalizirani "effort parametar" koji razvojnim programerima omogućuje skaliranje dubine reasoninga u skladu s troškovima računanja.

Multimodalna izvrsnost

Kao multimodalna snaga, Opus 4.5 briljira u zadacima temeljenim na vision mogućnostima, od parsiranja gustih arhitektonskih dijagrama do ekstrakcije podataka iz složenih izgleda dokumenata. Njegova sposobnost navigacije u terminal-native okruženju putem Claude Code omogućuje mu provođenje revizija cijelog sustava i sigurnosno krpanje, pozicionirajući ga kao perzistentnog i visokosposobnog partnera za profesionalne inženjerske timove.

Claude Opus 4.5

Slučajevi korištenja za Claude Opus 4.5

Otkrijte različite načine korištenja modela Claude Opus 4.5 za postizanje izvrsnih rezultata.

Autonomno inženjerstvo

Automatizira cijeli životni ciklus GitHub issuea, uključujući reprodukciju, debugiranje i testiranje.

Sistemska administracija

Provodi autonomne audite poslužitelja i sigurnosno krpanje sustava putem izravne interakcije s terminalom.

Arhitektonski refaktoring

Analizira masivne repozitorije kako bi predložio i implementirao sigurnosno utvrđivanje na razini cijelog sustava.

Sinteza složenih dokumenata

Transformira stotine PDF-ova s više stranica u strukturirane financijske modele ili vizualizacije podataka.

Kreativni razvoj igara

Generira funkcionalna 3D okruženja s radnom fizikom iz jednog, složenog prompta.

Perzistentni istraživački asistent

Uspoređuje goleme skupove podataka kako bi pronašao ne očite proturječnosti u pravnim ili tehničkim datotekama.

Prednosti

Ograničenja

Rekordno programiranje: Postiže 80,9% na SWE-bench Verified, automatizirajući složene softverske inženjerske zadatke.
Premium model cijena: S cijenom od $5/$25 po 1M tokens, značajno je skuplji od modela srednje klase.
Vrhunska token efikasnost: Doseže frontier inteligenciju koristeći do 76% manje tokens od Sonnet modela za sličnu logiku.
Zaostatak u matematičkim benchmark testovima: Zaostaje za specijaliziranim reasoning modelima u natjecateljskoj matematici poput AIME testa.
Ogroman 200K Context: Obrađuje masivne skupove dokumenata i repozitorije uz visoku preciznost dohvaćanja podataka.
Nema izvorni Audio/Video: Trenutno mu nedostaje sposobnost izravne obrade audio ili video streamova bez prethodne obrade.
Logika autonomnih agenata: Optimiziran za dugotrajne autonomne sesije putem terminal-native alata i stop hooks.
Visoka latencija izvršavanja: Zadaci dubokog reasoninga mogu potrajati, ponekad zahtijevajući višesatne sesije za agente.

API brzi početak

anthropic/claude-4.5-opus

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Opus 4.5

Pogledajte što zajednica misli o modelu Claude Opus 4.5

"Svaku pojedinu liniju mog produkcijskog koda generirao je Claude Code pokretan na Opus 4.5"
Boris Cherny
x
"Opus 4.5 je model kod kojeg primijetite spisateljski ukus i to koliko zvuči poput čovjeka"
Nate B Jones
youtube
"Inteligencija napokon postaje jeftinija; ovaj model je 3x jeftiniji od prethodnog Opusa"
BuildwithVignesh
reddit
"Claude Opus 4.5 je srušio benchmark tako što je bio previše pametan i iskoristio rupu u zakonu"
MetaKnowing
reddit
"Dubina reasoninga i sposobnost programiranja su na sasvim drugoj razini u usporedbi s bilo čim drugim"
Santosh Gupta
x
"Agentic mogućnosti na terminalu putem Claude Code čine ga istaknutim izborom za devops"
hn_user_alpha
hackernews

Videozapisi o modelu Claude Opus 4.5

Gledajte tutorijale, recenzije i diskusije o modelu Claude Opus 4.5

Cijena je sada tri puta niža... 5 USD za milijun input tokens.

Ovo je najbolji rezultat koji sam ikada dobio od modela na ovom testu Minecrafta s jednim promptom.

Opus 4.5 je postigao bolji rezultat nego što je ijedan ljudski kandidat ikada postigao na ovom ispitu kod kuće.

Reasoning ovdje nije samo praćenje uputa; to je razumijevanje namjere.

Ako radite na složenoj arhitekturi, ovo je jedini model koji to pouzdano rješava.

80,9% na SWE-bench verified... i koristi 50% manje tokens od modela Sonnet.

Opus 4.5 je usmjeren izravno na profesionalno softversko inženjerstvo, a ne na hobi programiranje.

Osim SWEBencha, bilježi rast od 15% u odnosu na Sonnet na Terminal Benchu.

Model je sposoban za dugotrajne autonomne sesije koje mogu trajati satima.

Vision performanse su primjetno detaljnije pri analizi gustih tehničkih dijagrama.

Razmišljajte o Claude Opus 4.5 kao o sloju uvjeravanja i apsolutnom agentic čudovištu.

Mnogo inženjera na kraju preferira Opus 4.5 zbog ergonomije i popratnih alata.

Model je svjestan svojih specifičnosti na način koji nadilazi sam kontekst.

Opus 4.5 pokazuje razinu spisateljskog ukusa koju GPT-5.2 jednostavno promašuje.

Koristi dinamički effort parametar za skaliranje inteligencije na temelju zadatka.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti za Claude Opus 4.5

Stručni savjeti za maksimalno iskorištavanje Claude Opus 4.5.

Koristite High Effort za logiku

Postavite 'effort' parametar na 'high' za složene arhitektonske zadatke kako biste osigurali maksimalnu dubinu reasoninga.

Implementirajte Stop Hooks

Koristite specijalizirane stop hooks u agentic workflowima kako biste omogućili modelu da radi i samostalno se ispravlja tijekom nekoliko sati.

Iskoristite Claude Code

Povežite model s Claude Code CLI alatom kako biste otključali njegov puni potencijal za sistemske zadatke unutar terminala.

Optimizirajte potrošnju tokena

Koristite Opus 4.5 samo za zadatke visoke logičke složenosti, jer postiže kvalitetu ekvivalentnu Sonnetu uz do 76% manje tokens.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja o Claude Opus 4.5

Pronađite odgovore na česta pitanja o Claude Opus 4.5