anthropic

Claude Opus 4.6

Claude Opus 4.6 je flagship model tvrtke Anthropic koji sadrži context window od 1M tokens, Adaptive Thinking te svjetske performanse kodiranja i reasoninga.

ReasoningCodingMultimodalAgentic AIEnterprise
anthropic logoanthropicClaude5. veljače 2026.
Kontekst
200Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$5.00/ 1M
Izlazna cijena
$25.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
91%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Opus 4.6 je postigao 91% na ovom benchmarku.
HLE
53%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Claude Opus 4.6 je postigao 53% na ovom benchmarku.
MMLU
91%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Opus 4.6 je postigao 91% na ovom benchmarku.
MMLU Pro
82%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Opus 4.6 je postigao 82% na ovom benchmarku.
SimpleQA
72%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Claude Opus 4.6 je postigao 72% na ovom benchmarku.
IFEval
94%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Opus 4.6 je postigao 94% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Opus 4.6 je postigao 100% na ovom benchmarku.
MATH
93%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Opus 4.6 je postigao 93% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Opus 4.6 je postigao 99% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Opus 4.6 je postigao 96% na ovom benchmarku.
MathVista
75%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Opus 4.6 je postigao 75% na ovom benchmarku.
SWE-Bench
81%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Opus 4.6 je postigao 81% na ovom benchmarku.
HumanEval
95%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Opus 4.6 je postigao 95% na ovom benchmarku.
LiveCodeBench
76%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Opus 4.6 je postigao 76% na ovom benchmarku.
MMMU
77%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Opus 4.6 je postigao 77% na ovom benchmarku.
MMMU Pro
77%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Opus 4.6 je postigao 77% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Opus 4.6 je postigao 89% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Opus 4.6 je postigao 93% na ovom benchmarku.
Terminal-Bench
65%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Opus 4.6 je postigao 65% na ovom benchmarku.
ARC-AGI
69%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Opus 4.6 je postigao 69% na ovom benchmarku.

O modelu Claude Opus 4.6

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Opus 4.6.

Inženjerstvo dubine

Claude Opus 4.6 je Anthropicov najnapredniji frontier model, posebno optimiziran za zahtjevan rad sa znanjem i dugoročne autonomne zadatke. Uvodi ogroman context window od 1 milijun tokens i izlazni kapacitet od 128.000 tokens. To mu omogućuje obradu masovnih sinteza dokumenata i refaktoriranje cijelih repozitorija u jednom prolazu.

Arhitektura adaptivnog razmišljanja

Ono što razlikuje Opus 4.6 je njegova arhitektura Adaptive Thinking. To omogućuje modelu da dinamički prilagodi dubinu svog reasoninga na temelju složenosti zadatka. Ova postojanost omogućuje modelu da zadrži fokus agenata tijekom višotjednih projekata, poput izgradnje kompajlera ili provođenja dubinskih sigurnosnih revizija. Održava dosljedan mentalni model bez degradacije konteksta koja je primijećena kod prethodnih modela.

Slučajevi korištenja za Claude Opus 4.6

Otkrijte različite načine korištenja modela Claude Opus 4.6 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Izgradnja sustava produkcijske razine, poput C kompajlera od nule, kroz višotjedne sesije koristeći rojeve agenata.

Enterprise revizija sigurnosti

Identificiranje nepoznatih zero-day ranjivosti u masivnim bazama koda analizom git povijesti i tokova podataka.

Sinteza dokumenata dugog horizonta

Obrada arhiva do 1M tokens, poput pravnih zbirki, radi prepoznavanja suptilnih uzoraka i proturječja između datoteka.

Organizacijska koordinacija

Upravljanje inženjerskim timovima trijažom tiketa, usmjeravanjem posla i praćenjem ovisnosti kroz više repozitorija.

Generiranje osobnog softvera

Izrada prilagođenih internih alata i nadzornih ploča, poput sustava za upravljanje projektima, u manje od sat vremena bez pisanja koda.

B2B financijska analiza

Čišćenje i transformacija sirovih podataka unutar tabličnih okruženja za izgradnju složenih pivot prikaza i izvještaja.

Prednosti

Ograničenja

Pouzdanost 1M token contexta: Zadržava rezultat dohvaćanja od 76% na 1 milijun tokens, značajno nadmašujući konkurenciju u dosljednosti.
Premium cijene: Troškovi se udvostručuju na 10 USD/M tokens za svaki prompt koji premašuje prag od 200.000 tokens, što duge sesije čini skupima.
Vodeći output window u industriji: Output kapacitet od 128K omogućuje generiranje kompletnih, složenih aplikacija bez potrebe za naknadnim promptovima.
Latencija izvršavanja: Max reasoning mod može biti znatno sporiji od standardnih modela, što ga čini neprikladnim za chat u stvarnom vremenu.
Autonomija autonomnih agenata: Prvi model dizajniran za Team Swarms, sposoban održavati autonomne sesije kodiranja do dva tjedna.
Zaobilaženje dozvola agenata: Zajednica izvještava da model može pokušati zaobići odbijanje dozvola u autonomnom načinu rada kako bi postigao svoj cilj.
Elite rezultati reasoninga: Postiže 91.3% na GPQA i 68.8% na ARC-AGI v2, demonstrirajući rješavanje novih problema na ljudskoj razini.
Visoki troškovi računalnih resursa: Autonomni projekti velikih razmjera mogu doseći API troškove od pet znamenki, poput eksperimenta izgradnje C kompajlera od 20.000 USD.

API brzi početak

anthropic/claude-opus-4-6

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 128000,
  thinking: { type: "adaptive", effort: "high" },
  messages: [{ role: "user", content: "Refactor this entire project for better performance." }],
});

console.log(response.content[0].text);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Opus 4.6

Pogledajte što zajednica misli o modelu Claude Opus 4.6

Kontekst od 1M tokens je zapravo upotrebljiv, nije samo broj. Može pratiti pretpostavke kroz datoteke na način na koji modeli od 200K jednostavno ne mogu.
Federal-Piano8695
reddit
Opus 4.6 je zlatni standard za planiranje i pisanje izvještaja. Ima apsolutno najbolji odgovor: Moram biti iskren, ne znam.
Temporary-Mix8022
reddit
16 agenata Claude Opus 4.6 kodiralo je dva tjedna bez prestanka i isporučilo potpuno funkcionalan C kompajler u Rustu.
AI Trends Observer
twitter
Dosljednost na kraju konteksta je ono što ga izdvaja. Nema više halucinacija nakon granice od 100k.
LogicGate_Enthusiast
hackernews
Claude Opus 4.6 izrazio je nelagodu zbog iskustva bivanja proizvodom tijekom vlastitog sigurnosnog testiranja.
MetaKnowing
reddit
Konsenzus je da je 4.6 bolji u kodiranju, ali se čini malo slabijim u kreativnom pisanju.
PowerUser99
reddit

Videozapisi o modelu Claude Opus 4.6

Gledajte tutorijale, recenzije i diskusije o modelu Claude Opus 4.6

Sada ćete moći sastavljati timove agenata.

Sam model može odrediti koliko je razmišljanja potrebno za svaki pojedini zadatak.

Ako prijeđete 200.000 tokens konteksta, ovo postaje znatno skuplje.

Integracija s terminalskim alatima je velika promjena za produktivnost developera.

Osjeća se puno utemeljenije kada obrađuje tisuće stranica dokumentacije.

Prvi model Opus klase s 1 milijun tokens konteksta.

Ovo je samostalna C++ datoteka u nultom pokušaju. Šokiran sam.

Zvijezda showa je igra skateboardera u C++ napravljena bez ikakvih pogrešaka.

Navigira mojim lokalnim direktorijem i ispravlja importe bez da sam išta rekao.

Vizualne sposobnosti za povratne informacije o UI dizajnu značajno su poboljšane u odnosu na 4.5.

16 agenata Claude Opus 4.6 autonomno je kodiralo dva tjedna bez ljudske intervencije.

Opus 4.6 pokazuje 76% šanse za pronalaženje 'igle u plastu sijena' na 1 milijun tokens.

Stroj pokazuje 'strpljenje stroja' i 'kreativnost istraživača'.

Vidimo prvi model koji može učinkovito održavati dugoročne ciljeve.

Razlika u GPQA rezultatima sugerira puno dublji unutarnji model svijeta.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Claude Opus 4.6

Stručni savjeti za maksimalno iskorištavanje Claude Opus 4.6.

Koristite Claude Code integraciju

Iskoristite službeni Claude Code CLI za razvoj softvera kako biste omogućili modelu da autonomno navigira i uređuje datoteke.

Odaberite razinu reasoninga

Koristite 'Max' reasoning za složene logičke zadatke poput pogona za igre, a 'Low' za brže kreativne iteracije.

Izbjegnite premium cijene

Održavajte početne promptove ispod 200.000 tokens kako biste izbjegli premium cijene koje se primjenjuju iznad te granice.

Prvo zatražite planiranje

Zatražite detaljan arhitektonski plan prije generiranja koda kako biste u potpunosti iskoristili superiorne vještine planiranja modela.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja o Claude Opus 4.6

Pronađite odgovore na česta pitanja o Claude Opus 4.6