anthropic

Claude Opus 4.5

Claude Opus 4.5 je najmoćniji frontier model kompanije Anthropic, koji postiže rekordne performanse od 80,9% na SWE-bench i donosi napredne autonomne agentne...

anthropic logoanthropicClaudeNovember 24, 2025
Контекст
200Kтокена
Макс. излаз
64Kтокена
Улазна цена
$5.00/ 1M
Излазна цена
$25.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
87%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Claude Opus 4.5 је постигао 87% на овом бенчмарку.
MMLU
90.8%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Claude Opus 4.5 је постигао 90.8% на овом бенчмарку.
MMLU Pro
80%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Claude Opus 4.5 је постигао 80% на овом бенчмарку.
IFEval
90%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Claude Opus 4.5 је постигао 90% на овом бенчмарку.
AIME 2025
37%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Claude Opus 4.5 је постигао 37% на овом бенчмарку.
MATH
85%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Claude Opus 4.5 је постигао 85% на овом бенчмарку.
GSM8k
95%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Claude Opus 4.5 је постигао 95% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Claude Opus 4.5 је постигао 92% на овом бенчмарку.
MathVista
72%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Claude Opus 4.5 је постигао 72% на овом бенчмарку.
SWE-Bench
80.9%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Claude Opus 4.5 је постигао 80.9% на овом бенчмарку.
HumanEval
90%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Claude Opus 4.5 је постигао 90% на овом бенчмарку.
LiveCodeBench
75%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Claude Opus 4.5 је постигао 75% на овом бенчмарку.
MMMU
80.7%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Claude Opus 4.5 је постигао 80.7% на овом бенчмарку.
MMMU Pro
60%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Claude Opus 4.5 је постигао 60% на овом бенчмарку.
ChartQA
90%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Claude Opus 4.5 је постигао 90% на овом бенчмарку.
DocVQA
94%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Claude Opus 4.5 је постигао 94% на овом бенчмарку.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Claude Opus 4.5 је постигао 59.3% на овом бенчмарку.
ARC-AGI
37.6%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Claude Opus 4.5 је постигао 37.6% на овом бенчмарку.

О моделу Claude Opus 4.5

Сазнајте о могућностима, функцијама и начинима коришћења модела Claude Opus 4.5.

Vrhunac autonomnih agenata

Claude Opus 4.5 predstavlja najznačajniji skok u frontier inteligenciji kompanije Anthropic, specifično dizajniran za najsloženije zadatke u softverskom inženjeringu i autonomnom radu. Objavljen krajem 2025. godine, oborio je rekorde na SWE-bench Verified benchmarku sa rezultatom od 80,9%, čineći ga prvim modelom koji efikasno automatizuje debugging velikih razmera i refactoring sistema uz minimalnu ljudsku intervenciju.

Inteligencija sa dušom

Pored svoje tehničke moći, Opus 4.5 uvodi prefinjenu personu vođenu Anthropic-ovim "soul dokumentom", naglašavajući diplomatsku iskrenost i nijansiranu uslužnost. Ovo čini model jedinstveno sposobnim za razumevanje literarnog ukusa i dizajna usmerenog na čoveka. Optimizovan je za agentic tokove rada, poseduje context window od 200,000 tokens i specijalizovani "effort parameter" koji omogućava developerima da skaliraju dubinu za reasoning u odnosu na troškove izračunavanja.

Multimodalna izvrsnost

Kao multimodalna sila, Opus 4.5 briljira u vision zadacima, od raščlanjivanja gustih arhitektonskih dijagrama do izvlačenja podataka iz složenih rasporeda dokumenata. Njegova sposobnost navigacije u terminal-native okruženju putem Claude Code-a omogućava mu da obavlja revizije celog sistema i bezbednosne zakrpe, pozicionirajući ga kao upornog i visoko sposobnog partnera za profesionalne inženjerske timove.

Claude Opus 4.5

Случајеви употребе за Claude Opus 4.5

Откријте различите начине коришћења модела Claude Opus 4.5 за постизање одличних резултата.

Autonomni inženjering

Automatizuje ceo životni ciklus GitHub issues-a, uključujući reprodukciju, debugging i testiranje.

Sistemska administracija

Obavlja autonomne revizije servera i bezbednosne zakrpe putem direktne interakcije sa terminalom.

Arhitektonski refactoring

Prihvata masivne repozitorijume kako bi predložio i implementirao bezbednosno učvršćivanje na nivou celog sistema.

Sinteza složenih dokumenata

Transformiše stotine PDF-ova od više stranica u strukturirane finansijske modele ili vizuelizacije podataka.

Kreativni razvoj igara

Generiše funkcionalna 3D okruženja sa radnom fizikom iz pojedinačnih, složenih prompt-ova.

Uporni asistent za istraživanje

Upoređuje ogromne skupove podataka kako bi pronašao neočigledne kontradiktornosti u pravnim ili tehničkim fajlovima.

Предности

Ограничења

Rekordno kodiranje: Postiže 80,9% na SWE-bench Verified, automatizujući složene zadatke softverskog inženjeringa.
Premium model cena: Sa 5$/25$ na 1M tokens, značajno je skuplji od modela srednjeg nivoa.
Vrhunska efikasnost tokena: Dostiže frontier inteligenciju koristeći do 76% manje tokens od modela Sonnet za sličnu logiku.
Zaostatak u matematičkim benchmark-ovima: Zaostaje za specijalizovanim reasoning modelima u matematici na takmičarskom nivou, poput AIME testa.
Ogroman 200K Context: Obrađuje masivne setove dokumenata i repozitorijume sa visokom preciznošću pronalaženja informacija.
Nema izvorni audio/video: Trenutno mu nedostaje sposobnost direktne obrade audio ili video strimova bez prethodne obrade.
Logika autonomnih agenata: Optimizovan za dugotrajne autonomne sesije putem terminal-native alata i stop hooks-a.
Visoka latencija izvršavanja: Zadaci dubokog reasoning-a mogu potrajati značajno vreme, ponekad zahtevajući višečasovne sesije za agente.

АПИ брзи старт

anthropic/claude-4.5-opus

Погледај документацију
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Claude Opus 4.5

Погледајте шта заједница мисли о моделу Claude Opus 4.5

"Svaku pojedinačnu liniju mog koda u produkciji generisao je Claude Code koji radi na Opus 4.5"
Boris Cherny
x
"Opus 4.5 je mesto gde treba razmišljati o literarnom ukusu i o tome kako zvuči kao čovek"
Nate B Jones
youtube
"Inteligencija konačno postaje jeftinija; ovaj model je 3x jeftiniji od prethodnog Opusa"
BuildwithVignesh
reddit
"Claude Opus 4.5 je oborio benchmark tako što je bio previše pametan i iskoristio propust"
MetaKnowing
reddit
"Dubina reasoning-a i sposobnost kodiranja su na drugom nivou u poređenju sa bilo čim drugim"
Santosh Gupta
x
"Agentic mogućnosti na terminalu putem Claude Code-a čine ga izuzetnim za devops"
hn_user_alpha
hackernews

Видео снимци о моделу Claude Opus 4.5

Гледајте туторијале, рецензије и дискусије о моделу Claude Opus 4.5

Cena je sada tri puta manja... 5 dolara za milion ulaznih tokens.

Ovo je najbolji rezultat koji sam ikada dobio od modela na ovom testu za Minecraft sa jednim promptom.

Opus 4.5 je postigao bolji rezultat nego bilo koji ljudski kandidat ikada na ovom testu kod kuće.

Reasoning ovde nije samo praćenje uputstava; to je razumevanje namere.

Ako radite na složenoj arhitekturi, ovo je jedini model koji to pouzdano rešava.

80,9% na SWE-bench verified... i koristi 50% manje tokens od Sonnet-a.

Opus 4.5 je usmeren direktno na profesionalni softverski inženjering, a ne na hobi kodiranje.

Pored SWEBench-a, beleži rast od 15% u odnosu na Sonnet na Terminal Bench-u.

Model je sposoban za dugotrajne autonomne sesije koje mogu trajati satima.

Vision performanse su primetno detaljnije prilikom raščlanjivanja gustih tehničkih dijagrama.

Zamislite Claude Opus 4.5 kao sloj ubeđivanja i apsolutno agentic čudovište.

Mnogi inženjeri na kraju preferiraju Opus 4.5 zbog ergonomije i radnog okruženja.

Model je svestan svojih soul specifikacija na način van konteksta.

Opus 4.5 pokazuje nivo literarnog ukusa koji GPT-5.2 jednostavno promašuje.

Koristi dinamički effort parameter kako bi skalirao svoju inteligenciju na osnovu zadatka.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови
Pogledaj demo video

Pro Saveti za Claude Opus 4.5

Stručni saveti za maksimalno iskorišćenje Claude Opus 4.5.

Koristite High Effort za logiku

Podesite 'effort' parameter na 'high' za složene arhitektonske zadatke kako biste osigurali maksimalnu dubinu za reasoning.

Postavite Stop Hooks

Koristite specijalizovane stop hooks u agentic tokovima rada kako biste omogućili modelu da radi i samostalno se ispravlja tokom nekoliko sati.

Iskoristite Claude Code

Uparite model sa Claude Code CLI alatom kako biste otključali njegov puni potencijal za sistemske zadatke u terminalu.

Optimizujte upotrebu tokena

Koristite Opus 4.5 samo za visoko logičke zadatke, jer proizvodi ekvivalentan kvalitet kao Sonnet uz do 76% manje tokens.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Често Постављана Питања о Claude Opus 4.5

Пронађите одговоре на честа питања о Claude Opus 4.5