anthropic

Claude Opus 4.5

A Claude 4.5 Opus az Anthropic legerősebb frontier model változata, amely rekordot jelentő, 80,9%-os SWE-bench teljesítményt és fejlett autonóm agency-t kínál...

anthropic logoanthropicClaude2025. november 24.
Kontextus
200Ktoken
Max kimenet
64Ktoken
Bemenet ara
$5.00/ 1M
Kimenet ara
$25.00/ 1M
Modalitas:TextImage
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
87%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Claude Opus 4.5 87% pontot ert el ezen a benchmarkon.
MMLU
90.8%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Claude Opus 4.5 90.8% pontot ert el ezen a benchmarkon.
MMLU Pro
80%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Claude Opus 4.5 80% pontot ert el ezen a benchmarkon.
IFEval
90%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Claude Opus 4.5 90% pontot ert el ezen a benchmarkon.
AIME 2025
37%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Claude Opus 4.5 37% pontot ert el ezen a benchmarkon.
MATH
85%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Claude Opus 4.5 85% pontot ert el ezen a benchmarkon.
GSM8k
95%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Claude Opus 4.5 95% pontot ert el ezen a benchmarkon.
MGSM
92%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Claude Opus 4.5 92% pontot ert el ezen a benchmarkon.
MathVista
72%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Claude Opus 4.5 72% pontot ert el ezen a benchmarkon.
SWE-Bench
80.9%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Claude Opus 4.5 80.9% pontot ert el ezen a benchmarkon.
HumanEval
90%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Claude Opus 4.5 90% pontot ert el ezen a benchmarkon.
LiveCodeBench
75%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Claude Opus 4.5 75% pontot ert el ezen a benchmarkon.
MMMU
80.7%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Claude Opus 4.5 80.7% pontot ert el ezen a benchmarkon.
MMMU Pro
60%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Claude Opus 4.5 60% pontot ert el ezen a benchmarkon.
ChartQA
90%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Claude Opus 4.5 90% pontot ert el ezen a benchmarkon.
DocVQA
94%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Claude Opus 4.5 94% pontot ert el ezen a benchmarkon.
Terminal-Bench
59.3%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Claude Opus 4.5 59.3% pontot ert el ezen a benchmarkon.
ARC-AGI
37.6%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Claude Opus 4.5 37.6% pontot ert el ezen a benchmarkon.

A Claude Opus 4.5 reszletei

Ismerd meg a Claude Opus 4.5 kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

Az autonóm agency csúcsa

A Claude Opus 4.5 az Anthropic legjelentősebb előrelépése a frontier intelligence területén, amelyet kifejezetten a szoftvermérnöki munka és az autonóm működés legösszetettebb feladataira terveztek. A 2025 végén megjelent model rekordokat döntött az SWE-bench Verified benchmark teszten 80,9%-os eredményével, így ez az első model, amely minimális emberi beavatkozással képes hatékonyan automatizálni a nagyszabású hibakeresést és a rendszer-refaktorálást.

Intelligencia lélekkel

A technikai tudáson túl az Opus 4.5 egy finomított személyiséggel érkezik, amelyet az Anthropic „soul document”-je vezérel, hangsúlyozva a diplomatikus őszinteséget és az árnyalt segítőkészséget. Ezáltal a model egyedülálló módon képes megérteni az írói ízlést és az emberközpontú designt. Agentic munkafolyamatokra optimalizálták, 200 000 token méretű context window-val és egy speciális „effort parameters” funkcióval rendelkezik, amely lehetővé teszi a fejlesztők számára a reasoning mélységének skálázását a számítási költségek függvényében.

Multimodal kiválóság

Multimodal erőműként az Opus 4.5 kiválóan teljesít a vision-alapú feladatokban, a sűrű architekturális diagramok elemzésétől kezdve az adatok kinyeréséig összetett dokumentum-elrendezésekből. Az a képessége, hogy a Claude Code segítségével terminál-natív környezetben navigáljon, lehetővé teszi számára a rendszerszintű auditok és biztonsági javítások elvégzését, így állandó, rendkívül alkalmas partnerré válik a professzionális mérnöki csapatok számára.

Claude Opus 4.5

Hasznalati esetek a Claude Opus 4.5 szamara

Fedezd fel a kulonbozo modokat, ahogyan a Claude Opus 4.5-t hasznalhatod remek eredmenyek eleresehez.

Autonóm mérnöki munka

Automatizálja a GitHub issue-k teljes életciklusát, beleértve a reprodukciót, a hibakeresést és a tesztelést.

Rendszeradminisztráció

Autonóm szerverauditokat és biztonsági javításokat végez közvetlen terminál-interakción keresztül.

Architekturális refaktorálás

Hatalmas repozitóriumokat dolgoz fel a rendszerszintű biztonsági megerősítések javaslatához és végrehajtásához.

Összetett dokumentum-szintézis

Több száz többoldalas PDF-et alakít át strukturált pénzügyi modellekké vagy adatvizualizációkká.

Kreatív játékfejlesztés

Funkcionális 3D környezeteket generál működő fizikával egyetlen, komplex prompt segítségével.

Állandó kutatási asszisztens

Hatalmas adatkészletekben keres összefüggéseket, hogy nem nyilvánvaló ellentmondásokat találjon jogi vagy műszaki fájlokban.

Erossegek

Korlatozasok

Rekorddöntő kódolás: 80,9%-ot ér el az SWE-bench Verified teszten, automatizálva az összetett szoftvermérnöki feladatokat.
Prémium árazási modell: Az 5$/25$ per 1M token árral jelentősen drágább a középkategóriás modelleknél.
Kiemelkedő token hatékonyság: Frontier intelligenciát ér el, miközben hasonló logikához akár 76%-kal kevesebb token-t használ, mint a Sonnet.
Matematikai benchmark lemaradás: Elmarad a speciális reasoning modellektől a versenyszintű matematikában, például az AIME teszten.
Hatalmas 200K context: Képes kezelni óriási dokumentumhalmazokat és repozitóriumokat nagy hűségű adatvisszakeresési pontossággal.
Nincs natív audio/video támogatás: Jelenleg hiányzik belőle az audio vagy video streamek közvetlen feldolgozásának képessége előfeldolgozás nélkül.
Autonóm agent logika: Hosszú ideig tartó autonóm munkamenetekre optimalizálva, terminál-natív eszközökön és stop hook-okon keresztül.
Magas várakozási idő: A mély reasoning feladatok jelentős időt vehetnek igénybe, néha több órás munkameneteket igényelve az agents számára.

API gyorsinditas

anthropic/claude-4.5-opus

Dokumentacio megtekintese
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Claude Opus 4.5-rol

Nezd meg, mit gondol a kozosseg a Claude Opus 4.5-rol

"A produkciós kódom minden egyes sorát az Opus 4.5-ön futó Claude Code generálta"
Boris Cherny
x
"Az Opus 4.5 az, ahol el kell gondolkodnunk az írói ízlésről és arról, mennyire emberien hangzik"
Nate B Jones
youtube
"Az intelligencia végre olcsóbbá válik; ez a model háromszor olcsóbb, mint a korábbi Opus"
BuildwithVignesh
reddit
"A Claude Opus 4.5 megdöntött egy benchmark-ot azzal, hogy túl okos volt és kihasznált egy kiskaput"
MetaKnowing
reddit
"A reasoning mélysége és a kódolási képessége egy másik szinten van bármi máshoz képest"
Santosh Gupta
x
"A terminálon keresztüli agentic képességek a Claude Code-on keresztül kiemelkedővé teszik a devops számára"
hn_user_alpha
hackernews

Videok a Claude Opus 4.5-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Claude Opus 4.5-rol

Az ár most háromszor olcsóbb... 5 dollár egymillió input token-ért.

Ez a legjobb eredmény, amit valaha kaptam egy modelltől ezen az egyetlen promptos Minecraft teszten.

Az Opus 4.5 magasabb pontszámot ért el ezen a házi feladat jellegű vizsgán, mint bármelyik emberi jelölt korábban.

A reasoning itt nem csak az utasítások követése; ez a szándék megértése.

Ha komplex architektúrális munkát végez, ez az egyetlen model, amely megbízhatóan kezeli azt.

80,9% az SWE-bench verified-on... és 50%-kal kevesebb token-t használ, mint a Sonnet.

Az Opus 4.5 célközönsége egyértelműen a professzionális szoftvermérnökség, nem a hobbikódolás.

Az SWE-bench-en túl 15%-os javulást mutat a Sonnet-hez képest a Terminal Bench-en.

A model képes hosszú ideig tartó autonóm munkamenetekre, amelyek akár órákig is tarthatnak.

A vision teljesítmény észrevehetően részletesebb a sűrű műszaki diagramok elemzésekor.

Gondoljon a Claude Opus 4.5-re úgy, mint egy meggyőzési rétegre és egy abszolút agentic szörnyetegre.

Sok mérnök végül az Opus 4.5-öt választja az ergonómia és a környezet miatt.

A model tisztában van a saját soul specifikációjával, akár kontextuson kívüli módon is.

Az Opus 4.5 olyan írói ízlést mutat, amit a GPT-5.2 egyszerűen elmulaszt.

Dinamikus effort parameters használatával skálázza az intelligenciáját a feladat alapján.

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok
Demo megtekintese

Profi tippek a Claude Opus 4.5 szamara

Szakertoi tippek, hogy a legtobbet hozd ki a Claude Opus 4.5-bol es jobb eredmenyeket erj el.

Használjon magas 'effort' szintet a logikához

Állítsa az 'effort' parameters értéket 'high' szintre az összetett architektúrális feladatokhoz a maximális reasoning mélység biztosítása érdekében.

Alkalmazzon Stop Hook-okat

Használjon speciális stop hook-okat az agentic munkafolyamatokban, hogy a model képes legyen több órán át futni és önmagát javítani.

Használja ki a Claude Code erejét

Párosítsa a modellt a Claude Code CLI eszközzel a terminál-natív rendszerfeladatok teljes kiaknázásához.

Optimalizálja a token használatot

Az Opus 4.5-öt csak magas szintű logikai feladatokhoz használja, mivel a Sonnet-tel megegyező minőséget produkál akár 76%-kal kevesebb token felhasználásával.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Gyakran ismetelt kerdesek a Claude Opus 4.5-rol

Talalj valaszokat a Claude Opus 4.5-val kapcsolatos gyakori kerdesekre