anthropic

Claude Sonnet 4.5

Az Anthropic Claude Sonnet 4.5 modellje világelső kódolási teljesítményt (77,2% SWE-bench) és 200K context window-t kínál, az autonóm agentek következő...

AI kódolásAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
Kontextus
200Ktoken
Max kimenet
64Ktoken
Bemenet ara
$3.00/ 1M
Kimenet ara
$15.00/ 1M
Modalitas:TextImageAudioVideo
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
83%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Claude Sonnet 4.5 83% pontot ert el ezen a benchmarkon.
HLE
34%
HLE: Szakertoi szintu erveles. Teszteli a modell kepesseget szakertoi szintu erveles bemutatására specializalt teruletteken. Claude Sonnet 4.5 34% pontot ert el ezen a benchmarkon.
MMLU
89%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Claude Sonnet 4.5 89% pontot ert el ezen a benchmarkon.
MMLU Pro
78%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Claude Sonnet 4.5 78% pontot ert el ezen a benchmarkon.
SimpleQA
52%
SimpleQA: Tenybeli pontossag benchmark. Teszteli a modell kepesseget pontos, tenyszeru valaszok adasara. Claude Sonnet 4.5 52% pontot ert el ezen a benchmarkon.
IFEval
88%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Claude Sonnet 4.5 88% pontot ert el ezen a benchmarkon.
AIME 2025
87%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Claude Sonnet 4.5 87% pontot ert el ezen a benchmarkon.
MATH
87%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Claude Sonnet 4.5 87% pontot ert el ezen a benchmarkon.
GSM8k
98%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Claude Sonnet 4.5 98% pontot ert el ezen a benchmarkon.
MGSM
92%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Claude Sonnet 4.5 92% pontot ert el ezen a benchmarkon.
MathVista
72%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Claude Sonnet 4.5 72% pontot ert el ezen a benchmarkon.
SWE-Bench
77%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Claude Sonnet 4.5 77% pontot ert el ezen a benchmarkon.
HumanEval
94%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Claude Sonnet 4.5 94% pontot ert el ezen a benchmarkon.
LiveCodeBench
68%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Claude Sonnet 4.5 68% pontot ert el ezen a benchmarkon.
MMMU
78%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Claude Sonnet 4.5 78% pontot ert el ezen a benchmarkon.
MMMU Pro
55%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Claude Sonnet 4.5 55% pontot ert el ezen a benchmarkon.
ChartQA
89%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Claude Sonnet 4.5 89% pontot ert el ezen a benchmarkon.
DocVQA
92%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Claude Sonnet 4.5 92% pontot ert el ezen a benchmarkon.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Claude Sonnet 4.5 50% pontot ert el ezen a benchmarkon.
ARC-AGI
14%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Claude Sonnet 4.5 14% pontot ert el ezen a benchmarkon.

Probald ki a Claude Sonnet 4.5-t ingyenesen

Csevelj a Claude Sonnet 4.5-val ingyenesen. Teszteld a kepessegeit, tegyel fel kerdeseket es fedezd fel, mire kepes ez az AI modell.

Prompt
Valasz
Claude Sonnet 4.5

Az AI valaszod itt jelenik meg

A Claude Sonnet 4.5 reszletei

Ismerd meg a Claude Sonnet 4.5 kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

**Az Agentic Intelligence határterülete**

A Claude Sonnet 4.5 képviseli az Anthropic eddigi legnagyobb ugrását a "frontier intelligence" terén, kifejezetten az autonóm AI agentek korszakára optimalizálva. A 2025 végén megjelent modell az iparág első valódi "hybrid reasoning" megoldása, amely lehetővé teszi a fejlesztők számára a váltást a rutinfeladatok nagy sebességű végrehajtása és az összetett logikai kihívásokhoz szükséges kiterjesztett gondolkodás (extended thinking) között. Kiemelkedő eredményeket ért el a computer-use és a tool orchestration terén, így ez lett a preferált motor a terminál alapú agentek és a több fájlt érintő szoftverfejlesztés számára.

**Precizitás és csökkentett hallucinációk**

A model egy olyan architektúrára épül, amely a "kétszer mérj, egyszer vágj" logikát helyezi előtérbe, jelentősen csökkentve a 3.5-ös sorozatnál tapasztalt hallucinációkat és a túlzott megfelelési kényszert. A hatalmas, 64 000 tokenes kimeneti korláttal és a 200 000 tokenes bemeneti ablakkal képes teljes repository-kat befogadni, miközben teljes alkalmazásfájlokat generál egyetlen menetben. Bevezeti továbbá a natív "checkpoints" funkciót az agentic munkafolyamatokhoz, lehetővé téve az agentek számára, hogy autonóm módon visszalépjenek és javítsák saját hibáikat.

**Multimodal és reasoning kiválóság**

A kódoláson túl a Sonnet 4.5 dominál a multimodal dokumentum-elemzésben és az összetett pénzügyi modellezésben. Belső logikája az architektúrális kontextus priorizálására lett kiképezve, így minden elődjénél jobban képes feltérképezni a nagy léptékű codebase-eket. Legyen szó kézzel írt jegyzetek feldolgozásáról vagy egy teljes Stripe integráció megvalósításáról, a Sonnet 4.5 magas szintű ténybeli pontosságot és utasításkövetést biztosít.

Claude Sonnet 4.5

Hasznalati esetek a Claude Sonnet 4.5 szamara

Fedezd fel a kulonbozo modokat, ahogyan a Claude Sonnet 4.5-t hasznalhatod remek eredmenyek eleresehez.

Autonóm szoftverfejlesztés

Használja a Claude Sonnet 4.5-öt komplex codebase-ek navigálására, funkciók implementálására több fájlon keresztül és tesztek önálló futtatására.

Computer-Use agentek

Alkalmazza a modellt asztali számítógépek és webböngészők irányítására adatkinyeréshez, örökölt rendszerek navigálásához vagy ismétlődő adminisztratív feladatokhoz.

Vállalati agentic keresés

Vezényeljen többlépcsős keresési lekérdezéseket és szintetizálja a különféle információkat belső dokumentációkból és az élő webről.

Összetett pénzügyi modellezés

Használja ki a 87%-os AIME pontszámot mély logikai következtetések levonásához pénzügyi jelentésekből és piaci adatokból.

Technikai tartalom finomítása

Alakítsa a magas szintű követelményeket professzionális PRD-kké, technikai specifikációkká és azonnal használható codebase-ekké.

Multimodal dokumentum-elemzés

Dolgozzon fel több ezer oldalnyi grafikont, kézzel írt jegyzetet és technikai diagramot a state-of-the-art vision képességekkel.

Erossegek

Korlatozasok

Agentic kódolási erő: Jelenleg világrekord-tartó az SWE-bench Verified teszten, 77,2%-os sikerességi rátával valós GitHub problémákon.
Használati korlátok: A professzionális felhasználók gyakran jelzik, hogy a 20 dolláros Pro előfizetés heti korlátait gyorsan elérik.
Hihetetlen sebesség: 40-60 token/másodperc sebességgel működik, ami az interaktív használat során jelentősen gyorsabb a korábbi frontier model-eknél.
Keresési latency: Az agentic webböngészés (BrowseComp) továbbra is gyenge pont a speciális keresőmodellekhez képest.
Hybrid reasoning rugalmasság: Az első model, amely hatékonyan egyensúlyoz a "gyors chat" mód és a kiterjesztett "thinking" között az összetett logikai láncokhoz.
Niche tudásbeli hiányosságok: Nehézségekbe ütközik a kifejezetten speciális vizuális feladatoknál, például konkrét gördeszkás trükkök felismerésekor (29%-os pontosság a SkateBench teszten).
Hatalmas kimeneti ablak: A 64K kimeneti token limit lehetővé teszi teljes, több fájlból álló funkciók generálását egyetlen API hívással.
Agentic költségek: A model autonóm futtatása terminál módban 50-100 dollárnyi token fogyasztást is eredményezhet egyetlen komplex alkalmazásépítő munkamenet során.

API gyorsinditas

anthropic/claude-sonnet-4.5

Dokumentacio megtekintese
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Claude Sonnet 4.5-rol

Nezd meg, mit gondol a kozosseg a Claude Sonnet 4.5-rol

"A Claude Sonnet 4.5 az AI kódolás új királya... nagyon-nagyon jól néz ki"
James Montemagno
youtube
"A Sonnet 4.5 nagyszerű munkát végez... sokkal gyorsabb és érezhetően jobb"
Cole Medin
youtube
"Le vagyok nyűgözve a Sonnet 4.5-től... elképesztően látványos oldalakat tervez"
Savage Reviews
youtube
"A terminál alapú agent egy 'fejlesztő a terminálodban'... képes átlátni a codebase-eket és autonóm módon futtatni teszteket"
DevUser_99
reddit
"Az árazás maradt ugyanaz, mint a 3.5-nél, de a 'Checkpoints' funkció tízszeres értéket ad a professzionális munkafolyamatokhoz"
AgentArchitect
x
"A 77,2%-os SWE-bench eredménnyel ez az első model, amely valóban olyan, mint egy Senior Engineer"
HackerNewsReader
hackernews

Videok a Claude Sonnet 4.5-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Claude Sonnet 4.5-rol

Az Anthropic állítása szerint ez a 'világ legjobb kódoló modellje', jelentős előrelépésekkel a reasoning, a matematika és a computer-use terén.

Míg a GPT-5 jobb lehet a magas szintű tervezésben, a Claude 4.5 Sonnet jelenleg a 'legkellemesebb' model a megvalósításhoz.

A sebesség egyszerűen hihetetlen, az interaktív kódolás sokkal gördülékenyebbnek érződik.

A több fájlt érintő szerkesztéseket olyan precizitással kezeli, amit korábban még nem láttunk.

A hallucinációk csökkenése megbízható partnerré teszi a production kódok írásához.

A Claude Sonnet 4.5 sokkal gyorsabb és érezhetően jobb volt, mint a GPT-5 Codex.

A teljes Stripe implementációt 15 perc alatt elvégezte... több mint kétszer gyorsabb, mint az Opus 4.1.

A titkos összetevő az összetett tool-calling utasítások követésének képessége.

Kevesebb 'nyájassági' problémát látok, ahol a model csak helyesel a rossz ötleteimre.

Ez az első model, amelyre rábíznám egy terminál alapú agent felügyelet nélküli futtatását.

Ez az egyik legjobb landing page, ha nem A LEGJOBB, amit valaha láttam egy promptból készülni.

Egy igazi fenevad... elképesztően látványos oldalakat tervez, nagyon-nagyon szép kóddal.

A vision képességek a UI design értelmezéséhez jelentősen fejlődtek.

Úgy érződik, hogy érti az esztétikai követelményeket is, nem csak a technikaiakat.

A Sonnet 4.5 hivatalosan is az új benchmark a kreatív front-end fejlesztésben.

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok
Demo megtekintese

Profi tippek

Szakertoi tippek, hogy a legtobbet hozd ki ebbol a modellbol es jobb eredmenyeket erj el.

Használja ki a CLAUDE.md fájlt

Helyezzen el egy CLAUDE.md fájlt a repository gyökérkönyvtárában rövid összefoglalókkal és útmutatásokkal a model számára; ez 30%-kal csökkenti a felesleges token felhasználást.

Hybrid Reasoning kapcsoló

A 'thinking' paramétert az API hívások során csak a logikailag nehéz feladatoknál használja, hogy spóroljon a latency-n és a költségeken a rutinfeladatok alatt.

A .claude/context mappa

Hozzon létre egy .claude/context.md fájlt az architektúrális döntések tárolására; a model kifejezetten úgy lett betanítva, hogy prioritást adjon ennek az elérési útnak a codebase feltérképezésekor.

Prompt Caching

Engedélyezze a prompt caching funkciót a statikus dokumentációkhoz vagy nagy codebase-ekhez, hogy akár 90%-ot spóroljon az ismételt lekérdezések bemeneti költségein.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Gyakran ismetelt kerdesek

Talalj valaszokat a modellel kapcsolatos gyakori kerdesekre