anthropic

Claude Sonnet 4.5

Anthropicov Claude Sonnet 4.5 donosi vodeće svjetske performanse u programiranju (77,2% na SWE-bench benchmarku) i context window od 200K, optimiziran za...

AI programiranjeAgentic AIHibridni reasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
Kontekst
200Ktokena
Maks. izlaz
64Ktokena
Ulazna cijena
$3.00/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
83%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Sonnet 4.5 je postigao 83% na ovom benchmarku.
HLE
34%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Claude Sonnet 4.5 je postigao 34% na ovom benchmarku.
MMLU
89%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Sonnet 4.5 je postigao 89% na ovom benchmarku.
MMLU Pro
78%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Sonnet 4.5 je postigao 78% na ovom benchmarku.
SimpleQA
52%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Claude Sonnet 4.5 je postigao 52% na ovom benchmarku.
IFEval
88%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Sonnet 4.5 je postigao 88% na ovom benchmarku.
AIME 2025
87%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Sonnet 4.5 je postigao 87% na ovom benchmarku.
MATH
87%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Sonnet 4.5 je postigao 87% na ovom benchmarku.
GSM8k
98%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Sonnet 4.5 je postigao 98% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Sonnet 4.5 je postigao 92% na ovom benchmarku.
MathVista
72%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Sonnet 4.5 je postigao 72% na ovom benchmarku.
SWE-Bench
77%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Sonnet 4.5 je postigao 77% na ovom benchmarku.
HumanEval
94%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Sonnet 4.5 je postigao 94% na ovom benchmarku.
LiveCodeBench
68%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Sonnet 4.5 je postigao 68% na ovom benchmarku.
MMMU
78%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Sonnet 4.5 je postigao 78% na ovom benchmarku.
MMMU Pro
55%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Sonnet 4.5 je postigao 55% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Sonnet 4.5 je postigao 89% na ovom benchmarku.
DocVQA
92%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Sonnet 4.5 je postigao 92% na ovom benchmarku.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Sonnet 4.5 je postigao 50% na ovom benchmarku.
ARC-AGI
14%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Sonnet 4.5 je postigao 14% na ovom benchmarku.

Isprobaj Claude Sonnet 4.5 besplatno

Razgovaraj s Claude Sonnet 4.5 besplatno. Testiraj mogućnosti, postavljaj pitanja i istraži što ovaj AI model može.

Prompt
Odgovor
Claude Sonnet 4.5

Vaš AI odgovor će se pojaviti ovdje

O modelu Claude Sonnet 4.5

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Sonnet 4.5.

**Granica agentic inteligencije**

Claude Sonnet 4.5 predstavlja Anthropicov najznačajniji skok u "frontier intelligence", specifično optimiziran za eru autonomnih AI agenata. Lansiran krajem 2025., to je prvi pravi model s "hibridnim reasoningom" u industriji, koji razvojnim programerima omogućuje prebacivanje između brze izvedbe za rutinske zadatke i proširenog razmišljanja za složene logičke izazove. Značajno je nadmašio prethodne benchmarke u korištenju računala i orkestraciji alata, što ga čini preferiranim pokretačem za terminalske agente i softversko inženjerstvo u više datoteka.

**Preciznost i smanjene halucinacije**

Model je izgrađen na arhitekturi koja prioritizira logiku "dvaput mjeri, jednom sijeci", značajno smanjujući sycophancy i halucinacije viđene u seriji 3.5. S masivnim ograničenjem outputa od 64.000 tokens i input prozorom od 200.000 tokens, može obraditi čitave repozitorije dok generira aplikacijske datoteke pune duljine u jednom prolazu. Također uvodi izvorne "checkpoints" za agentic radne procese, omogućujući agentima da se vrate korak unatrag i autonomno ispravljaju vlastite pogreške.

**Multimodal i reasoning moć**

Osim programiranja, Sonnet 4.5 dominira u multimodalnoj analizi dokumenata i složenom financijskom modeliranju. Njegova interna logika trenirana je da daje prioritet arhitektonskom kontekstu, omogućujući mu mapiranje velikih baza kôda bolje od bilo kojeg prethodnika. Bez obzira na to obrađuje li rukom pisane bilješke ili implementira punu Stripe integraciju, Sonnet 4.5 održava visoku razinu činjenične točnosti i praćenja uputa.

Claude Sonnet 4.5

Slučajevi korištenja za Claude Sonnet 4.5

Otkrijte različite načine korištenja modela Claude Sonnet 4.5 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Koristite Claude Sonnet 4.5 za navigaciju kroz složene baze kôda, implementaciju značajki u više datoteka i samostalno pokretanje testova.

Agenti za korištenje računala

Implementirajte model za upravljanje radnom površinom i web preglednicima radi ekstrakcije podataka, navigacije kroz stare sustave ili ponavljajućih administrativnih zadataka.

Enterprise agentic pretraga

Organizirajte pretraživanja u više koraka i sintetizirajte raznorodne informacije iz interne dokumentacije i s weba uživo.

Složeno financijsko modeliranje

Iskoristite njegov AIME rezultat od 87% za duboke logičke zaključke o financijskim izvještajima i tržišnim podacima.

Dorađivanje tehničkog sadržaja

Pretvorite zahtjeve visoke razine u profesionalne PRD-ove, tehničke specifikacije i baze kôda spremne za korištenje.

Multimodalna analiza dokumenata

Obradite tisuće stranica grafikona, rukom pisanih bilješki i tehničkih dijagrama uz state-of-the-art vision mogućnosti.

Prednosti

Ograničenja

Agentic snaga programiranja: Trenutni svjetski rekorder na SWE-bench Verified s 77,2% uspješnosti na stvarnim GitHub problemima.
Ograničenja korištenja: Profesionalni korisnici često prijavljuju brzo dosezanje tjednih limita na Pro planu od 20 USD mjesečno.
Nevjerojatna brzina: Radi na 40-60 tokens u sekundi, što ga čini značajno bržim od prethodnih frontier modela za interaktivnu upotrebu.
Latency pretrage: Agentic pregledavanje weba (BrowseComp) i dalje je slaba točka u usporedbi sa specijaliziranim modelima za pretraživanje.
Fleksibilnost hibridnog reasoninga: Prvi model koji učinkovito balansira "brzi chat" način rada s "proširenim razmišljanjem" za složene logičke lance.
Rupe u specifičnom znanju: Muči se s visoko specijaliziranim vizualnim zadacima, poput identifikacije specifičnih trikova na skejtbordu (29% točnosti na SkateBenchu).
Ogroman output window: Ograničenje od 64K output tokens omogućuje generiranje čitavih značajki s više datoteka u jednom API pozivu.
Agentic troškovi: Autonomno pokretanje modela u terminalskom načinu rada može potrošiti 50-100 USD u tokens za jednu sesiju izgradnje složene aplikacije.

API brzi početak

anthropic/claude-sonnet-4.5

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Sonnet 4.5

Pogledajte što zajednica misli o modelu Claude Sonnet 4.5

"Claude Sonnet 4.5 je novi kralj AI programiranja... izgleda jako, jako dobro"
James Montemagno
youtube
"Sonnet 4.5 radi odličan posao... bio je puno brži i pristojno bolji"
Cole Medin
youtube
"Oduševljen sam sa Sonnetom 4.5... ovaj dizajnira neke apsolutno zapanjujuće stranice"
Savage Reviews
youtube
"Agent u terminalu je 'developer koji živi u vašem terminalu'... može čitati baze kôda i autonomno pokretati testove"
DevUser_99
reddit
"Cijene ostaju iste kao za 3.5, ali značajka 'Checkpoints' čini ga 10 puta vrjednijim za profesionalne radne procese"
AgentArchitect
x
"Sa 77,2% na SWE-benchu, ovo je prvi model koji se zapravo doima kao Senior Engineer"
HackerNewsReader
hackernews

Videozapisi o modelu Claude Sonnet 4.5

Gledajte tutorijale, recenzije i diskusije o modelu Claude Sonnet 4.5

Anthropic tvrdi da je ovo 'najbolji model za kôd na svijetu' sa značajnim poboljšanjima u reasoningu, matematici i korištenju računala.

Dok bi GPT-5 mogao biti bolji za planiranje na visokoj razini, Claude 4.5 Sonnet je trenutno 'najugodniji' model za implementaciju.

Brzina je nevjerojatna, zbog čega interaktivno programiranje djeluje puno fluidnije.

Obrađuje izmjene u više datoteka s razinom preciznosti koju dosad nismo vidjeli.

Smanjenje halucinacija čini ga pouzdanim partnerom za produkcijski kôd.

Claude Sonnet 4.5 je bio puno brži i pristojno bolji od GPT-5 Codexa.

Napravio je cijelu Stripe implementaciju u 15 minuta... više nego dvostruko brže od Opusa 4.1.

Sposobnost praćenja složenih uputa za pozivanje alata je njegova tajna formula.

Vidim manje problema sa 'sycophancy' ponašanjem gdje se model samo slaže s mojim lošim idejama.

Ovo je prvi model kojem bih zapravo povjerio da pokreće terminalskog agenta bez nadzora.

Ovo je jedna od najboljih landing stranica, ako ne i NAJBOLJA, koju sam ikada vidio kreiranu iz jednog prompta.

Apsolutna je zvijer... dizajnira neke doista zapanjujuće stranice s jako, jako dobrim kôdom.

Vision sposobnosti za interpretaciju UI dizajna su značajno nadograđene.

Osjeća se kao da razumije estetske zahtjeve, a ne samo tehničke.

Sonnet 4.5 je službeno novi benchmark za kreativni front-end inženjering.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti

Stručni savjeti koji će vam pomoći izvući maksimum iz ovog modela.

Iskoristite CLAUDE.md

Koristite CLAUDE.md datoteku u korijenu svog repozitorija kako biste modelu dali kratke sažetke i upute; ovo smanjuje rasipanje tokens za 30%.

Prekidač za hibridni reasoning

Koristite 'thinking' parametar u API pozivima samo za zadatke s puno logike kako biste uštedjeli na latencyju i troškovima tijekom rutinskih operacija.

Mapa .claude/context

Kreirajte .claude/context.md datoteku za pohranu arhitektonskih odluka; model je posebno treniran da prioritizira ovu putanju za mapiranje baze kôda.

Prompt Caching

Omogućite prompt caching za statičnu dokumentaciju ili velike baze kôda kako biste uštedjeli do 90% na input troškovima za ponovljene upite.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja

Pronađite odgovore na česta pitanja o ovom modelu