anthropic

Claude Sonnet 4.5

Anthropic-ov Claude 4.5 Sonnet donosi vodeće rezultate u programiranju (77,2% na SWE-bench) uz context window od 200K, a optimizovan je za sledeću generaciju...

AI programiranjeAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 429. septembar 2025.
Контекст
200Kтокена
Макс. излаз
64Kтокена
Улазна цена
$3.00/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
83%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Claude Sonnet 4.5 је постигао 83% на овом бенчмарку.
HLE
34%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Claude Sonnet 4.5 је постигао 34% на овом бенчмарку.
MMLU
89%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Claude Sonnet 4.5 је постигао 89% на овом бенчмарку.
MMLU Pro
78%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Claude Sonnet 4.5 је постигао 78% на овом бенчмарку.
SimpleQA
52%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Claude Sonnet 4.5 је постигао 52% на овом бенчмарку.
IFEval
88%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Claude Sonnet 4.5 је постигао 88% на овом бенчмарку.
AIME 2025
87%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Claude Sonnet 4.5 је постигао 87% на овом бенчмарку.
MATH
87%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Claude Sonnet 4.5 је постигао 87% на овом бенчмарку.
GSM8k
98%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Claude Sonnet 4.5 је постигао 98% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Claude Sonnet 4.5 је постигао 92% на овом бенчмарку.
MathVista
72%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Claude Sonnet 4.5 је постигао 72% на овом бенчмарку.
SWE-Bench
77%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Claude Sonnet 4.5 је постигао 77% на овом бенчмарку.
HumanEval
94%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Claude Sonnet 4.5 је постигао 94% на овом бенчмарку.
LiveCodeBench
68%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Claude Sonnet 4.5 је постигао 68% на овом бенчмарку.
MMMU
78%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Claude Sonnet 4.5 је постигао 78% на овом бенчмарку.
MMMU Pro
55%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Claude Sonnet 4.5 је постигао 55% на овом бенчмарку.
ChartQA
89%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Claude Sonnet 4.5 је постигао 89% на овом бенчмарку.
DocVQA
92%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Claude Sonnet 4.5 је постигао 92% на овом бенчмарку.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Claude Sonnet 4.5 је постигао 50% на овом бенчмарку.
ARC-AGI
14%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Claude Sonnet 4.5 је постигао 14% на овом бенчмарку.

Isprobaj Claude Sonnet 4.5 besplatno

Razgovaraj sa Claude Sonnet 4.5 besplatno. Testiraj mogućnosti, postavljaj pitanja i istraži šta ovaj AI model može.

Промпт
Одговор
Claude Sonnet 4.5

Ваш АИ одговор ће се појавити овде

О моделу Claude Sonnet 4.5

Сазнајте о могућностима, функцијама и начинима коришћења модела Claude Sonnet 4.5.

**Frontier agentic inteligencije**

Claude Sonnet 4.5 predstavlja najznačajniji Anthropic-ov skok u "frontier intelligence", specifično optimizovan za eru autonomnih AI agenata. Objavljen krajem 2025. godine, to je prvi pravi model sa "hybrid reasoning" mogućnostima u industriji, koji omogućava programerima da biraju između brzog izvršavanja rutinskih zadataka i proširenog razmišljanja (extended thinking) za kompleksne logičke izazove. Model je značajno nadmašio prethodne benchmarke u korišćenju računara i orkestraciji alata, što ga čini preferiranim rešenjem za terminal-based agente i softversko inženjerstvo koje obuhvata više fajlova.

**Preciznost i smanjene halucinacije**

Model je izgrađen na arhitekturi koja prioritizuje logiku "dvaput meri, jednom seci", značajno smanjujući podilaženje korisniku i halucinacije koje su bile prisutne u seriji 3.5. Sa masivnim limitom od 64.000 output tokens i input window-om od 200.000 tokens, on može da obradi čitave repozitorijume dok generiše kompletne fajlove aplikacije u jednom prolazu. Takođe uvodi izvorne "checkpoints" za agentic radne procese, omogućavajući agentima da se vrate korak unazad i autonomno isprave sopstvene greške.

**Multimodal i Reasoning snaga**

Pored programiranja, Sonnet 4.5 dominira u multimodal analizi dokumenata i kompleksnom finansijskom modelovanju. Njegova interna logika je obučena da prioritizuje arhitektonski kontekst, omogućavajući mu da mapira velike codebase sisteme bolje od bilo kog prethodnika. Bilo da procesira rukom pisane beleške ili implementira punu Stripe integraciju, Sonnet 4.5 održava visok nivo činjenične tačnosti i preciznosti u praćenju instrukcija.

Claude Sonnet 4.5

Случајеви употребе за Claude Sonnet 4.5

Откријте различите начине коришћења модела Claude Sonnet 4.5 за постизање одличних резултата.

Autonomno softversko inženjerstvo

Koristite Claude Sonnet 4.5 za navigaciju kroz kompleksne codebase sisteme, implementaciju funkcionalnosti kroz više fajlova i nezavisno pokretanje testova.

Computer-Use agenti

Koristite model za kontrolu desktopa i web pretraživača radi ekstrakcije podataka, navigacije kroz legacy sisteme ili za ponavljajuće administrativne zadatke.

Enterprise Agentic pretraga

Orkestrirajte upite u više koraka i sintetišite raznorodne informacije iz interne dokumentacije i sa live weba.

Kompleksno finansijsko modelovanje

Iskoristite njegov AIME rezultat od 87% za duboke logičke dedukcije u finansijskim izveštajima i tržišnim podacima.

Rafiniranje tehničkog sadržaja

Pretvorite zahteve visokog nivoa u profesionalne PRD dokumente, tehničke specifikacije i codebase spreman za korišćenje.

Multimodal analiza dokumenata

Procesuirajte hiljade stranica grafikona, rukom pisanih beleški i tehničkih dijagrama uz state-of-the-art vision mogućnosti.

Предности

Ограничења

Agentic moć programiranja: Trenutni svetski rekorder na SWE-bench Verified benchmarku sa stopom uspešnosti od 77,2% na stvarnim GitHub problemima.
Ograničenja upotrebe: Professional korisnici često prijavljuju brzo dostizanje nedeljnih limita na Pro planu od 20 USD mesečno.
Neverovatna brzina: Radi brzinom od 40-60 tokens u sekundi, što ga čini značajno bržim od prethodnih frontier modela za interaktivnu upotrebu.
Latency pretrage: Agentic pretraživanje weba (BrowseComp) i dalje je slabija tačka u poređenju sa specijalizovanim modelima za pretragu.
Fleksibilnost Hybrid Reasoning-a: Prvi model koji efikasno balansira između "fast chat" režima i "extended thinking" opcije za kompleksne logičke lance.
Praznine u specifičnom znanju: Poteškoće sa visoko specijalizovanim vizuelnim zadacima, kao što je identifikacija specifičnih trikova na skejtbordu (29% preciznosti na SkateBench-u).
Masivan output window: Limit od 64K output tokens omogućava generisanje čitavih funkcionalnosti sa više fajlova u jednom API pozivu.
Agentic troškovi: Autonomno pokretanje modela u terminal modu može potrošiti 50-100 USD u tokens za jednu sesiju izgradnje kompleksne aplikacije.

АПИ брзи старт

anthropic/claude-sonnet-4.5

Погледај документацију
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Claude Sonnet 4.5

Погледајте шта заједница мисли о моделу Claude Sonnet 4.5

"Claude Sonnet 4.5 je novi kralj AI programiranja... izgleda zaista, zaista dobro"
James Montemagno
youtube
"Sonnet 4.5 radi odličan posao... bio je mnogo brži i primetno bolji"
Cole Medin
youtube
"Oduševljen sam Sonnet 4.5 modelom... dizajnira neke apsolutno zadivljujuće stranice"
Savage Reviews
youtube
"Terminal-based agent je kao 'programer koji živi u vašem terminalu'... može da čita codebase i autonomno pokreće testove"
DevUser_99
reddit
"Cene ostaju iste kao za 3.5, ali 'Checkpoints' funkcija ga čini 10 puta vrednijim za profesionalne radne procese"
AgentArchitect
x
"Sa 77,2% na SWE-bench-u, ovo je prvi model koji se zapravo oseća kao Senior Engineer"
HackerNewsReader
hackernews

Видео снимци о моделу Claude Sonnet 4.5

Гледајте туторијале, рецензије и дискусије о моделу Claude Sonnet 4.5

Anthropic tvrdi da je ovo 'najbolji model za kod na svetu' sa značajnim poboljšanjima u reasoning-u, matematici i korišćenju računara.

Iako GPT-5 možda bude bolji za planiranje na visokom nivou, Claude 4.5 Sonnet je trenutno 'najprijatniji' model za samu implementaciju.

Brzina je prosto neverovatna, interaktivno programiranje deluje mnogo fluidnije.

Savladao je izmene u više fajlova sa nivoom preciznosti koji do sada nismo videli.

Smanjenje halucinacija ga čini pouzdanim partnerom za produkcioni kod.

Claude Sonnet 4.5 je bio mnogo brži i primetno bolji od GPT-5 Codex-a.

Odradio je celu Stripe implementaciju za 15 minuta... više nego dvostruko brže od Opus 4.1 modela.

Sposobnost praćenja kompleksnih tool-calling instrukcija je njegova tajna formula.

Primećujem manje problema sa 'podilaženjem' (sycophancy) gde se model samo slaže sa mojim lošim idejama.

Ovo je prvi model kojem bih zaista verovao da pokreće terminal-based agenta bez nadzora.

Ovo je jedna od najboljih landing stranica, ako ne i NAJBOLJA koju sam ikada video napravljenu iz jednog prompta.

Apsolutna je zver... dizajnira neverovatne stranice sa zaista, zaista dobrim kodom.

Vision mogućnosti za interpretaciju UI dizajna su značajno unapređene.

Deluje kao da razume estetske zahteve, a ne samo tehničke.

Sonnet 4.5 je zvanično novi benchmark za kreativni front-end inženjering.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови
Pogledaj demo video

Pro Saveti

Stručni saveti koji će vam pomoći da izvučete maksimum iz ovog modela.

Iskoristite CLAUDE.md

Koristite CLAUDE.md fajl u korenu vašeg repozitorijuma kako biste modelu pružili kratke rezimee i smernice; ovo smanjuje nepotrebno trošenje tokens za 30%.

Prekidač za Hybrid Reasoning

Koristite 'thinking' parametar u svojim API pozivima samo za zadatke koji zahtevaju tešku logiku kako biste uštedeli na latency i troškovima tokom rutinskih operacija.

Folder .claude/context

Kreirajte .claude/context.md fajl za čuvanje arhitektonskih odluka; model je specifično obučen da prioritizuje ovu putanju za mapiranje codebase-a.

Prompt Caching

Omogućite prompt caching za statičnu dokumentaciju ili velike codebase repozitorijume kako biste uštedeli do 90% na troškovima inputa za ponovljene upite.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Често Постављана Питања

Пронађите одговоре на честа питања о овом моделу