anthropic

Claude Sonnet 4.5

Claude Sonnet 4.5 kompanije Anthropic donosi vrhunsko kodiranje (77,2% SWE-bench) i 200K context window, optimizovan za sledeću generaciju autonomnih agenata.

AI kodiranjeAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29. septembar 2025.
Контекст
200Kтокена
Макс. излаз
64Kтокена
Улазна цена
$3.00/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
83%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Claude Sonnet 4.5 је постигао 83% на овом бенчмарку.
HLE
34%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Claude Sonnet 4.5 је постигао 34% на овом бенчмарку.
MMLU
89%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Claude Sonnet 4.5 је постигао 89% на овом бенчмарку.
MMLU Pro
78%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Claude Sonnet 4.5 је постигао 78% на овом бенчмарку.
SimpleQA
52%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Claude Sonnet 4.5 је постигао 52% на овом бенчмарку.
IFEval
88%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Claude Sonnet 4.5 је постигао 88% на овом бенчмарку.
AIME 2025
87%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Claude Sonnet 4.5 је постигао 87% на овом бенчмарку.
MATH
87%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Claude Sonnet 4.5 је постигао 87% на овом бенчмарку.
GSM8k
98%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Claude Sonnet 4.5 је постигао 98% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Claude Sonnet 4.5 је постигао 92% на овом бенчмарку.
MathVista
72%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Claude Sonnet 4.5 је постигао 72% на овом бенчмарку.
SWE-Bench
77%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Claude Sonnet 4.5 је постигао 77% на овом бенчмарку.
HumanEval
94%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Claude Sonnet 4.5 је постигао 94% на овом бенчмарку.
LiveCodeBench
68%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Claude Sonnet 4.5 је постигао 68% на овом бенчмарку.
MMMU
78%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Claude Sonnet 4.5 је постигао 78% на овом бенчмарку.
MMMU Pro
55%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Claude Sonnet 4.5 је постигао 55% на овом бенчмарку.
ChartQA
89%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Claude Sonnet 4.5 је постигао 89% на овом бенчмарку.
DocVQA
92%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Claude Sonnet 4.5 је постигао 92% на овом бенчмарку.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Claude Sonnet 4.5 је постигао 50% на овом бенчмарку.
ARC-AGI
14%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Claude Sonnet 4.5 је постигао 14% на овом бенчмарку.

О моделу Claude Sonnet 4.5

Сазнајте о могућностима, функцијама и начинима коришћења модела Claude Sonnet 4.5.

**Granica agentic inteligencije**

Claude 4.5 Sonnet predstavlja veliki napredak u frontier inteligenciji, optimizovan za eru autonomnih AI agenata. Objavljen krajem 2025. godine, to je model sa hybrid reasoning-om koji omogućava developerima da menjaju režime između brzog izvršavanja rutinskih zadataka i extended thinking-a za kompleksne logičke izazove. Vodi na benchmark-ovima za computer use i orkestraciju alata, što ga čini preferiranim motorom za agente na terminalu i softverski inženjering na više datoteka.

**Preciznost i smanjene halucinacije**

Arhitektura model-a daje prioritet logici i preciznosti, smanjujući dodvoravanje i halucinacije primećene u ranijim serijama. Sa limitom izlaza od 64.000 token-a i ulaznim prozorom od 200.000 token-a, može obraditi čitave repozitorijume dok generiše pune datoteke aplikacije u jednom prolazu. Uvodi native kontrolne tačke (checkpoints) za agentic radne tokove, omogućavajući sistemima da autonomno vrate stanje i isprave greške bez ljudske intervencije.

**Multimodalna i reasoning moć**

Izvan razvoja softvera, Sonnet 4.5 se ističe u multimodalnoj analizi dokumenata i finansijskom modeliranju. Njegova interna logika daje prioritet arhitektonskom kontekstu, omogućavajući mu da mapira sisteme velikih razmera efikasnije od prethodnika. Bilo da obrađuje rukom pisane beleške ili implementira API integracije, model održava visoku činjeničnu preciznost i strogo praćenje instrukcija kroz zadatke dugog trajanja.

Claude Sonnet 4.5

Случајеви употребе за Claude Sonnet 4.5

Откријте различите начине коришћења модела Claude Sonnet 4.5 за постизање одличних резултата.

Autonomni softverski inženjering

Upravljanje razvojem od početnih zahteva do automatizovanih commit-ova korišćenjem terminal interfejsa.

GUI automatizacija

Automatizacija web pretraživanja i unosa podataka u legacy aplikacije korišćenjem native mogućnosti computer use-a.

Multi-agent orkestracija

Delegiranje specijalizovanih zadataka pod-agentima kao što su recenzenti i graditelji unutar centralne petlje planiranja.

Kompleksno refaktorisanje koda

Re-arhitektura baza koda sa više datoteka uz održavanje konzistentnosti kroz 200.000 token-a aktivnog konteksta.

Nijansirana finansijska analiza

Analiza kvartalnih izveštaja i tabela uz pomoć vision funkcija radi identifikacije odstupanja i investicionih uvida.

Interaktivna vizuelizacija podataka

Generisanje dinamičkih grafikona iz kompleksnih skupova podataka korišćenjem ugrađenog izvršavanja koda i izgradnje u realnom vremenu.

Предности

Ограничења

Native Computer Use: Model komunicira sa operativnim sistemima putem pomeranja kursora i manipulacije GUI-jem sa 61,4 odsto preciznosti.
Nema native audio ulaz: Model ne može direktno da obrađuje audio datoteke kao native modalitet i zahteva eksterne alate za transkripciju.
Vrhunske performanse u kodiranju: Postiže 77,2 odsto na SWE-bench Verified, predvodeći sve ostale modele u rešavanju GitHub problema.
Cena reasoning token-a: Token-i korišćeni tokom internog extended thinking procesa se naplaćuju kao izlazni token-i, povećavajući cenu za kompleksne upite.
Horizontalni zadatak od 30 sati: Arhitektura omogućava 30 sati kontinuiranog autonomnog rada uz održavanje stanja i fokusa.
Latencija u Thinking režimu: Kada je aktiviran extended thinking, modelu može biti potrebno nekoliko minuta da obradi kompleksne arhitektonske planove.
Limit izlaza od 64K: Masivni kapacitet izlaza omogućava generisanje čitavih aplikativnih arhitektura u jednom API pozivu.
Varijacije u takmičarskoj matematici: Iako vodi u kodiranju, povremeno zaostaje za specijalizovanim modelima za reasoning u specifičnim benchmark-ovima takmičarskog programiranja.

АПИ брзи старт

anthropic/claude-4-5-sonnet

Погледај документацију
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Claude Sonnet 4.5

Погледајте шта заједница мисли о моделу Claude Sonnet 4.5

Claude 4.5 Sonnet je od danas dostupan svuda, najbolji model za kodiranje na svetu.
ClaudeOfficial
reddit
Ovo rešava jedan od najbolnijih problema skaliranja kod MCP podešavanja. Gledao sam kako kontekst isparava pre nego što je ikakav posao započet.
Simon Willison
twitter
Claude Code-Sonnet 4.5 je daleko ispred Gemini 3.0 Pro za kompleksne Docker refaktorizacije.
Comfortable-Friend96
reddit
Obrazac: Greške postaju dokumentacija. Dodate pravilo u CLAUDE.md i ono se nikada više ne ponavlja.
Boris Cherny
twitter
Hybrid reasoning režim spasava život pri debugovanju kompleksne async logike gde se regularni modeli samo vrte u krug.
AsyncDev
hackernews
Cenovna paritetnost sa 3.5 Sonnet čini ovo lakom nadogradnjom za sve naše produkcione agent cevovode.
StartupFounder2025
reddit

Видео снимци о моделу Claude Sonnet 4.5

Гледајте туторијале, рецензије и дискусије о моделу Claude Sonnet 4.5

Ovaj novi 4.5 Sonnet model nadmašuje čak i Opus 4.1 na Swaybench verified testu

Uspeo je da održi fokus duže od 30 sati na kompleksnim zadacima sa više koraka

Vodi na OS world computer use benchmark-u sa rezultatom od 61,4 odsto

Interni reasoning engine upravlja Python okruženjima sa mnogo većom stabilnošću nego 3.5

Integracija terminala deluje mnogo bolje uz skoro nula pogrešnih shell komandi

Sonnet 4.5 sada vodi u korišćenju agentic alata... skok od 20 odsto, što je zaista uzbudljivo

Claude code sa Sonnet 4.5 je završio celu Stripe implementaciju za 15 minuta

Claude Sonnet 4.5 je bio mnogo brži i primetno bolji

Thinking prekidač vam omogućava da dodelite više snage obrade određenim blokovima koda

Savršeno zadržava kontekst čak i kada ste 150.000 token-a duboko u masivnom projektu

To je model sa najboljim performansama ikada kada kontroliše vaš računar

Pad stope grešaka u kodiranju sa 9 odsto na skoro nulu

Claude imagine je možda najkul funkcija... iskustvo pravljenja aplikacija u realnom vremenu

MCP integracija mu omogućava da pretražuje alate bez trošenja vašeg prompt konteksta

Vision latencija je značajno smanjena pri analizi kompleksnih UI rasporeda

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Claude Sonnet 4.5

Stručni saveti za maksimalno iskorišćenje Claude Sonnet 4.5.

Aktivirajte MCP Tool Search

Koristite Model Context Protocol Tool Search da smanjite potrošnju konteksta za 85 odsto i ostavite prostora za aktivne datoteke.

Iskoristite Agentic Checkpoints

Koristite komandu /checkpoint u terminal interfejsima da sačuvate napredak pre velikih refaktorisanja radi trenutnog povratka na prethodno stanje.

Budžetiranje konteksta

Obrišite istoriju između nepovezanih zadataka kako biste sprečili „kontekstualno propadanje“ i održali visoku logičku preciznost.

Ierarhija system prompt-a

Definišite personu model-a i stroga ograničenja izlaza u posebnoj konfiguracionoj datoteci radi konzistentnosti među agentima.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Често Постављана Питања о Claude Sonnet 4.5

Пронађите одговоре на честа питања о Claude Sonnet 4.5