anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 nudi vrhunske performanse za kodiranje i computer use uz masivan context window od 1M tokens za samo 3 USD na 1 milijun tokens.

Agentic AIMultimodalKodiranjeComputer UseDugi kontekst
anthropic logoanthropicClaude 417. veljače 2026.
Kontekst
1.0Mtokena
Maks. izlaz
64Ktokena
Ulazna cijena
$3.00/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
89.9%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Sonnet 4.6 je postigao 89.9% na ovom benchmarku.
HLE
49%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Claude Sonnet 4.6 je postigao 49% na ovom benchmarku.
MMLU
89.3%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Sonnet 4.6 je postigao 89.3% na ovom benchmarku.
MMLU Pro
79.2%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Sonnet 4.6 je postigao 79.2% na ovom benchmarku.
SimpleQA
48.5%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Claude Sonnet 4.6 je postigao 48.5% na ovom benchmarku.
IFEval
89.5%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Sonnet 4.6 je postigao 89.5% na ovom benchmarku.
AIME 2025
83%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Sonnet 4.6 je postigao 83% na ovom benchmarku.
MATH
85.3%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Sonnet 4.6 je postigao 85.3% na ovom benchmarku.
GSM8k
96.4%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Sonnet 4.6 je postigao 96.4% na ovom benchmarku.
MGSM
92.8%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Sonnet 4.6 je postigao 92.8% na ovom benchmarku.
MathVista
68.7%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Sonnet 4.6 je postigao 68.7% na ovom benchmarku.
SWE-Bench
79.6%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Sonnet 4.6 je postigao 79.6% na ovom benchmarku.
HumanEval
92.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Sonnet 4.6 je postigao 92.1% na ovom benchmarku.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Sonnet 4.6 je postigao 72.4% na ovom benchmarku.
MMMU
74.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Sonnet 4.6 je postigao 74.2% na ovom benchmarku.
MMMU Pro
75.6%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Sonnet 4.6 je postigao 75.6% na ovom benchmarku.
ChartQA
88.1%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Sonnet 4.6 je postigao 88.1% na ovom benchmarku.
DocVQA
93.4%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Sonnet 4.6 je postigao 93.4% na ovom benchmarku.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Sonnet 4.6 je postigao 59.1% na ovom benchmarku.
ARC-AGI
58.3%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Sonnet 4.6 je postigao 58.3% na ovom benchmarku.

O modelu Claude Sonnet 4.6

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Sonnet 4.6.

Agentic inteligencija visokih performansi

Claude Sonnet 4.6 je najsvestraniji Anthropicov model, dizajniran da djeluje kao primarni motor za složene poslovne tijekove rada i autonomne agente. Objavljen 17. veljače 2026., uvodi mogućnosti computer use-a na ljudskoj razini i context window od 1 milijun tokens. Arhitektura modela uravnotežuje brzinu sustava srednje klase s dubinom reasoninga koja je obično rezervirana za Opus klasu, čineći ga održivim izborom za produkcijska okruženja visokog intenziteta.

Adaptive Thinking i multimodalnost

U svojoj tehničkoj jezgri, Sonnet 4.6 koristi mehanizam Adaptive Thinking. To omogućuje razvojnim inženjerima da skaliraju unutarnji napor reasoninga na temelju specifičnih zahtjeva zadatka, optimizirajući ga ili za latency ispod sekunde ili za duboku logičku provjeru. Model je nativno multimodal, nudeći performanse najviše razine u obradi teksta, slika visoke rezolucije i audio datoteka. Izvrstan je u tumačenju guste tehničke dokumentacije i složenih vizualnih podataka, kao što su arhitektonski nacrti ili financijski grafikoni.

Industrijski standard za kodiranje

S rekordnih 79,6% na SWE-bench Verified, Sonnet 4.6 postao je zadani izbor za automatizaciju softverskog inženjeringa. Njegova sposobnost rezoniranja kroz goleme baze koda unutar svog 1M kontekstualnog prozora omogućuje mu rješavanje bugova u više datoteka i planiranje arhitektonskih refaktoriranja uz minimalnu ljudsku intervenciju. Nudeći inteligenciju blisku Opus razini po cijeni od 3 USD na milijun ulaznih tokens, uklanja financijske barijere koje su se prethodno povezivale s implementacijom istinski autonomnih AI sustava.

Claude Sonnet 4.6

Slučajevi korištenja za Claude Sonnet 4.6

Otkrijte različite načine korištenja modela Claude Sonnet 4.6 za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Rješavanje složenih GitHub problema u više datoteka i izvođenje refaktoriranja cijelih repozitorija koristeći preciznost od 79,6% na SWE-benchu.

Computer use na ljudskoj razini

Izravna navigacija računalnim softverom i web sučeljima za izvršavanje administrativnih zadataka u više koraka bez prilagođenih API integracija.

Analiza dokumenata velikih razmjera

Istovremeni pregled tisuća stranica pravnih ugovora ili istraživačkih radova unutar context window-a od 1 milijun tokens.

Financijska inteligencija i prognoziranje

Obrada izvještaja o zaradama i kvartalnih izvješća radi prepoznavanja suptilnih tržišnih anomalija pomoću visoko intenzivnog adaptive reasoninga.

Multimodalna tehnička podrška

Tumačenje složenih tehničkih dijagrama, fotografija tiskanih pločica i audio zapisa radi pružanja preciznih koraka za otklanjanje poteškoća.

Agentic poslovna strategija

Planiranje i izvršavanje dugoročnih operacija iskorištavanjem vrhunskih rezultata na benchmarkovima temeljenim na strategiji i logici.

Prednosti

Ograničenja

Vrhunska preciznost kodiranja: Postavlja industrijski standard sa 79,6% na SWE-bench Verified, nadmašujući sve ostale modele srednje klase i većinu flagship modela.
Nedostatak izvornog video unosa: Zahtijeva ručnu ekstrakciju okvira za vizualnu obradu video datoteka, što povećava složenost radnih procesa s medijima.
Neponovljiv kapacitet konteksta: Context window od 1 milijun tokens omogućuje unos čitavih tehničkih knjižnica ili golemih baza koda bez pada performansi.
Povećan latency reasoninga: Korištenje adaptive reasoninga visokog napora značajno povećava time-to-first-token u usporedbi sa standardnim inference procesom.
Autonomni computer use: Postiže rezultat od 72,5% na OSWorldu, omogućujući modelu navigaciju složenim GUI-jima i softverskim alatima kao virtualni operater.
Visoki troškovi izlaznog reasoninga: Iako je cijena unosa konkurentna, zadaci reasoninga s maksimalnim naporom mogu potrošiti veliku količinu izlaznih tokens, povećavajući troškove.
Optimiziran omjer cijene i performansi: Pruža razinu inteligencije blisku Opus modelu uz 1/5 troška, što ga čini najekonomičnijim izborom za implementaciju agentic sustava velikih razmjera.
Šum u dohvaćanju konteksta: Pri dosezanju limita od 1M tokens, model povremeno može patiti od smanjene usredotočenosti ako je kontekst ispunjen nevažnim podacima.

API brzi početak

anthropic/claude-sonnet-4-6

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analiziraj ovaj repozitorij u potrazi za arhitektonskim uskim grlima." }
  ],
});

console.log(response.content[0].text);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Sonnet 4.6

Pogledajte što zajednica misli o modelu Claude Sonnet 4.6

Kontekst je šum. Veći token prozori su zamka. Agentima dajte samo uski, odabrani signal koji im treba.
Logical-Storm-1180
reddit
Ovo je Claude Sonnet 4.6: naš dosad najsposobniji Sonnet model. To je potpuna nadogradnja u kodiranju, computer use-u i planiranju agenata.
Claude
twitter
Omjer performansi i cijene modela Claude Sonnet 4.6 je izvanredan; teško je precijeniti koliko se brzo ti modeli razvijaju.
Replit
youtube
Sonnet 4.6 je sada dostupan u Claude Code. Jeftiniji je od Opus 4.6 i približava se inteligenciji Opus klase.
Boris Cherny
twitter
Claude 4.6 je novi lider u agentic performansama, malo ispred Opus 4.6 u zadacima rada sa znanjem u stvarnom svijetu.
Artificial Analysis
twitter
Činjenica da ovaj model može navigirati računalnim sučeljem s 72% točnosti u osnovi dokida potrebu za većinom prilagođenih API-ja.
DevOpsGuru
hackernews

Videozapisi o modelu Claude Sonnet 4.6

Gledajte tutorijale, recenzije i diskusije o modelu Claude Sonnet 4.6

Sonnet 4.6 je stigao i mogao bi zamijeniti Opus u 90% onoga što svakodnevno radite.

Ali najbolji dio je što je 40% jeftiniji od korištenja Opus 4.6.

SWE-bench rezultati su zapravo nevjerojatni za model srednje klase.

Možete mu učinkovito dati cijeli repozitorij koda i neće izgubiti nit.

Adaptive thinking napor vam omogućuje zamjenu brzine za dublju logiku.

Rani korisnici izvještavaju da je sposoban za performanse gotovo nalik ljudskim pri složenoj manipulaciji proračunskim tablicama.

Ovaj model je otprilike dvostruko brži u usporedbi s Opusom.

Context window od 1 milijun tokens je trenutno u beta fazi, ali radi vrlo dobro.

Navigira softverskim sučeljima bez potrebe za specifičnim API integracijama.

Sposobnost kodiranja u Pythonu i JavaScriptu je u osnovi na samom vrhuncu.

Anthropic kaže da je novi context window dovoljno velik da primi cijele repozitorije koda i učinkovito rezonira kroz sav taj kontekst.

Opus 4.6 je opcija nuklearne bombe... ali sada napokon imamo skalpel, što je sjajna vijest.

Computer use je glavna značajka ovdje, stvarno pomicanje miša i tipkanje.

Financijski analitičari će obožavati dubinu reasoninga za pregled dokumenata.

Ovo je prvi put da se 'Sonnet' model čini kao apsolutno najbolji u klasi.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Claude Sonnet 4.6

Stručni savjeti za maksimalno iskorištavanje Claude Sonnet 4.6.

Optimizirajte napor razmišljanja

Koristite 'adaptive' način rada za reasoning kako biste uštedjeli troškove na jednostavnim upitima, a 'max' napor ostavite za matematičke i logičke zadatke.

Implementirajte sažimanje konteksta

Omogućite prompt caching i značajke sažimanja kako biste učinkovito upravljali context window-om od 1M tokens bez nepotrebnih troškova.

Strukturirano sidrenje ponašanja

Koristite središnju markdown datoteku projekta kako biste održali dosljedan izvor istine za arhitektonske odluke modela.

Ekstrakcija video okvira

Budući da izvorni video nije podržan, ekstrahirajte ključne okvire pri 1 fps za najprecizniju vizualnu analizu video sadržaja.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Često Postavljana Pitanja o Claude Sonnet 4.6

Pronađite odgovore na česta pitanja o Claude Sonnet 4.6