anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 nudi frontier performance za programiranje i computer use uz masivni 1M token context window za samo 3 USD po milijunu tokens.

Agentic AIMultimodalProgramiranjeComputer UseDugački kontekst
anthropic logoanthropicClaude17. veljače 2026.
Kontekst
1.0Mtokena
Maks. izlaz
64Ktokena
Ulazna cijena
$3.00/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
89.9%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude Sonnet 4.6 je postigao 89.9% na ovom benchmarku.
HLE
49%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Claude Sonnet 4.6 je postigao 49% na ovom benchmarku.
MMLU
89.3%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude Sonnet 4.6 je postigao 89.3% na ovom benchmarku.
MMLU Pro
79.2%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude Sonnet 4.6 je postigao 79.2% na ovom benchmarku.
SimpleQA
48.5%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Claude Sonnet 4.6 je postigao 48.5% na ovom benchmarku.
IFEval
89.5%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude Sonnet 4.6 je postigao 89.5% na ovom benchmarku.
AIME 2025
83%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude Sonnet 4.6 je postigao 83% na ovom benchmarku.
MATH
85.3%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude Sonnet 4.6 je postigao 85.3% na ovom benchmarku.
GSM8k
96.4%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude Sonnet 4.6 je postigao 96.4% na ovom benchmarku.
MGSM
92.8%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude Sonnet 4.6 je postigao 92.8% na ovom benchmarku.
MathVista
68.7%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude Sonnet 4.6 je postigao 68.7% na ovom benchmarku.
SWE-Bench
79.6%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude Sonnet 4.6 je postigao 79.6% na ovom benchmarku.
HumanEval
92.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude Sonnet 4.6 je postigao 92.1% na ovom benchmarku.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude Sonnet 4.6 je postigao 72.4% na ovom benchmarku.
MMMU
74.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude Sonnet 4.6 je postigao 74.2% na ovom benchmarku.
MMMU Pro
75.6%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude Sonnet 4.6 je postigao 75.6% na ovom benchmarku.
ChartQA
88.1%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude Sonnet 4.6 je postigao 88.1% na ovom benchmarku.
DocVQA
93.4%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude Sonnet 4.6 je postigao 93.4% na ovom benchmarku.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude Sonnet 4.6 je postigao 59.1% na ovom benchmarku.
ARC-AGI
58.3%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude Sonnet 4.6 je postigao 58.3% na ovom benchmarku.

O modelu Claude Sonnet 4.6

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude Sonnet 4.6.

Generacijski skok u inteligenciji

Claude Sonnet 4.6 je Anthropic-ov najsposobniji i najsvestraniji model do sada, dizajniran da služi kao radni stroj visokih performansi za složene poduzetničke i developerske tijekove rada. Pušten u rad 17. veljače 2026., predstavlja veliki generacijski skok u odnosu na seriju 4.5, uvodeći computer use mogućnosti na ljudskoj razini i masivni context window od milijun tokens u beta fazi. Model je optimiziran za agentic zadatke, što znači da ne obrađuje samo tekst, već može autonomno planirati i izvršavati operacije u više koraka u različitim softverskim okruženjima.

Tehnička sofisticiranost i multimodalnost

Tehnički, Sonnet 4.6 premošćuje jaz između brzine modela srednje klase i dubokog reasoning-a Opus klase. Sadrži Adaptive Thinking, što mu omogućuje skaliranje internog napora reasoning-a na temelju složenosti zadatka. Ovaj model je postao novi standard za Claude Free i Pro korisnike, nudeći flagship razinu inteligencije u programiranju, financijskoj analizi i razumijevanju dokumenata. On je uistinu izvorni multimodal model, podržavajući tekstualne, slikovne, audio i video ulaze za obradu različitih zadataka obrade medija sa state-of-the-art preciznošću.

Novi industrijski standard za agente

Uz vrhunski omjer performansi i cijene, Sonnet 4.6 je pozicioniran kao primarni motor za AI agente. Postiže vodeće rezultate u industriji na SWE-bench Verified (79,6%) i OSWorld-Verified (72,5%), pokazujući nadmoćnu sposobnost navigacije kroz stvarne probleme softverskog inženjerstva i složene zadatke operativnog sustava. Pružajući inteligenciju blizu Opus-a uz djelić cijene, on osnažuje developere da grade autonomne sustave koji su ranije bili računalno ili financijski neizvedivi.

Claude Sonnet 4.6

Slučajevi korištenja za Claude Sonnet 4.6

Otkrijte različite načine korištenja modela Claude Sonnet 4.6 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Korištenje Claude Code-a za refaktoriranje cijelih repozitorija i implementaciju složenih značajki uz kontekst cijelog repozitorija.

Computer Use na ljudskoj razini

Automatizacija naslijeđenog softvera i web tijekova rada gledanjem zaslona i interakcijom putem virtualnog miša i tipkovnice.

Razumijevanje financijske dokumentacije

Analiza tisuća stranica podnesaka i tablica za reasoning o složenim investicijskim strategijama ili rizicima.

Poslovna simulacija u stvarnom vremenu

Pokretanje agentic simulacija u kojima model upravlja virtualnim poslovanjem i optimizira profitabilnost.

Višejezično tehničko pisanje

Generiranje tehničke dokumentacije na desecima jezika uz održavanje savršene usklađenosti s arhitektonskim specifikacijama.

Frontend UI/UX generiranje

Stvaranje uglađenih, modernih sučelja nadzorne ploče s fokusom na tipografiju, teoriju boja i responzivni izgled.

Prednosti

Ograničenja

Vodeće programiranje u industriji: Postiže state-of-the-art rezultat od 79,6% na SWE-bench Verified, nadmašujući konkurente u rješavanju stvarnih GitHub problema.
Latency u Thinking modu: Visoki budžeti za thinking tokens povećavaju vrijeme do prvog tokena, što ga čini manje idealnim za trenutni chat u stvarnom vremenu.
Vrhunski omjer performansi i cijene: Pruža razinu inteligencije blisku Opus modelu uz 5 puta nižu cijenu, što ga čini najekonomičnijim izborom za opsežnu automatizaciju.
Problemi s ograničenjem broja zahtjeva: Besplatni i Pro korisnici nailaze na agresivna ograničenja poruka tijekom intenzivnih sesija, što zahtijeva prelazak na API.
Navigacija računalom na ljudskoj razini: Postiže 72,5% na OSWorld-Verified, pokazujući ogroman napredak u navigaciji složenim softverom bez API-ja.
Context Decay iznad 150k: Unatoč 1M prozoru, model povremeno može izgubiti specifične detalje iz sredine vrlo dugačkih prompts.
Prilagodljiva snaga reasoning-a: Sadrži skalabilni Thinking način rada koji developerima omogućuje skaliranje napora reasoning-a za teške logičke probleme.
Ranjivost na Prompt Injection: Značajka Computer Use predstavlja rizik jer bi zlonamjerne web stranice mogle pokušati oteti sesiju virtualnog preglednika modela.

API brzi početak

anthropic/claude-sonnet-4-6

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude Sonnet 4.6

Pogledajte što zajednica misli o modelu Claude Sonnet 4.6

Claude Sonnet 4.6 je postigao 94% na našem benchmark-u za osiguranje, što ga čini modelom s najboljim performansama koji smo testirali za computer use.
Swami Sivasubramanian
twitter
Hype je opravdan, ovo je bez sumnje najbolji (i najzabavniji) LLM koji sam ikada koristio! Daleko iznad svega što sam do sada vidio.
WolframRavenwolf
reddit
Claude Sonnet 4.6 je urnebesan, a ne samo 'ponekad smiješan'. Općenito je srdačan, iskren i prosocijalan.
Anton P.
twitter
Sonnet 4.6 je puno bolji od Cline-a za zadatke programiranja. Više uopće ne otvaram datoteke ručno.
semibaron
hackernews
1M context window u potpunosti mijenja pravila igre za migraciju baze koda. Upravo sam učitao cijeli svoj naslijeđeni sustav.
DevOpsDan
reddit
Rukuje složenim tablicama i web obrascima s gotovo jezivom preciznošću. Computer Use beta je napokon spremna.
AI_Insights_Daily
youtube

Videozapisi o modelu Claude Sonnet 4.6

Gledajte tutorijale, recenzije i diskusije o modelu Claude Sonnet 4.6

Sonnet 4.6 je postigao bolji rezultat na GDP val-u, koji mjeri smislene zadatke iz stvarnog svijeta.

Postaje sve teže uopće znati jesu li ovi modeli sposobni za CBRN stvari.

Omjer brzine i inteligencije ovdje je u osnovi neusporediv s bilo kojim drugim modelom na tržištu.

Anthropic se s ovim izdanjem jasno fokusira na agentic stranu priče.

Struktura troškova čini ovo novim zadanim odabirom za svakog API developera s velikim volumenom prometa.

Ovaj model je oko dvostruko brži u usporedbi s Opus modelom od prošlog mjeseca.

Zaključno, ljudi, ovaj model je najbolji omjer uloženo-dobiveno za poduzetničko programiranje.

Vision sposobnosti za interpretaciju složenih dijagrama arhitekture značajno su poboljšane.

Uspio sam mu dati 50 datoteka i savršeno je refaktorirao cijelu logiku usmjeravanja.

Djeluje puno više ljudski u svom stilu komunikacije u usporedbi s GPT-4o.

Zapravo pobjeđuje Opus 4.6 u nekim područjima, a pritom je 40% jeftiniji.

Kako popunjavamo context window, nakon što dosegnemo oko 150.000 tokens, učinkovitost ima tendenciju pada.

Značajka prilagodljivog reasoning-a omogućuje vam da se prebacujete između brzine i duboke logike.

Ovo izdanje djeluje kao prvi pravi 'agent-first' model iz Anthropic-a.

Koristio bih ovo za sve, osim možda za apsolutno najvišu razinu kreativnog pisanja.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Claude Sonnet 4.6

Stručni savjeti za maksimalno iskorištavanje Claude Sonnet 4.6.

Iskoristite Context Compaction

Omogućite Compaction značajku u API-ju za automatsko sažimanje starije povijesti razgovora tijekom dugih sesija.

Strateški koristite Thinking tokens

Za matematiku ili složenu logiku, postavite veći budžet za thinking tokens kako biste omogućili modelu da istraži više putanja reasoning-a.

Prompt-ajte za SPEC usklađenost

Izričito tražite od modela da slijedi moderne arhitektonske najbolje prakse, jer on prirodno teži ažuriranim alatima.

Koristite Artifacts za UI

Potaknite model da koristi UI Artifacts kako bi odvojio generiranje koda od niti razgovora radi iteracije u stvarnom vremenu.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Često Postavljana Pitanja o Claude Sonnet 4.6

Pronađite odgovore na česta pitanja o Claude Sonnet 4.6