anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet je Anthropicov prvi hibridni reasoning model, koji donosi vrhunske sposobnosti programiranja, context window od 200k i vidljivi misaoni...

anthropic logoanthropicClaude 324. veljače 2025.
Kontekst
200Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$3.00/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
84.8%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Claude 3.7 Sonnet je postigao 84.8% na ovom benchmarku.
HLE
34%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Claude 3.7 Sonnet je postigao 34% na ovom benchmarku.
MMLU
89%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Claude 3.7 Sonnet je postigao 89% na ovom benchmarku.
MMLU Pro
74%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Claude 3.7 Sonnet je postigao 74% na ovom benchmarku.
SimpleQA
42%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Claude 3.7 Sonnet je postigao 42% na ovom benchmarku.
IFEval
93.2%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Claude 3.7 Sonnet je postigao 93.2% na ovom benchmarku.
AIME 2025
54.8%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Claude 3.7 Sonnet je postigao 54.8% na ovom benchmarku.
MATH
96.2%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Claude 3.7 Sonnet je postigao 96.2% na ovom benchmarku.
GSM8k
97%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Claude 3.7 Sonnet je postigao 97% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Claude 3.7 Sonnet je postigao 92% na ovom benchmarku.
MathVista
70%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Claude 3.7 Sonnet je postigao 70% na ovom benchmarku.
SWE-Bench
70.3%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Claude 3.7 Sonnet je postigao 70.3% na ovom benchmarku.
HumanEval
94%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Claude 3.7 Sonnet je postigao 94% na ovom benchmarku.
LiveCodeBench
65%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Claude 3.7 Sonnet je postigao 65% na ovom benchmarku.
MMMU
75%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Claude 3.7 Sonnet je postigao 75% na ovom benchmarku.
MMMU Pro
55%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Claude 3.7 Sonnet je postigao 55% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Claude 3.7 Sonnet je postigao 89% na ovom benchmarku.
DocVQA
94%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Claude 3.7 Sonnet je postigao 94% na ovom benchmarku.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Claude 3.7 Sonnet je postigao 35.2% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Claude 3.7 Sonnet je postigao 12% na ovom benchmarku.

O modelu Claude 3.7 Sonnet

Saznajte o mogućnostima, značajkama i načinima korištenja modela Claude 3.7 Sonnet.

Dizajn hibridnog reasoninga

Claude 3.7 Sonnet koristi novu arhitekturu koja korisnicima omogućuje odabir između brzine i dubine. To je prvi model koji nudi prekidač za prošireno razmišljanje, dopuštajući sustavu da obradi složenu logiku prije nego što pruži odgovor. Ova transparentnost omogućuje developerima da točno vide kako je model došao do zaključka, smanjujući mogućnost skrivenih pogrešaka u tehničkom radu.

Tehničko rješavanje problema

Ovaj model je izgrađen za softversko inženjerstvo visoke razine. Postiže rezultat od 62,1% na benchmarku SWE-bench Verified, pokazujući snažnu sposobnost ispravljanja stvarnih GitHub problema. Kada se koristi uz alate poput Claude Code, upravlja uređivanjem datoteka i izvršavanjem naredbi kroz velike repozitorije. S matematičkim i programerskim zadacima barata s preciznošću koja odgovara ili premašuje trenutne vrhunske reasoning modele.

Masivni kapacitet konteksta

S context windowom od 200.000 tokens, model obrađuje velike setove dokumentacije ili codebaseova odjednom. Podržava do 128.000 tokens outputa kada je aktivan način razmišljanja, što ga čini korisnim za generiranje dugih skripti ili detaljnih izvješća. Model je također multimodal, što znači da može interpretirati grafikone i dijagrame uz tekst.

Claude 3.7 Sonnet

Slučajevi korištenja za Claude 3.7 Sonnet

Otkrijte različite načine korištenja modela Claude 3.7 Sonnet za postizanje izvrsnih rezultata.

Agentic softversko inženjerstvo

Korištenje terminalskog alata za ispravljanje bugova i refaktoriranje koda kroz goleme strukture datoteka.

Verifikacija matematičkih dokaza

Rješavanje teških matematičkih problema dopuštajući modelu da logički razradi korake.

Analiza repozitorija

Ekstrakcija podataka i identificiranje obrazaca iz cijelih tehničkih codebaseova unutar jednog prompta.

Parsiranje vizualnih podataka

Pretvaranje složenih grafikona, dijagrama toka i tehničkih crteža u strukturirane JSON podatke.

Planiranje sistemske arhitekture

Dizajniranje softverskih sustava uz detaljne provjere logike koristeći prošireni način razmišljanja.

Automatizirani Git tijekovi rada

Upravljanje commit porukama, code review procesima i izvršavanjem testova putem agentic upotrebe alata.

Prednosti

Ograničenja

Opcije hibridnog razmišljanja: Prvi model koji korisnicima omogućuje prebacivanje između brzih standardnih odgovora i dubokog reasoning moda.
Latencija reasoninga: Aktiviranje thinking moda značajno povećava vrijeme potrebno da model odgovori.
Vrhunski kodirajući agent: Vrhunske performanse na SWE-bench Verified s rezultatom od 62,1% za ispravljanje produkcijskih problema.
Trošak razmišljanja: Interni reasoning tokens naplaćuju se po stopi od 15 USD po milijun output tokens, što se brzo akumulira tijekom dugih zadataka.
Ekstremni kapacitet outputa: Generira do 128.000 tokens u jednom odgovoru, što olakšava generiranje opsežnog koda i dokumenata.
Bez podrške za video: Za razliku od nekih konkurenata, ne može nativno primati ili analizirati video datoteke putem API-ja.
Transparentna logika: Eksternalizirani chain-of-thought omogućuje korisnicima reviziju i debugiranje internog procesa razmišljanja modela.
Ograničenje znanja: Podaci za obuku sežu do listopada 2024. godine, stoga ne obuhvaćaju najnovija dostignuća u industriji.

API brzi početak

anthropic/claude-3-7-sonnet

Pogledaj dokumentaciju
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analiziraj ovu arhitektonsku grešku..." }],
});

console.log(message.content);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Claude 3.7 Sonnet

Pogledajte što zajednica misli o modelu Claude 3.7 Sonnet

Claude Code plus 3.7 Sonnet je u osnovi junior programer na steroidima u mom terminalu. Ovo je prvi put da se agentic AI čini stvarnim.
dev_guru_99
reddit
Hibridni reasoning je veliki update. Ne trebam uvijek da razmišlja 30 sekundi, ali kad debugiram, to je nevjerojatno.
TechLead_X
twitter
Anthropic je uspio stvoriti model koji konkurira o1 modelu u matematici, a ostaje koristan za svakodnevni chat.
logic_fanatic
hackernews
Claude dostavlja sveobuhvatna, prekrasno formatirana izvješća s citatima u manje od pet minuta.
ThinkingDeeplyAI_mod
reddit
Ograničenje outputa od 128k je skrivena značajka. Konačno model koji se ne prekida usred dugog skripta.
code_monk_42
reddit
Claude 3.7 + MCP je trenutno najbliže što imamo Jarvisu. Stvarno ispravno koristi moje lokalne alate.
julie_codes_it
twitter

Videozapisi o modelu Claude 3.7 Sonnet

Gledajte tutorijale, recenzije i diskusije o modelu Claude 3.7 Sonnet

Claude 3.7 je prava stvar. Novi bazni model pobijedio je samog sebe i postao još bolji u programiranju.

Novi model 3.7 apsolutno je nadmašio sve druge modele, uključujući OpenAI o3 mini.

Sposoban je riješiti 70% GitHub problema.

Prošireno razmišljanje omogućuje modelu da promisli o problemu prije nego što izbaci kod.

Ovo je velika pobjeda za iskustvo developera.

Chat botovi vam daju savjete, ali Claude Code poduzima akcije. Može stvarati datoteke, graditi web stranice i instalirati pakete.

Prošireno razmišljanje je Claudeov proces zaključivanja prije nego što zapravo poduzme bilo kakvu radnju.

Alat je optimiziran za okruženje terminala.

MCP povezivost je ono što ga stvarno izdvaja od standardnog ChatGPT-a.

Model razumije namjeru iza nejasnih terminalskih naredbi.

Integracija s terminalom putem Claude Codea je razina agentic sposobnosti koju do sada nismo vidjeli.

Sposobnost Claude 3.7 Sonnet modela da pokaže svoj misaoni proces daleko je transparentnija od konkurencije.

Na SWE-bench Verified postiže zapaženih 62%.

Hibridni reasoning znači da ne plaćate kaznu u latenciji kada vam nije potreban.

Zadržava visoku kvalitetu stila pisanja prethodnih Claude modela.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Claude 3.7 Sonnet

Stručni savjeti za maksimalno iskorištavanje Claude 3.7 Sonnet.

Postavljanje budžeta za reasoning

Koristite API thinking parametar kako biste ograničili broj reasoning tokens i kontrolirali troškove.

Pregled blokova razmišljanja

Provjerite interni chain-of-thought u odgovorima kako biste verificirali logiku složenih upita.

Korištenje MCP konektora

Povežite model s lokalnim bazama podataka i pohranom u oblaku za kontekst projekta u stvarnom vremenu.

Osvježavanje konteksta

Koristite komande za sažimanje unutar dugih agentic petlji kako bi context window ostao fokusiran na relevantne podatke.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o Claude 3.7 Sonnet

Pronađite odgovore na česta pitanja o Claude 3.7 Sonnet