anthropic

Claude 3.7 Sonnet

A Claude 3.7 Sonnet az Anthropic első hybrid reasoning modellje, amely state-of-the-art kódolási képességeket, 200k-s context window-t és látható reasoning-et...

anthropic logoanthropicClaude 32025. február 24.
Kontextus
200Ktoken
Max kimenet
128Ktoken
Bemenet ara
$3.00/ 1M
Kimenet ara
$15.00/ 1M
Modalitas:TextImage
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
84.8%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Claude 3.7 Sonnet 84.8% pontot ert el ezen a benchmarkon.
HLE
34%
HLE: Szakertoi szintu erveles. Teszteli a modell kepesseget szakertoi szintu erveles bemutatására specializalt teruletteken. Claude 3.7 Sonnet 34% pontot ert el ezen a benchmarkon.
MMLU
89%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Claude 3.7 Sonnet 89% pontot ert el ezen a benchmarkon.
MMLU Pro
74%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Claude 3.7 Sonnet 74% pontot ert el ezen a benchmarkon.
SimpleQA
42%
SimpleQA: Tenybeli pontossag benchmark. Teszteli a modell kepesseget pontos, tenyszeru valaszok adasara. Claude 3.7 Sonnet 42% pontot ert el ezen a benchmarkon.
IFEval
93.2%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Claude 3.7 Sonnet 93.2% pontot ert el ezen a benchmarkon.
AIME 2025
54.8%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Claude 3.7 Sonnet 54.8% pontot ert el ezen a benchmarkon.
MATH
96.2%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Claude 3.7 Sonnet 96.2% pontot ert el ezen a benchmarkon.
GSM8k
97%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Claude 3.7 Sonnet 97% pontot ert el ezen a benchmarkon.
MGSM
92%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Claude 3.7 Sonnet 92% pontot ert el ezen a benchmarkon.
MathVista
70%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Claude 3.7 Sonnet 70% pontot ert el ezen a benchmarkon.
SWE-Bench
70.3%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Claude 3.7 Sonnet 70.3% pontot ert el ezen a benchmarkon.
HumanEval
94%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Claude 3.7 Sonnet 94% pontot ert el ezen a benchmarkon.
LiveCodeBench
65%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Claude 3.7 Sonnet 65% pontot ert el ezen a benchmarkon.
MMMU
75%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Claude 3.7 Sonnet 75% pontot ert el ezen a benchmarkon.
MMMU Pro
55%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Claude 3.7 Sonnet 55% pontot ert el ezen a benchmarkon.
ChartQA
89%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Claude 3.7 Sonnet 89% pontot ert el ezen a benchmarkon.
DocVQA
94%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Claude 3.7 Sonnet 94% pontot ert el ezen a benchmarkon.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Claude 3.7 Sonnet 35.2% pontot ert el ezen a benchmarkon.
ARC-AGI
12%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Claude 3.7 Sonnet 12% pontot ert el ezen a benchmarkon.

Probald ki a Claude 3.7 Sonnet-t ingyenesen

Csevelj a Claude 3.7 Sonnet-val ingyenesen. Teszteld a kepessegeit, tegyel fel kerdeseket es fedezd fel, mire kepes ez az AI modell.

Prompt
Valasz
anthropic/claude-3-7-sonnet-20250219

Az AI valaszod itt jelenik meg

A Claude 3.7 Sonnet reszletei

Ismerd meg a Claude 3.7 Sonnet kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

Hybrid Reasoning és átláthatóság

A Claude 3.7 Sonnet mérföldkő az LLM architektúrákban, mint az Anthropic első „hybrid reasoning” modellje. Egyedülálló módon lehetővé teszi a felhasználók számára, hogy váltsanak a standard, alacsony késleltetésű válaszok és egy „extended thinking” mód között, amely megjeleníti a belső chain-of-thought folyamatot. Ez az átláthatóság tiszta betekintést nyújt a modell logikájába, így különösen hatékony a komplex hibaelhárítási és nagy téttel bíró reasoning feladatoknál.

Szoftvermérnöki mesterfokozat

A kifejezetten szoftvermérnöki munkára és produkciókész kimenetekre tervezett modell új iparági sztenderdeket állított fel az olyan benchmarkokon, mint az SWE-Bench Verified. Kiemelkedik a „vibe coding” terén, ahol a fejlesztők magas szintű szándékokat fogalmaznak meg, a modell pedig több fájlon keresztül kezeli a megvalósítást. A komplex refaktorálásokat és architekturális döntéseket olyan precizitással kezeli, amely felülmúlja a korábbi frontier model-eket.

Hatalmas kontextus és Agentic eszközök

A hatalmas, 200 000 tokenes context window-val és a Claude Code nevű agentic eszközkészlettel a modell egy egyszerű chatbotból kollaboratív technikai partnerré válik. Képes teljes projekt-életciklusok kezelésére, a kezdeti dokumentáció áttekintésétől az automatizált git munkafolyamatokon át a tesztek végrehajtásáig, biztosítva a gyors és hibamentes fejlesztést.

Claude 3.7 Sonnet

Hasznalati esetek a Claude 3.7 Sonnet szamara

Fedezd fel a kulonbozo modokat, ahogyan a Claude 3.7 Sonnet-t hasznalhatod remek eredmenyek eleresehez.

Vibe Coding

Működő szoftverek építése a nulláról, a szándék természetes nyelven történő megfogalmazásával.

Speciális hibakeresés

Az extended thinking kihasználása komplex logfájlok elemzéséhez és pontos, azonnali javításokhoz.

Nagy kontextusú elemzés

Teljes kódbázisok vagy hosszú technikai dokumentációk áttekintése és refaktorálása egyetlen prompt segítségével.

Agentic fejlesztés

Terminál-alapú eszközök, például a Claude Code vezérlése a git munkafolyamatok és a tesztfuttatások automatizálásához.

Frontend UI generálás

Elegáns, karbantartható React és Svelte komponensek készítése beépített dizájnérzékkel.

Tényszerű kutatás

Hatalmas PDF dokumentumok és adatkészletek elemzése nagy pontossággal és alacsony hallucinációs aránnyal.

Erossegek

Korlatozasok

Iparágvezető kódolás: State-of-the-art 70,3%-os eredményt ért el az SWE-bench Verified teszten, valós GitHub problémákat megoldva példátlan pontossággal.
Válasz latency: Az „extended thinking” mód engedélyezése jelentősen megnöveli az első tokenig eltelt időt a standard modellválaszokhoz képest.
Látható Reasoning: Az első modell, amely látható és a felhasználó által szabályozható „extended thinking” módot kínál a komplex, nagy tétű problémamegoldáshoz.
Prémium árazás: A 15 dollár / 1 millió token output költség továbbra is lényegesen magasabb, mint a legtöbb „mini” vagy open-weights alternatíva.
Agentic integráció: Kifejezetten tool-use-ra és CLI interakcióra optimalizálva a Claude Code agent keretrendszeren keresztül a teljes körű feladatautomatizáláshoz.
Nincs natív audio/video: A GPT-4o-val vagy a Gemini 2.0-val ellentétben hiányoznak a natív audio- és videóbemeneti feldolgozási képességek.
Kiváló dizájnérzék: Konzisztensen elegánsabb, akadálymentesebb és könnyebben karbantartható UI-kódot generál, mint a többi frontier model.
Számítási költség: A mély reasoning munkamenetek gyorsan elfogyaszthatják a token keretet és a context limiteket a nagyszabású kódbázis-refaktorálások során.

API gyorsinditas

anthropic/claude-3-7-sonnet-20250219

Dokumentacio megtekintese
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Claude 3.7 Sonnet-rol

Nezd meg, mit gondol a kozosseg a Claude 3.7 Sonnet-rol

"A Claude 3.7 Sonnet a világ legjobb kódoló AI modellje; eldobtam az agyam tőle a nehéz feladatoknál."
rawcell4772
reddit
"Egyetlen prompttal tökéletesen megoldott mindent egy komplex TypeScript projekten."
rawcell4772
reddit
"A Claude Code a Sonnet 3.7-tel sokkal jobb, mint a Cline, jelenleg ez a legjobb eszköz."
peterkrueck
reddit
"A 3.7-eshez hasonló csúcsmodellek minőségi ugrása alapjaiban változtatta meg a szemléletemet."
lurking_horrors
reddit
"A Claude 3.7 tiszta tűz, máshogy üt... fullos, eskü, nem viccelek."
Fireship
youtube
"A Claude 3.7 reasoning módja teljes paradigmaváltás a logikai hibakeresésben."
DevLead99
x

Videok a Claude 3.7 Sonnet-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Claude 3.7 Sonnet-rol

Az új 3.7-es modell abszolút lesöpörte a többit... immár a GitHub-problémák 70,3%-át képes megoldani

Az erősen típusos nyelvek és a TDD használata módja annak, hogy az AI validálja, hogy az általa írt kód valóban helyes

A modell hihetetlenül okos az utasítások követésében

A teljesítmény az SWE-bench-en valósággal őrületes

A látható reasoning igazi mérföldkő az átláthatóság szempontjából

Claude 3.7 Sonnet... valószínűleg ez a legjobb LLM kódgeneráláshoz

Ha az API-t használod, 128 000 tokent tudsz kiadni egyetlen menetben

A 128k output limit masszív előrelépés

A frontend komponensekhez való dizájnérzéke páratlan

A tool-use és az agentic képességek a modell alapkövei

A reasoning-nek a Frontier modellek integrált képességének kellene lennie, nem pedig egy teljesen külön modellnek

A Claude 3.7-nek sikerül jelentős mértékben felülmúlnia ezeket a modelleket [DeepSeek, o3]

A latency valamivel magasabb reasoning módban

Számos utasításkövetési feladatban veri a DeepSeek R1-et

Az Anthropic valóban a produkciókész kimenetekre összpontosított

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok
Demo megtekintese

Profi tippek

Szakertoi tippek, hogy a legtobbet hozd ki ebbol a modellbol es jobb eredmenyeket erj el.

Thinking Budget

Használd az „extended thinking” módot kifejezetten komplex logika vagy architektúra-tervezés esetén a jobb minőségű eredmények érdekében.

Context kontroll

Rendszeresen használj /clear parancsot vagy indíts új chatet a context költségek csökkentése és a modell lassulásának megelőzése érdekében.

Ellenőrzés

Kérd meg a Claude-ot, hogy írjon és futtasson teszteket a saját kódjához a Claude Code eszközzel a produkciós stabilitás biztosításához.

Markdown specifikációk

A funkcionális követelményeket strukturált Markdown fájlokban add meg a jobb utasításkövetés érdekében nagyobb projekteknél.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Gyakran ismetelt kerdesek

Talalj valaszokat a modellel kapcsolatos gyakori kerdesekre