anthropic

Claude Sonnet 4.6

A Claude Sonnet 4.6 frontier performance szintet nyújt programozáshoz és computer use feladatokhoz, hatalmas 1M tokenes context window-val, mindössze 3 $/1M...

Agentic AIMultimodalProgramozásComputer UseHosszú kontextus
anthropic logoanthropicClaude2026. február 17.
Kontextus
1.0Mtoken
Max kimenet
64Ktoken
Bemenet ara
$3.00/ 1M
Kimenet ara
$15.00/ 1M
Modalitas:TextImageAudioVideo
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
89.9%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Claude Sonnet 4.6 89.9% pontot ert el ezen a benchmarkon.
HLE
49%
HLE: Szakertoi szintu erveles. Teszteli a modell kepesseget szakertoi szintu erveles bemutatására specializalt teruletteken. Claude Sonnet 4.6 49% pontot ert el ezen a benchmarkon.
MMLU
89.3%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Claude Sonnet 4.6 89.3% pontot ert el ezen a benchmarkon.
MMLU Pro
79.2%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Claude Sonnet 4.6 79.2% pontot ert el ezen a benchmarkon.
SimpleQA
48.5%
SimpleQA: Tenybeli pontossag benchmark. Teszteli a modell kepesseget pontos, tenyszeru valaszok adasara. Claude Sonnet 4.6 48.5% pontot ert el ezen a benchmarkon.
IFEval
89.5%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Claude Sonnet 4.6 89.5% pontot ert el ezen a benchmarkon.
AIME 2025
83%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Claude Sonnet 4.6 83% pontot ert el ezen a benchmarkon.
MATH
85.3%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Claude Sonnet 4.6 85.3% pontot ert el ezen a benchmarkon.
GSM8k
96.4%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Claude Sonnet 4.6 96.4% pontot ert el ezen a benchmarkon.
MGSM
92.8%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Claude Sonnet 4.6 92.8% pontot ert el ezen a benchmarkon.
MathVista
68.7%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Claude Sonnet 4.6 68.7% pontot ert el ezen a benchmarkon.
SWE-Bench
79.6%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Claude Sonnet 4.6 79.6% pontot ert el ezen a benchmarkon.
HumanEval
92.1%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Claude Sonnet 4.6 92.1% pontot ert el ezen a benchmarkon.
LiveCodeBench
72.4%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Claude Sonnet 4.6 72.4% pontot ert el ezen a benchmarkon.
MMMU
74.2%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Claude Sonnet 4.6 74.2% pontot ert el ezen a benchmarkon.
MMMU Pro
75.6%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Claude Sonnet 4.6 75.6% pontot ert el ezen a benchmarkon.
ChartQA
88.1%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Claude Sonnet 4.6 88.1% pontot ert el ezen a benchmarkon.
DocVQA
93.4%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Claude Sonnet 4.6 93.4% pontot ert el ezen a benchmarkon.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Claude Sonnet 4.6 59.1% pontot ert el ezen a benchmarkon.
ARC-AGI
58.3%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Claude Sonnet 4.6 58.3% pontot ert el ezen a benchmarkon.

A Claude Sonnet 4.6 reszletei

Ismerd meg a Claude Sonnet 4.6 kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

Generációs ugrás az intelligenciában

A Claude Sonnet 4.6 az Anthropic eddigi legképzettebb és legsokoldalúbb modelje, amelyet úgy terveztek, hogy nagy teljesítményű igáslóként szolgáljon az összetett vállalati és fejlesztői munkafolyamatokban. A 2026. február 17-én megjelent model jelentős generációs ugrást képvisel a 4.5-ös szériához képest, bevezetve az emberi szintű computer use képességeket és egy béta fázisú, hatalmas 1 millió tokenes context window-t. A modelt kifejezetten agentic feladatokra optimalizálták, ami azt jelenti, hogy nem csupán szöveget dolgoz fel, hanem autonóm módon képes több lépésből álló műveleteket tervezni és végrehajtani különböző szoftverkörnyezetekben.

Technikai kifinomultság és multimodalitás

Technikai szempontból a Sonnet 4.6 áthidalja a szakadékot a középszintű modellek sebessége és az Opus osztály mély reasoning képessége között. Rendelkezik az Adaptive Thinking funkcióval, amely lehetővé teszi belső reasoning erőforrásainak skálázását a feladat összetettsége alapján. Ez a model vált az új alapértelmezetté a Claude Free és Pro felhasználók számára, flagship-szintű intelligenciát kínálva a programozás, a pénzügyi elemzés és a dokumentumértelmezés terén. Valódi natív multimodal megoldás, amely támogatja a szöveges, kép, audio és videó bemeneteket, így state-of-the-art pontossággal képes különféle médiatartalmak feldolgozására.

Az ágensek új iparági standardja

Kiváló teljesítmény-ár arányával a Sonnet 4.6 az AI ágensek elsődleges motorjaként pozícionálja magát. Iparágvezető pontszámokat ér el a SWE-bench Verified (79,6%) és az OSWorld-Verified (72,5%) teszteken, bizonyítva kiemelkedő képességét a valós szoftvermérnöki problémák és az összetett operációs rendszer szintű feladatok megoldásában. Azzal, hogy közel Opus szintű intelligenciát biztosít a költségek töredékéért, lehetővé teszi a fejlesztők számára olyan autonóm rendszerek építését, amelyek korábban számítási vagy pénzügyi okokból megvalósíthatatlanok voltak.

Claude Sonnet 4.6

Hasznalati esetek a Claude Sonnet 4.6 szamara

Fedezd fel a kulonbozo modokat, ahogyan a Claude Sonnet 4.6-t hasznalhatod remek eredmenyek eleresehez.

Autonóm szoftverfejlesztés

A Claude Code használata teljes repozitóriumok refaktorálására és összetett funkciók implementálására a teljes projektszintű kontextus ismeretében.

Emberi szintű Computer Use

Régebbi szoftverek és webes munkafolyamatok automatizálása a képernyő látványa, valamint virtuális egér és billentyűzet segítségével.

Pénzügyi dokumentumok értelmezése

Több ezer oldalas jelentések és táblázatok elemzése összetett befektetési stratégiák vagy kockázatok reasoning alapú feltárásához.

Valós idejű üzleti szimuláció

Agentic szimulációk futtatása, ahol a model egy virtuális üzletet irányít és optimalizál a profitabilitás érdekében.

Többnyelvű technikai dokumentáció

Technikai dokumentáció készítése tucatnyi nyelven, miközben a model tökéletesen betartja az architekturális specifikációkat.

Frontend UI/UX generálás

Igényes, modern dashboard felületek készítése, fókuszálva a tipográfiára, színelméletre és a reszponzív elrendezésre.

Erossegek

Korlatozasok

Iparágvezető kódolási képességek: State-of-the-art 79,6%-os eredményt ér el a SWE-bench Verified teszten, túlszárnyalva a versenytársakat a valós GitHub problémák megoldásában.
Latency a Thinking módban: A magas thinking token büdzsé növeli a time-to-first-token értéket, ami kevésbé ideális azonnali, valós idejű chathez.
Kiváló teljesítmény-ár arány: Közel Opus szintű intelligenciát nyújt 5-ször alacsonyabb költség mellett, így a leggazdaságosabb választás nagy volumenű automatizáláshoz.
Rate limit korlátok: Az ingyenes és Pro felhasználók intenzív használat során hamar elérik az üzenetlimiteket, ami szükségessé teszi az API-ra való váltást.
Emberi szintű számítógépes navigáció: 72,5%-ot ért el az OSWorld-Verified benchmarkon, ami hatalmas fejlődést mutat az összetett szoftverek API nélküli kezelésében.
Kontextusvesztés 150k felett: Az 1M-es ablak ellenére a model esetenként még mindig elveszíthet specifikus részleteket a nagyon hosszú promptek közepéről.
Adaptív reasoning erő: Skálázható Thinking móddal rendelkezik, amely lehetővé teszi a fejlesztők számára a reasoning erőforrások növelését nehéz logikai problémák esetén.
Prompt injection sebezhetőség: A Computer Use funkció kockázatokat hordoz, mivel kártékony weboldalak megpróbálhatják átvenni az irányítást a model virtuális böngészője felett.

API gyorsinditas

anthropic/claude-sonnet-4-6

Dokumentacio megtekintese
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Claude Sonnet 4.6-rol

Nezd meg, mit gondol a kozosseg a Claude Sonnet 4.6-rol

A Claude Sonnet 4.6 94%-ot ért el a biztosítási benchmarkunkon, amivel a valaha tesztelt legjobban teljesítő model lett a computer use kategóriában.
Swami Sivasubramanian
twitter
A hype valós, ez egyértelműen a legjobb (és legszórakoztatóbb) LLM, amit valaha használtam! Toronymagasan veri az eddig látottakat.
WolframRavenwolf
reddit
A Claude Sonnet 4.6 fergeteges, nem csak 'néha vicces'. Alapvetően barátságos, őszinte és közösségépítő.
Anton P.
twitter
A Sonnet 4.6 sokkal jobb programozási feladatokra, mint a Cline. Már nem is nyitok meg fájlokat manuálisan.
semibaron
hackernews
Az 1M-es context window megváltoztatja a játékszabályokat a kódbázis-migrációnál. Csak feltöltöttem a teljes legacy stack-emet.
DevOpsDan
reddit
Szinte ijesztő precizitással kezeli az összetett táblázatokat és webes űrlapokat. A Computer Use béta végre készen áll.
AI_Insights_Daily
youtube

Videok a Claude Sonnet 4.6-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Claude Sonnet 4.6-rol

A Sonnet 4.6 magasabb pontszámot ért el a GDP val teszten, amely a valós világban értelmezhető feladatokat méri.

Egyre nehezebb megállapítani, hogy ezek a modellek képesek-e CBRN szintű dolgokra.

A sebesség és az intelligencia aránya itt lényegében páratlan bármely más modellel szemben a piacon.

Az Anthropic ezzel a kiadással egyértelműen az agentic oldalra fókuszál.

A költségszerkezet miatt ez lesz az új alapértelmezett választás minden nagy volumenű API fejlesztő számára.

Ez a model körülbelül kétszer olyan gyors, mint az előző havi Opus model.

Összefoglalva, srácok, ez a model a legjobb ár-érték arányú választás vállalati kódoláshoz.

A vision képességek az összetett architektúra-diagramok értelmezéséhez jelentősen javultak.

Képes voltam 50 fájlt odaadni neki, és tökéletesen refaktorálta a teljes routing logikát.

Sokkal emberibbnek érződik a kommunikációs stílusa a GPT-4o-hoz képest.

Bizonyos területeken valójában legyőzi az Opus 4.6-ot, miközben 40%-kal olcsóbb.

Ahogy feltöltjük a context window-t, amint elérjük a 150 000 tokent, a hatékonyság csökkenni kezd.

Az adaptív reasoning funkció lehetővé teszi, hogy válasszunk a sebesség és a mély logika között.

Ez a kiadás az Anthropic első igazi 'agent-first' modeljének tűnik.

Ezt használnám mindenre, kivéve talán a legmagasabb szintű kreatív írást.

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok

Profi tippek a Claude Sonnet 4.6 szamara

Szakertoi tippek, hogy a legtobbet hozd ki a Claude Sonnet 4.6-bol es jobb eredmenyeket erj el.

Használja ki a Context Compaction funkciót

Engedélyezze a Compaction funkciót az API-ban, hogy a hosszú munkamenetek során a rendszer automatikusan összefoglalja a régebbi beszélgetés-előzményeket.

Alkalmazza stratégiailag a Thinking tokeneket

Matematikai vagy összetett logikai feladatokhoz állítson be magasabb keretet a thinking tokenek számára, hogy a model több reasoning utat is feltérképezhessen.

Promptoljon SPEC megfelelőségre

Kérje meg explicit módon a modelt, hogy kövesse a modern architekturális legjobb gyakorlatokat, mivel alapvetően a frissített eszközöket részesíti előnyben.

Használjon Artifacts-et a UI tervezéshez

Ösztönözze a modelt a UI Artifacts használatára, hogy a kódgenerálás elkülönüljön a chat folyamtól a valós idejű iteráció érdekében.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Gyakran ismetelt kerdesek a Claude Sonnet 4.6-rol

Talalj valaszokat a Claude Sonnet 4.6-val kapcsolatos gyakori kerdesekre