anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 пропонує продуктивність frontier-рівня для програмування та computer use з величезним context window у 1M tokens всього за $3 за 1M tokens.

Агентний AIMultimodalПрограмуванняComputer UseLong Context
anthropic logoanthropicClaude 417 лютого 2026 року
Контекст
1.0Mтокенів
Макс. вивід
64Kтокенів
Ціна вводу
$3.00/ 1M
Ціна виводу
$15.00/ 1M
Модальність:TextImageAudioVideo
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
89.9%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Claude Sonnet 4.6 набрав 89.9% у цьому бенчмарку.
HLE
49%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Claude Sonnet 4.6 набрав 49% у цьому бенчмарку.
MMLU
89.3%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Claude Sonnet 4.6 набрав 89.3% у цьому бенчмарку.
MMLU Pro
79.2%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Claude Sonnet 4.6 набрав 79.2% у цьому бенчмарку.
SimpleQA
48.5%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Claude Sonnet 4.6 набрав 48.5% у цьому бенчмарку.
IFEval
89.5%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Claude Sonnet 4.6 набрав 89.5% у цьому бенчмарку.
AIME 2025
83%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Claude Sonnet 4.6 набрав 83% у цьому бенчмарку.
MATH
85.3%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Claude Sonnet 4.6 набрав 85.3% у цьому бенчмарку.
GSM8k
96.4%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Claude Sonnet 4.6 набрав 96.4% у цьому бенчмарку.
MGSM
92.8%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Claude Sonnet 4.6 набрав 92.8% у цьому бенчмарку.
MathVista
68.7%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Claude Sonnet 4.6 набрав 68.7% у цьому бенчмарку.
SWE-Bench
79.6%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Claude Sonnet 4.6 набрав 79.6% у цьому бенчмарку.
HumanEval
92.1%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Claude Sonnet 4.6 набрав 92.1% у цьому бенчмарку.
LiveCodeBench
72.4%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Claude Sonnet 4.6 набрав 72.4% у цьому бенчмарку.
MMMU
74.2%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Claude Sonnet 4.6 набрав 74.2% у цьому бенчмарку.
MMMU Pro
75.6%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Claude Sonnet 4.6 набрав 75.6% у цьому бенчмарку.
ChartQA
88.1%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Claude Sonnet 4.6 набрав 88.1% у цьому бенчмарку.
DocVQA
93.4%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Claude Sonnet 4.6 набрав 93.4% у цьому бенчмарку.
Terminal-Bench
59.1%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Claude Sonnet 4.6 набрав 59.1% у цьому бенчмарку.
ARC-AGI
58.3%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Claude Sonnet 4.6 набрав 58.3% у цьому бенчмарку.

Про Claude Sonnet 4.6

Дізнайтеся про можливості Claude Sonnet 4.6, функції та як це може допомогти вам досягти кращих результатів.

Високоефективний агентний інтелект

Claude Sonnet 4.6, це найбільш універсальна модель Anthropic, розроблена як основний двигун для складних корпоративних робочих процесів та автономних агентів. Випущена 17 лютого 2026 року, вона впроваджує можливості computer use на рівні людини та context window обсягом 1 мільйон tokens. Архітектура моделі балансує між швидкістю систем середнього рівня та глибиною reasoning, яка зазвичай була притаманна класу Opus, що робить її сталим вибором для виробничих середовищ з високими навантаженнями.

Adaptive Thinking та мультимодальність

Технічно Sonnet 4.6 використовує механізм Adaptive Thinking. Це дозволяє розробникам масштабувати внутрішні зусилля на reasoning залежно від специфічних вимог завдання, оптимізуючи або швидкість до мілісекунд, або глибоку логічну перевірку. Модель є natively multimodal, пропонуючи передову продуктивність в обробці тексту, зображень високої роздільної здатності та аудіофайлів. Вона чудово справляється з інтерпретацією щільної технічної документації та складних візуальних даних, таких як архітектурні креслення чи фінансові графіки.

Галузевий стандарт програмування

З рекордним показником 79,6% у SWE-bench Verified, Sonnet 4.6 стала стандартом для автоматизації розробки програмного забезпечення. Її здатність міркувати в межах великих кодових баз у межах 1M tokens дозволяє їй вирішувати баги в декількох файлах та планувати архітектурні рефакторинги з мінімальним втручанням людини. Пропонуючи інтелект рівня, близького до Opus, за $3 за мільйон вхідних tokens, вона усуває фінансові бар'єри, раніше пов'язані з розгортанням повністю автономних AI систем.

Claude Sonnet 4.6

Випадки використання для Claude Sonnet 4.6

Відкрийте різні способи використання Claude Sonnet 4.6 для досягнення чудових результатів.

Автономна розробка програмного забезпечення

Вирішення складних проблем у GitHub, що охоплюють багато файлів, та виконання повного рефакторингу репозиторіїв з точністю 79,6% згідно з SWE-bench.

Computer use на рівні людини

Пряма навігація в настільних програмах та веб-інтерфейсах для виконання багатоетапних адміністративних завдань без спеціальних API-інтеграцій.

Аналіз великих обсягів документів

Перегляд тисяч сторінок юридичних контрактів або наукових статей одночасно в межах context window обсягом 1 мільйон tokens.

Фінансовий інтелект та прогнозування

Опрацювання звітів про прибутки та квартальних звітів для виявлення тонких ринкових аномалій за допомогою адаптивного reasoning з високим рівнем зусиль.

Multimodal технічна підтримка

Інтерпретація складних технічних схем, фотографій друкованих плат та аудіозаписів для надання точних інструкцій з усунення несправностей.

Agentic бізнес-стратегія

Планування та виконання довгострокових операцій за допомогою найвищих показників у benchmark для стратегічного та логічного мислення.

Сильні сторони

Обмеження

Елітна точність програмування: Встановлює галузевий стандарт із показником 79,6% у SWE-bench Verified, перевершуючи всі інші моделі середнього рівня та більшість flagship моделей.
Відсутність нативного введення відео: Потребує ручного вилучення кадрів для візуальної обробки відеофайлів, що додає складності медіа-робочим процесам.
Безпрецедентний обсяг context capacity: Вікно у 1 мільйон tokens дозволяє завантажувати цілі технічні бібліотеки або масивні кодові бази без зниження продуктивності.
Збільшена latency reasoning: Використання адаптивного reasoning з високими зусиллями суттєво збільшує час до отримання першого token порівняно зі стандартною inference.
Автономний computer use: Досягає результату 72,5% у тестуванні OSWorld, дозволяючи моделі керувати складними графічними інтерфейсами та програмними інструментами як віртуальний оператор.
Високі витрати на вихідний reasoning: Хоча вартість вхідних даних є конкурентною, задачі з максимальною інтенсивністю reasoning можуть споживати велику кількість вихідних tokens, збільшуючи витрати.
Оптимізоване співвідношення ціни та продуктивності: Забезпечує рівень інтелекту, близький до Opus, за 1/5 вартості, що робить її найекономічнішим вибором для масштабного розгортання агентичних систем.
Шум при пошуку в context: При досягненні ліміту в 1M tokens модель іноді може страждати від зниження фокусу, якщо context заповнений нерелевантними даними.

Швидкий старт API

anthropic/claude-sonnet-4-6

Переглянути документацію
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Claude Sonnet 4.6

Подивіться, що думає спільнота про Claude Sonnet 4.6

Context, це шум. Більші вікна tokens, це пастка. Надавайте агентам лише вузький, відібраний сигнал, який їм потрібен.
Logical-Storm-1180
reddit
Це Claude Sonnet 4.6: наша найздібніша модель Sonnet. Це повне оновлення в програмуванні, computer use та плануванні завдань для агентів.
Claude
twitter
Співвідношення ціни та продуктивності Claude Sonnet 4.6 є надзвичайним, важко переоцінити, наскільки швидко розвиваються ці моделі.
Replit
youtube
Sonnet 4.6 вже працює в Claude Code. Вона дешевша за Opus 4.6 і за інтелектом наближається до рівня Opus.
Boris Cherny
twitter
Claude 4.6, новий лідер у продуктивності агентів, трохи випереджаючи Opus 4.6 у реальних завданнях інтелектуальної праці.
Artificial Analysis
twitter
Той факт, що ця модель може навігувати в інтерфейсі комп'ютера з точністю 72%, фактично робить непотрібними більшість спеціалізованих API.
DevOpsGuru
hackernews

Відео про Claude Sonnet 4.6

Дивіться навчальні матеріали, огляди та обговорення про Claude Sonnet 4.6

Sonnet 4.6 вже тут, і вона може замінити Opus для 90% вашої повсякденної роботи.

А найкраще те, що вона на 40% дешевша за Opus 4.6.

Результати SWE-bench просто неймовірні для моделі середнього рівня.

Можна фактично завантажити цілу кодову базу, і вона не втратить нитку міркувань.

Adaptive thinking дозволяє балансувати між швидкістю та глибиною логіки.

Перші користувачі повідомляють, що вона здатна працювати майже на рівні людини зі складними електронними таблицями.

Ця модель приблизно вдвічі швидша за Opus.

Context window на 1 мільйон tokens зараз у бета-версії, але працює чудово.

Вона навігує в інтерфейсах без потреби у спеціальних API-інтеграціях.

Можливості програмування на Python та JavaScript фактично досягли стелі.

Anthropic каже, що нове вікно контексту достатньо велике, щоб вмістити цілі бази коду та ефективно аналізувати весь цей обсяг.

Opus 4.6, це «ядерний» варіант... але тепер ми нарешті маємо скальпель, і це чудова новина.

Computer use, це головна особливість, вона дійсно рухає мишкою та друкує текст.

Фінансовим аналітикам сподобається глибина reasoning при перегляді документів.

Це вперше, коли модель 'Sonnet' виглядає як найкраща у своєму класі.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Claude Sonnet 4.6

Експертні поради, які допоможуть вам отримати максимум від Claude Sonnet 4.6 та досягти кращих результатів.

Оптимізація Thinking Effort

Використовуйте режим 'adaptive' thinking, щоб заощадити кошти на простих запитах, залишаючи 'max' зусилля для математичних та логічних задач.

Впровадження Context Compaction

Активуйте функції prompt caching та compaction для ефективної роботи з вікном у 1M tokens без зайвих витрат.

Структуроване поведінкове закріплення

Використовуйте центральний markdown-файл проєкту для підтримки єдиного джерела істини щодо архітектурних рішень моделі.

Вилучення кадрів відео

Оскільки нативна підтримка відео відсутня, вилучайте ключові кадри з частотою 1 к/с для найточнішого візуального аналізу контенту.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Часті запитання про Claude Sonnet 4.6

Знайдіть відповіді на поширені запитання про Claude Sonnet 4.6