anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 предлагает frontier performance в задачах coding и computer use с огромным 1M token context window всего за $3 за 1M tokens.

Agentic AIMultimodalCodingComputer UseLong Context
anthropic logoanthropicClaudeFebruary 17, 2026
Контекст
1.0Mтокенов
Макс. вывод
64Kтокенов
Цена ввода
$3.00/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
89.9%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude Sonnet 4.6 набрал 89.9% в этом бенчмарке.
HLE
49%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Claude Sonnet 4.6 набрал 49% в этом бенчмарке.
MMLU
89.3%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude Sonnet 4.6 набрал 89.3% в этом бенчмарке.
MMLU Pro
79.2%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude Sonnet 4.6 набрал 79.2% в этом бенчмарке.
SimpleQA
48.5%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Claude Sonnet 4.6 набрал 48.5% в этом бенчмарке.
IFEval
89.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude Sonnet 4.6 набрал 89.5% в этом бенчмарке.
AIME 2025
83%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude Sonnet 4.6 набрал 83% в этом бенчмарке.
MATH
85.3%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude Sonnet 4.6 набрал 85.3% в этом бенчмарке.
GSM8k
96.4%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude Sonnet 4.6 набрал 96.4% в этом бенчмарке.
MGSM
92.8%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude Sonnet 4.6 набрал 92.8% в этом бенчмарке.
MathVista
68.7%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude Sonnet 4.6 набрал 68.7% в этом бенчмарке.
SWE-Bench
79.6%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude Sonnet 4.6 набрал 79.6% в этом бенчмарке.
HumanEval
92.1%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude Sonnet 4.6 набрал 92.1% в этом бенчмарке.
LiveCodeBench
72.4%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude Sonnet 4.6 набрал 72.4% в этом бенчмарке.
MMMU
74.2%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude Sonnet 4.6 набрал 74.2% в этом бенчмарке.
MMMU Pro
75.6%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude Sonnet 4.6 набрал 75.6% в этом бенчмарке.
ChartQA
88.1%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude Sonnet 4.6 набрал 88.1% в этом бенчмарке.
DocVQA
93.4%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude Sonnet 4.6 набрал 93.4% в этом бенчмарке.
Terminal-Bench
59.1%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude Sonnet 4.6 набрал 59.1% в этом бенчмарке.
ARC-AGI
58.3%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude Sonnet 4.6 набрал 58.3% в этом бенчмарке.

О модели Claude Sonnet 4.6

Узнайте о возможностях, функциях и способах использования Claude Sonnet 4.6.

Поколенческий скачок в интеллекте

Claude Sonnet 4.6 — это самая мощная и универсальная model от Anthropic на сегодняшний день, созданная как высокопроизводительный инструмент для сложных корпоративных задач и процессов разработки. Выпущенная 17 февраля 2026 года, она представляет собой значительный качественный скачок по сравнению с серией 4.5, представляя возможности Computer Use на уровне человека и массивное 1-million-token context window в режиме beta. Model оптимизирована для agentic задач, что означает, что она не просто обрабатывает текст, но может автономно планировать и выполнять многоэтапные операции в различных программных средах.

Техническое совершенство и Multimodality

С технической точки зрения Sonnet 4.6 сокращает разрыв между скоростью моделей среднего уровня и глубоким reasoning класса Opus. Она оснащена функцией Adaptive Thinking, позволяющей масштабировать внутренние усилия reasoning в зависимости от сложности задачи. Эта model стала новым стандартом для пользователей Claude Free и Pro, предлагая flagship-интеллект в области coding, финансового анализа и понимания документов. Она является по-настоящему нативной multimodal системой, поддерживающей ввод текста, изображений, аудио и видео для решения широкого спектра задач по обработке медиаданных с точностью уровня state-of-the-art.

Новый отраслевой стандарт для агентов

Благодаря элитному соотношению производительности и стоимости, Sonnet 4.6 позиционируется как основной движок для AI-агентов. Она достигает ведущих в индустрии показателей на SWE-bench Verified (79.6%) и OSWorld-Verified (72.5%), демонстрируя превосходную способность решать реальные задачи программной инженерии и сложные операции в операционных системах. Предоставляя интеллект уровня Opus за долю его стоимости, она позволяет разработчикам создавать автономные системы, которые ранее были недоступны из-за вычислительных или финансовых ограничений.

Claude Sonnet 4.6

Варианты использования Claude Sonnet 4.6

Откройте для себя различные способы использования Claude Sonnet 4.6 для достижения отличных результатов.

Автономная программная инженерия

Использование Claude Code для рефакторинга целых репозиториев и реализации сложных функций с учетом контекста всего проекта.

Computer Use на уровне человека

Автоматизация работы в устаревшем ПО и веб-сервисах через визуальное восприятие экрана и взаимодействие через виртуальную мышь и клавиатуру.

Анализ финансовых документов

Анализ тысяч страниц отчетов и таблиц для выстраивания сложных инвестиционных стратегий или оценки рисков.

Бизнес-симуляция в реальном времени

Запуск agentic симуляций, где model управляет виртуальным бизнесом и оптимизирует его прибыльность.

Мультиязычная техническая документация

Создание технической документации на десятках языков при строгом соблюдении архитектурных спецификаций.

Генерация Frontend UI/UX

Создание современных интерфейсов дашбордов с упором на типографику, теорию цвета и адаптивную верстку.

Преимущества

Ограничения

Лидирующий в индустрии Coding: Достигает state-of-the-art показателя в 79.6% на SWE-bench Verified, опережая конкурентов в решении реальных проблем GitHub.
Latency в режиме Thinking: Высокие бюджеты на thinking tokens увеличивают время до первого token, что не всегда подходит для мгновенных ответов в чате.
Лучшее соотношение производительности и стоимости: Обеспечивает уровень интеллекта, близкий к Opus, при стоимости в 5 раз ниже, что делает её наиболее экономичным выбором для масштабной автоматизации.
Ограничения частоты запросов: Пользователи Free и Pro сталкиваются с жесткими лимитами сообщений при интенсивной работе, что требует перехода на API.
Навигация в интерфейсах на уровне человека: Результат 72.5% на OSWorld-Verified демонстрирует огромный прогресс в управлении сложным ПО без использования API.
Деградация контекста свыше 150k: Несмотря на 1M context window, model иногда может упускать детали в середине очень объемных prompt.
Адаптивная мощность Reasoning: Поддерживает масштабируемый режим Thinking, позволяющий разработчикам увеличивать усилия reasoning для сложных логических задач.
Уязвимость к Prompt Injection: Функция Computer Use несет риски: вредоносные сайты могут попытаться перехватить управление виртуальной браузерной сессией model.

Быстрый старт API

anthropic/claude-sonnet-4-6

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude Sonnet 4.6

Посмотрите, что думает сообщество о Claude Sonnet 4.6

Claude Sonnet 4.6 набрала 94% в нашем страховом benchmark, став самой производительной model для задач Computer Use, которую мы когда-либо тестировали.
Swami Sivasubramanian
twitter
Хайп оправдан, это определенно лучшая (и самая приятная в работе) LLM, которой я когда-либо пользовался! На голову выше всего, что я видел до сих пор.
WolframRavenwolf
reddit
Claude Sonnet 4.6 просто великолепна, она не просто 'иногда забавная'. Она в целом теплая, честная и просоциальная.
Anton P.
twitter
Sonnet 4.6 справляется с задачами coding гораздо лучше, чем Cline. Я больше даже не открываю файлы вручную.
semibaron
hackernews
1M context window — это прорыв для миграции кодовой базы. Я просто загрузил весь свой старый стек целиком.
DevOpsDan
reddit
Она обрабатывает сложные таблицы и веб-формы с почти пугающей точностью. Beta-версия Computer Use наконец-то готова к работе.
AI_Insights_Daily
youtube

Видео о Claude Sonnet 4.6

Смотрите обучающие материалы, обзоры и обсуждения о Claude Sonnet 4.6

Sonnet 4.6 показал более высокий результат в тестах ВВП, которые измеряют выполнение реальных значимых задач.

Становится все сложнее определить, способны ли эти models на действия, связанные с биологическими или химическими угрозами.

Соотношение скорости и интеллекта здесь практически не имеет равных среди других models на рынке.

Anthropic явно делает упор на agentic возможности в этом релизе.

Структура затрат делает эту model новым стандартом для любого разработчика, использующего API в больших объемах.

Эта model примерно в два раза быстрее по сравнению с Opus месячной давности.

В итоге, друзья, эта model — лучшее вложение средств для enterprise coding.

Возможности зрения для интерпретации сложных диаграмм архитектуры значительно улучшены.

Я скормил ей 50 файлов, и она идеально провела рефакторинг всей логики маршрутизации.

В общении она кажется гораздо более человечной по сравнению с GPT-4o.

Она фактически обходит Opus 4.6 в некоторых областях, будучи при этом на 40% дешевле.

Когда мы заполняем context window и доходим до отметки примерно в 150 000 tokens, эффективность начинает падать.

Функция адаптивного reasoning позволяет буквально переключаться между скоростью и глубокой логикой.

Этот релиз ощущается как первая по-настоящему 'agent-first' model от Anthropic.

Я бы использовал её для всего, за исключением, пожалуй, самого высокого уровня художественного текста.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Claude Sonnet 4.6

Экспертные советы для максимальной эффективности Claude Sonnet 4.6.

Используйте Context Compaction

Включите функцию Compaction в API для автоматического обобщения истории длинных диалогов.

Стратегически распределяйте Thinking Tokens

Для математических или сложных логических задач выделите больший бюджет на thinking tokens, чтобы позволить model изучить несколько путей reasoning.

Запрашивайте соответствие SPEC

Явно просите model следовать современным архитектурным практикам, так как она эффективно работает с обновленными инструментами.

Используйте Artifacts для UI

Поощряйте использование Artifacts для отделения генерации кода от чата для итераций в реальном времени.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Часто задаваемые вопросы о Claude Sonnet 4.6

Найдите ответы на частые вопросы о Claude Sonnet 4.6