anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 предлагает передовую производительность для кодинга и computer use с массивным окном контекста 1 млн tokens всего за $3/1 млн tokens.

Агентский AIМультимодальностьПрограммированиеComputer UseДлинный контекст
anthropic logoanthropicClaude 417 февраля 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
64Kтокенов
Цена ввода
$3.00/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
89.9%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude Sonnet 4.6 набрал 89.9% в этом бенчмарке.
HLE
49%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Claude Sonnet 4.6 набрал 49% в этом бенчмарке.
MMLU
89.3%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude Sonnet 4.6 набрал 89.3% в этом бенчмарке.
MMLU Pro
79.2%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude Sonnet 4.6 набрал 79.2% в этом бенчмарке.
SimpleQA
48.5%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Claude Sonnet 4.6 набрал 48.5% в этом бенчмарке.
IFEval
89.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude Sonnet 4.6 набрал 89.5% в этом бенчмарке.
AIME 2025
83%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude Sonnet 4.6 набрал 83% в этом бенчмарке.
MATH
85.3%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude Sonnet 4.6 набрал 85.3% в этом бенчмарке.
GSM8k
96.4%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude Sonnet 4.6 набрал 96.4% в этом бенчмарке.
MGSM
92.8%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude Sonnet 4.6 набрал 92.8% в этом бенчмарке.
MathVista
68.7%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude Sonnet 4.6 набрал 68.7% в этом бенчмарке.
SWE-Bench
79.6%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude Sonnet 4.6 набрал 79.6% в этом бенчмарке.
HumanEval
92.1%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude Sonnet 4.6 набрал 92.1% в этом бенчмарке.
LiveCodeBench
72.4%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude Sonnet 4.6 набрал 72.4% в этом бенчмарке.
MMMU
74.2%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude Sonnet 4.6 набрал 74.2% в этом бенчмарке.
MMMU Pro
75.6%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude Sonnet 4.6 набрал 75.6% в этом бенчмарке.
ChartQA
88.1%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude Sonnet 4.6 набрал 88.1% в этом бенчмарке.
DocVQA
93.4%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude Sonnet 4.6 набрал 93.4% в этом бенчмарке.
Terminal-Bench
59.1%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude Sonnet 4.6 набрал 59.1% в этом бенчмарке.
ARC-AGI
58.3%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude Sonnet 4.6 набрал 58.3% в этом бенчмарке.

О модели Claude Sonnet 4.6

Узнайте о возможностях, функциях и способах использования Claude Sonnet 4.6.

Высокопроизводительный агентский интеллект

Claude Sonnet 4.6, самая универсальная модель от Anthropic, созданная как основной движок для сложных корпоративных рабочих процессов и автономных агентов. Выпущенная 17 февраля 2026 года, она представляет возможности computer use человеческого уровня и context window на 1 миллион tokens. Архитектура модели балансирует скорость систем среднего уровня с глубиной reasoning, обычно зарезервированной для класса Opus, что делает её устойчивым выбором для высоконагруженных production-сред.

Адаптивное мышление и мультимодальность

Технически Sonnet 4.6 использует механизм Adaptive Thinking. Это позволяет разработчикам масштабировать внутренние усилия reasoning в зависимости от конкретных требований задачи, оптимизируя их либо для sub-second latency, либо для глубокой логической проверки. Модель нативно является multimodal, предлагая state-of-the-art производительность при обработке текста, изображений высокого разрешения и аудиофайлов. Она превосходно интерпретирует плотную техническую документацию и сложные визуальные данные, такие как архитектурные чертежи или финансовые графики.

Отраслевой стандарт для программирования

С рекордным результатом 79.6% в SWE-bench Verified, Sonnet 4.6 стала выбором по умолчанию для автоматизации разработки ПО. Способность рассуждать в рамках огромных кодовых баз в пределах своего 1M context window позволяет ей разрешать баги в нескольких файлах и планировать архитектурный рефакторинг с минимальным участием человека. Предлагая интеллект уровня Opus за $3 за миллион входных tokens, она устраняет финансовые барьеры, ранее связанные с внедрением по-настоящему автономных AI-систем.

Claude Sonnet 4.6

Варианты использования Claude Sonnet 4.6

Откройте для себя различные способы использования Claude Sonnet 4.6 для достижения отличных результатов.

Автономная разработка ПО

Решение сложных проблем в GitHub-репозиториях с множеством файлов и проведение рефакторинга всего репозитория с точностью 79.6% согласно SWE-bench.

Computer use человеческого уровня

Прямая навигация по интерфейсам десктопного ПО и веб-сайтов для выполнения многоэтапных административных задач без необходимости в кастомных API-интеграциях.

Анализ документов большого объема

Одновременный обзор тысяч страниц юридических контрактов или научных работ в рамках context window объемом 1 миллион tokens.

Финансовая аналитика и прогнозирование

Обработка отчетов о доходах и квартальных отчетов для выявления тонких рыночных аномалий с использованием адаптивного reasoning повышенной сложности.

Мультимодальная техническая поддержка

Интерпретация сложных технических схем, фотографий печатных плат и аудиозаписей для предоставления точных инструкций по устранению неполадок.

Агентская бизнес-стратегия

Планирование и реализация долгосрочных операций с использованием топовых результатов benchmark по стратегии и логике.

Преимущества

Ограничения

Элитная точность кодинга: Устанавливает отраслевой стандарт с результатом 79.6% в SWE-bench Verified, превосходя все другие модели среднего уровня и большинство моделей flagship-класса.
Отсутствие нативного ввода видео: Требует ручного извлечения кадров для визуальной обработки видеофайлов, что усложняет работу с медиаконтентом.
Непревзойденная емкость контекста: Окно в 1 миллион tokens позволяет загружать целые технические библиотеки или огромные кодовые базы без потери качества работы.
Увеличенная latency reasoning: Использование адаптивного режима reasoning с высокой интенсивностью значительно увеличивает время до получения первого token по сравнению со стандартным inference.
Автономный computer use: Достигает результата 72.5% в OSWorld, позволяя модели управлять сложными GUI и программными инструментами в качестве виртуального оператора.
Высокая стоимость выходного reasoning: Хотя цены на ввод конкурентоспособны, задачи, требующие максимальных усилий reasoning, могут потреблять большое количество выходных tokens, увеличивая расходы.
Оптимизированное соотношение цены и качества: Обеспечивает уровень интеллекта, близкий к Opus, за 1/5 стоимости, что делает её наиболее экономичным выбором для крупномасштабного развертывания агентов.
Шум при извлечении из контекста: При достижении лимита в 1M tokens модель может иногда страдать от снижения концентрации, если контекст заполнен нерелевантными данными.

Быстрый старт API

anthropic/claude-sonnet-4-6

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Проанализируй этот репозиторий на наличие архитектурных узких мест." }
  ],
});

console.log(response.content[0].text);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude Sonnet 4.6

Посмотрите, что думает сообщество о Claude Sonnet 4.6

Контекст, это шум. Большие окна tokens, это ловушка. Давайте агентам только узкий, кураторский сигнал, который им нужен.
Logical-Storm-1180
reddit
Это Claude Sonnet 4.6: наша самая мощная модель Sonnet на данный момент. Это полноценное обновление для кодинга, computer use и агентского планирования.
Claude
twitter
Соотношение производительности и стоимости Claude Sonnet 4.6 экстраординарно, трудно переоценить, как быстро развиваются эти модели.
Replit
youtube
Sonnet 4.6 теперь доступен в Claude Code. Он дешевле, чем Opus 4.6, и приближается к интеллекту уровня Opus.
Boris Cherny
twitter
Claude 4.6, новый лидер в агентской производительности, немного опережающий Opus 4.6 в реальных рабочих задачах.
Artificial Analysis
twitter
Тот факт, что эта модель может управлять компьютерным интерфейсом с точностью 72%, по сути, устраняет необходимость в большинстве специализированных API.
DevOpsGuru
hackernews

Видео о Claude Sonnet 4.6

Смотрите обучающие материалы, обзоры и обсуждения о Claude Sonnet 4.6

Sonnet 4.6 уже здесь, и он может заменить Opus в 90% вашей повседневной работы.

Но самое приятное, он на 40% дешевле, чем использование Opus 4.6.

Результаты SWE-bench просто невероятны для модели среднего уровня.

Вы можете эффективно загрузить в него целую кодовую базу, и он не потеряет нить рассуждений.

Адаптивные усилия thinking позволяют вам жертвовать скоростью ради более глубокой логики.

Первые пользователи сообщают, что модель способна на почти человеческий уровень производительности при работе со сложными электронными таблицами.

Эта модель примерно в два раза быстрее по сравнению с Opus.

Context window в 1 миллион tokens сейчас находится в бета-версии, но работает очень хорошо.

Она управляет интерфейсами программ без необходимости в специфических API-интеграциях.

Возможности программирования на Python и JavaScript практически достигли потолка.

Anthropic заявляет, что новое окно контекста достаточно велико, чтобы вместить целые кодовые базы и эффективно рассуждать в рамках всего этого контекста.

Opus 4.6, это вариант «ядерной бомбы»... но теперь у нас наконец-то есть скальпель, что является отличной новостью.

Computer use, ключевая функция здесь, она действительно двигает мышкой и печатает.

Финансовым аналитикам понравится глубина рассуждений при проверке документов.

Это первый случай, когда модель «Sonnet» ощущается как абсолютно лучшая в своем классе.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Claude Sonnet 4.6

Экспертные советы для максимальной эффективности Claude Sonnet 4.6.

Оптимизация усилий Thinking

Используйте адаптивный режим thinking, чтобы сэкономить на простых запросах, и оставляйте режим «max» для задач, требующих математических вычислений и логики.

Внедрение сжатия контекста

Используйте функции кэширования и сжатия prompt для эффективной работы с окном в 1M tokens без лишних затрат.

Структурированное закрепление поведения

Используйте центральный файл markdown для проекта, чтобы поддерживать актуальную «единую версию правды» для архитектурных решений модели.

Извлечение кадров из видео

Поскольку нативная поддержка видео отсутствует, извлекайте ключевые кадры с частотой 1 к/с для наиболее точного визуального анализа контента.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Часто задаваемые вопросы о Claude Sonnet 4.6

Найдите ответы на частые вопросы о Claude Sonnet 4.6