anthropic

Claude Sonnet 4.5

Claude Sonnet 4.5 от Anthropic обеспечивает мировое лидерство в кодинге (77,2% на SWE-bench) и предлагает context window объемом 200K, оптимизированное для...

AI-кодингAgentic AIHybrid reasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
Контекст
200Kтокенов
Макс. вывод
64Kтокенов
Цена ввода
$3.00/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
83%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude Sonnet 4.5 набрал 83% в этом бенчмарке.
HLE
34%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Claude Sonnet 4.5 набрал 34% в этом бенчмарке.
MMLU
89%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude Sonnet 4.5 набрал 89% в этом бенчмарке.
MMLU Pro
78%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude Sonnet 4.5 набрал 78% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Claude Sonnet 4.5 набрал 52% в этом бенчмарке.
IFEval
88%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude Sonnet 4.5 набрал 88% в этом бенчмарке.
AIME 2025
87%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude Sonnet 4.5 набрал 87% в этом бенчмарке.
MATH
87%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude Sonnet 4.5 набрал 87% в этом бенчмарке.
GSM8k
98%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude Sonnet 4.5 набрал 98% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude Sonnet 4.5 набрал 92% в этом бенчмарке.
MathVista
72%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude Sonnet 4.5 набрал 72% в этом бенчмарке.
SWE-Bench
77%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude Sonnet 4.5 набрал 77% в этом бенчмарке.
HumanEval
94%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude Sonnet 4.5 набрал 94% в этом бенчмарке.
LiveCodeBench
68%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude Sonnet 4.5 набрал 68% в этом бенчмарке.
MMMU
78%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude Sonnet 4.5 набрал 78% в этом бенчмарке.
MMMU Pro
55%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude Sonnet 4.5 набрал 55% в этом бенчмарке.
ChartQA
89%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude Sonnet 4.5 набрал 89% в этом бенчмарке.
DocVQA
92%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude Sonnet 4.5 набрал 92% в этом бенчмарке.
Terminal-Bench
50%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude Sonnet 4.5 набрал 50% в этом бенчмарке.
ARC-AGI
14%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude Sonnet 4.5 набрал 14% в этом бенчмарке.

Попробуйте Claude Sonnet 4.5 Бесплатно

Общайтесь с Claude Sonnet 4.5 бесплатно. Протестируйте возможности, задавайте вопросы и изучайте, на что способна эта ИИ-модель.

Промпт
Ответ
Claude Sonnet 4.5

Ваш ответ ИИ появится здесь

О модели Claude Sonnet 4.5

Узнайте о возможностях, функциях и способах использования Claude Sonnet 4.5.

**На рубеже Agentic Intelligence**

Claude Sonnet 4.5 представляет собой самый значительный скачок Anthropic в области «frontier intelligence», специально оптимизированный для эры автономных AI-agents. Выпущенная в конце 2025 года, она является первой в индустрии моделью с настоящим «hybrid reasoning», позволяющей разработчикам переключаться между высокоскоростным выполнением рутинных задач и углубленным мышлением для решения сложных логических проблем. Она заметно превзошла предыдущие benchmark в категориях использования компьютера и оркестрации инструментов, став предпочтительным движком для терминальных agents и многофайловой разработки ПО.

**Точность и снижение галлюцинаций**

Model построена на архитектуре, в которой приоритет отдается логике «семь раз отмерь, один раз отрежь», что значительно снижает уровень угодничества и галлюцинаций, характерных для серии 3.5. Благодаря огромному лимиту вывода в 64 000 tokens и входному context window в 200 000 tokens, она может поглощать целые репозитории, генерируя полные файлы приложений за один проход. В ней также представлены нативные «checkpoints» для agentic рабочих процессов, что позволяет agents самостоятельно откатываться назад и исправлять собственные ошибки.

**Превосходство в Multimodal и Reasoning**

Помимо кодинга, Sonnet 4.5 доминирует в multimodal анализе документов и сложном финансовом моделировании. Ее внутренняя логика обучена приоритизировать архитектурный контекст, что позволяет ей выстраивать карту крупномасштабных кодовых баз лучше любой предшественницы. Будь то обработка рукописных заметок или реализация полной интеграции со Stripe, Sonnet 4.5 поддерживает высокий уровень фактической точности и строгого следования инструкциям.

Claude Sonnet 4.5

Варианты использования Claude Sonnet 4.5

Откройте для себя различные способы использования Claude Sonnet 4.5 для достижения отличных результатов.

Автономная разработка ПО

используйте Claude Sonnet 4.5 для навигации по сложным кодовым базам, внедрения функций в нескольких файлах одновременно и независимого запуска тестов.

Агенты для управления интерфейсом

развертывайте model для управления рабочим столом и браузером с целью извлечения данных, работы с устаревшими системами или выполнения повторяющихся административных задач.

Корпоративный agentic поиск

организуйте многоэтапные поисковые запросы и синтезируйте разрозненную информацию из внутренней документации и открытого интернета.

Сложное финансовое моделирование

используйте результат 87% в тесте AIME для проведения глубоких логических выводов на основе финансовых отчетов и рыночных данных.

Доработка технического контента

преобразуйте высокоуровневые требования в профессиональные PRD, технические спецификации и готовые к использованию кодовые базы.

Multimodal анализ документов

обрабатывайте тысячи страниц с графиками, рукописными заметками и техническими диаграммами с помощью state-of-the-art возможностей компьютерного зрения.

Преимущества

Ограничения

Мощь agentic кодинга: в настоящее время является мировым рекордсмедом в SWE-bench Verified с показателем успеха 77.2% на реальных задачах GitHub.
Лимиты использования: пользователи платных тарифов часто сообщают о быстром достижении недельных лимитов в плане Pro за $20/мес.
Потрясающая скорость: работает со скоростью 40–60 tokens в секунду, что значительно быстрее предыдущих frontier model в интерактивном режиме.
Latency поиска: работа agentic браузера (BrowseComp) остается слабым местом по сравнению со специализированными поисковыми моделями.
Гибкость hybrid reasoning: первая model, эффективно сочетающая режим «быстрого чата» с «расширенным мышлением» (extended thinking) для сложных логических цепочек.
Пробелы в узких знаниях: испытывает трудности с высокоспециализированными визуальными задачами, такими как распознавание конкретных трюков на скейтборде (точность 29% в SkateBench).
Огромное окно вывода: лимит в 64K выходных tokens позволяет генерировать целые многофайловые функции за один API-вызов.
Затраты на agentic функции: автономная работа model в режиме терминала может потребовать $50–$100 в эквиваленте tokens за одну сессию по созданию сложного приложения.

Быстрый старт API

anthropic/claude-sonnet-4.5

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude Sonnet 4.5

Посмотрите, что думает сообщество о Claude Sonnet 4.5

"Claude Sonnet 4.5 — новый король AI-кодинга... она выглядит действительно очень круто"
James Montemagno
youtube
"Sonnet 4.5 справляется отлично... она намного быстрее и ощутимо лучше конкурентов"
Cole Medin
youtube
"Я поражен Sonnet 4.5... она проектирует просто потрясающие страницы"
Savage Reviews
youtube
"Терминальный agent — это «разработчик, живущий в вашем терминале»... он может самостоятельно изучать кодовые базы и запускать тесты"
DevUser_99
reddit
"Цена осталась такой же, как у 3.5, но функция 'Checkpoints' делает ее в 10 раз ценнее для профессиональных рабочих процессов"
AgentArchitect
x
"С результатом 77.2% на SWE-bench, это первая model, которая действительно ощущается как Senior Engineer"
HackerNewsReader
hackernews

Видео о Claude Sonnet 4.5

Смотрите обучающие материалы, обзоры и обсуждения о Claude Sonnet 4.5

Anthropic утверждает, что это «лучшая модель для кода в мире» со значительными улучшениями в reasoning, математике и управлении компьютером.

Хотя GPT-5 может быть лучше для высокоуровневого планирования, Claude 4.5 Sonnet на данный момент — самая «приятная» model для непосредственной реализации.

Скорость просто невероятная, интерактивное написание кода ощущается гораздо более плавным.

Она справляется с правками в нескольких файлах с уровнем точности, которого мы не видели раньше.

Снижение галлюцинаций делает ее надежным партнером для production-кода.

Claude Sonnet 4.5 работает намного быстрее и заметно лучше, чем GPT-5 Codex.

Она выполнила полную интеграцию Stripe за 15 минут... это более чем в два раза быстрее, чем Opus 4.1.

Способность следовать сложным инструкциям по вызову инструментов — это ее главный секрет.

Я вижу меньше проблем с «угодничеством», когда model просто соглашается с моими плохими идеями.

Это первая model, которой я бы действительно доверил управление терминальным agent без присмотра.

Это одна из лучших посадочных страниц, если не САМАЯ лучшая, которую я когда-либо видел созданной по одному prompt.

Это абсолютный зверь... она создает потрясающие страницы с действительно качественным кодом.

Возможности компьютерного зрения для интерпретации UI-дизайна значительно обновлены.

Такое ощущение, что она понимает эстетические требования, а не только технические.

Sonnet 4.5 официально стала новым benchmark для креативного фронтенд-инжиниринга.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Профессиональные Советы

Экспертные советы, которые помогут вам максимально использовать эту модель.

Используйте CLAUDE.md

разместите файл CLAUDE.md в корне вашего репозитория с краткими сводками и указаниями; это снижает неэффективный расход tokens на 30%.

Переключатель hybrid reasoning

используйте параметр 'thinking' в API-запросах только для задач с высокой логической нагрузкой, чтобы сэкономить на latency и затратах во время рутинных операций.

Папка .claude/context

создайте файл .claude/context.md для хранения архитектурных решений; model специально обучена отдавать приоритет этому пути при анализе структуры кодовой базы.

Prompt caching

включите prompt caching для статической документации или крупных кодовых баз, чтобы сэкономить до 90% затрат на входные данные при повторных запросах.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Часто Задаваемые Вопросы

Найдите ответы на частые вопросы об этой модели