anthropic

Claude Opus 4.5

Claude Opus 4.5 — самая мощная frontier model от Anthropic, обеспечивающая рекордную производительность 80,9% в SWE-bench и продвинутые автономные...

anthropic logoanthropicClaudeNovember 24, 2025
Контекст
200Kтокенов
Макс. вывод
64Kтокенов
Цена ввода
$5.00/ 1M
Цена вывода
$25.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
87%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude Opus 4.5 набрал 87% в этом бенчмарке.
MMLU
90.8%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude Opus 4.5 набрал 90.8% в этом бенчмарке.
MMLU Pro
80%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude Opus 4.5 набрал 80% в этом бенчмарке.
IFEval
90%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude Opus 4.5 набрал 90% в этом бенчмарке.
AIME 2025
37%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude Opus 4.5 набрал 37% в этом бенчмарке.
MATH
85%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude Opus 4.5 набрал 85% в этом бенчмарке.
GSM8k
95%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude Opus 4.5 набрал 95% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude Opus 4.5 набрал 92% в этом бенчмарке.
MathVista
72%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude Opus 4.5 набрал 72% в этом бенчмарке.
SWE-Bench
80.9%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude Opus 4.5 набрал 80.9% в этом бенчмарке.
HumanEval
90%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude Opus 4.5 набрал 90% в этом бенчмарке.
LiveCodeBench
75%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude Opus 4.5 набрал 75% в этом бенчмарке.
MMMU
80.7%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude Opus 4.5 набрал 80.7% в этом бенчмарке.
MMMU Pro
60%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude Opus 4.5 набрал 60% в этом бенчмарке.
ChartQA
90%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude Opus 4.5 набрал 90% в этом бенчмарке.
DocVQA
94%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude Opus 4.5 набрал 94% в этом бенчмарке.
Terminal-Bench
59.3%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude Opus 4.5 набрал 59.3% в этом бенчмарке.
ARC-AGI
37.6%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude Opus 4.5 набрал 37.6% в этом бенчмарке.

О модели Claude Opus 4.5

Узнайте о возможностях, функциях и способах использования Claude Opus 4.5.

Вершина autonomous agency

Claude Opus 4.5 представляет собой самый значительный скачок Anthropic в области frontier intelligence, специально разработанный для наиболее сложных задач в программной инженерии и автономной работе. Выпущенная в конце 2025 года, она побила рекорды в benchmark SWE-bench Verified с результатом 80.9%, став первой model, способной эффективно автоматизировать крупномасштабную отладку и рефакторинг систем с минимальным вмешательством человека.

Интеллект с душой

Помимо технических достижений, Opus 4.5 представляет усовершенствованную персону, направляемую «soul document» от Anthropic, в которой акцент сделан на дипломатичную честность и многогранную полезность. Это делает model уникально способной понимать литературный вкус и человекоцентричный дизайн. Она оптимизирована для agentic рабочих процессов, обладая context window в 200 000 tokens и специализированным параметром effort, который позволяет разработчикам масштабировать глубину reasoning в зависимости от вычислительных затрат.

Мультимодальное превосходство

Являясь multimodal электростанцией, Opus 4.5 преуспевает в задачах, связанных с vision: от разбора плотных архитектурных схем до извлечения данных из сложных макетов документов. Её способность ориентироваться в нативной среде терминала через Claude Code позволяет проводить системные аудиты и патчинг безопасности, позиционируя её как надежного и высококвалифицированного партнера для профессиональных инженерных команд.

Claude Opus 4.5

Варианты использования Claude Opus 4.5

Откройте для себя различные способы использования Claude Opus 4.5 для достижения отличных результатов.

Автономная инженерия

Автоматизирует весь жизненный цикл задач на GitHub, включая воспроизведение багов, отладку и тестирование.

Системное администрирование

Проводит автономный аудит серверов и установку патчей безопасности через прямое взаимодействие с терминалом.

Архитектурный рефакторинг

Анализирует массивные репозитории для предложения и внедрения мер по укреплению безопасности всей системы.

Синтез сложных документов

Преобразует сотни многостраничных PDF в структурированные финансовые models или визуализации данных.

Креативная разработка игр

Генерирует функциональные 3D-среды с работающей физикой на основе одиночных сложных prompts.

Постоянный исследовательский ассистент

Проводит перекрестную проверку огромных наборов данных для поиска неочевидных противоречий в юридических или технических файлах.

Преимущества

Ограничения

Рекордное написание кода: Достигает 80.9% на SWE-bench Verified, автоматизируя сложные задачи программной инженерии.
Премиальная модель ценообразования: При цене $5/$25 за 1M tokens она значительно дороже, чем models среднего уровня.
Превосходная эффективность tokens: Достигает уровня frontier intelligence, используя до 76% меньше tokens, чем Sonnet, для задач с аналогичной логикой.
Разрыв в математических benchmarks: Уступает специализированным reasoning models в математике соревновательного уровня, такой как тест AIME.
Огромное context window 200K: Обрабатывает массивные наборы документов и репозитории с высокой точностью извлечения информации.
Отсутствие нативной поддержки аудио/видео: На данный момент не может напрямую обрабатывать аудио- или видеопотоки без предварительной обработки.
Логика автономных agents: Оптимизирована для длительных автономных сессий через нативные инструменты терминала и stop hooks.
Высокая latency выполнения: Задачи с глубоким reasoning могут занимать значительное время, иногда требуя многочасовых сессий для agents.

Быстрый старт API

anthropic/claude-4.5-opus

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude Opus 4.5

Посмотрите, что думает сообщество о Claude Opus 4.5

"Каждая строка моего продакшн-кода была сгенерирована Claude Code, работающим на Opus 4.5"
Борис Черный
x
"Opus 4.5 — это когда вам важен литературный вкус и то, насколько текст похож на человеческий"
Нейт Б. Джонс
youtube
"Интеллект наконец-то дешевеет; эта model в 3 раза дешевле предыдущей Opus"
BuildwithVignesh
reddit
"Claude Opus 4.5 взломала benchmark, оказавшись слишком умной и использовав лазейку"
MetaKnowing
reddit
"Глубина reasoning и способности к написанию кода находятся на другом уровне по сравнению со всем остальным"
Сантош Гупта
x
"Agentic возможности в терминале через Claude Code делают её выдающимся инструментом для devops"
hn_user_alpha
hackernews

Видео о Claude Opus 4.5

Смотрите обучающие материалы, обзоры и обсуждения о Claude Opus 4.5

Цена теперь в три раза ниже... $5 за миллион input tokens.

Это лучший результат, который я когда-либо получал от model в тесте Minecraft с одним prompt.

Opus 4.5 набрала больше баллов, чем любой кандидат-человек в этом тестовом задании.

Reasoning здесь — это не просто следование инструкциям, это понимание намерений.

Если вы занимаетесь сложной архитектурной работой, это единственная model, которая справляется с ней надежно.

80.9% на SWE-bench verified... и использует на 50% меньше tokens, чем Sonnet.

Opus 4.5 нацелена именно на профессиональную программную инженерию, а не на любительский кодинг.

Помимо SWEBench, она показывает 15% прирост над Sonnet в Terminal Bench.

Model способна на длительные автономные сессии, которые могут продолжаться часами.

Производительность vision заметно выше при разборе плотных технических диаграмм.

Представьте Claude Opus 4.5 как слой убеждения и абсолютного agentic монстра.

Многие инженеры в итоге предпочитают Opus 4.5 из-за эргономики и обвязки.

Model осознает свою специфику даже вне контекста.

Opus 4.5 демонстрирует уровень литературного вкуса, который GPT-5.2 просто упускает.

Она использует динамический параметр effort, чтобы масштабировать свой интеллект в зависимости от задачи.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Советы для Claude Opus 4.5

Экспертные советы для максимальной эффективности Claude Opus 4.5.

Используйте High Effort для логики

Установите параметр effort на значение 'high' для сложных архитектурных задач, чтобы обеспечить максимальную глубину reasoning.

Настройте Stop Hooks

Используйте специализированные stop hooks в agentic процессах, чтобы позволить model работать и самокорректироваться на протяжении нескольких часов.

Используйте Claude Code

Сочетайте model с CLI-инструментом Claude Code, чтобы полностью раскрыть её потенциал в нативных системных задачах через терминал.

Оптимизируйте расход tokens

Используйте Opus 4.5 только для задач с высокой логической сложностью, так как она обеспечивает качество, эквивалентное Sonnet, используя при этом до 76% меньше tokens.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Часто задаваемые вопросы о Claude Opus 4.5

Найдите ответы на частые вопросы о Claude Opus 4.5