anthropic

Claude Opus 4.7

Claude Opus 4.7 — это флагманская модель от Anthropic с контекстом 1 млн tokens, адаптивным reasoning и 3,3-кратным увеличением разрешения зрения для...

Frontier ModelAgentic AICoding AssistantLarge ContextAnthropic
anthropic logoanthropicClaude16 апреля 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
128Kтокенов
Цена ввода
$5.00/ 1M
Цена вывода
$25.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
94.2%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude Opus 4.7 набрал 94.2% в этом бенчмарке.
HLE
54.7%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Claude Opus 4.7 набрал 54.7% в этом бенчмарке.
MMLU
89.8%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude Opus 4.7 набрал 89.8% в этом бенчмарке.
MMLU Pro
89.9%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude Opus 4.7 набрал 89.9% в этом бенчмарке.
SimpleQA
31.6%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Claude Opus 4.7 набрал 31.6% в этом бенчмарке.
IFEval
91.2%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude Opus 4.7 набрал 91.2% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude Opus 4.7 набрал 100% в этом бенчмарке.
MATH
94.1%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude Opus 4.7 набрал 94.1% в этом бенчмарке.
GSM8k
98.4%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude Opus 4.7 набрал 98.4% в этом бенчмарке.
MGSM
94.1%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude Opus 4.7 набрал 94.1% в этом бенчмарке.
MathVista
78%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude Opus 4.7 набрал 78% в этом бенчмарке.
SWE-Bench
87.6%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude Opus 4.7 набрал 87.6% в этом бенчмарке.
HumanEval
92.4%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude Opus 4.7 набрал 92.4% в этом бенчмарке.
LiveCodeBench
78.5%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude Opus 4.7 набрал 78.5% в этом бенчмарке.
MMMU
80.7%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude Opus 4.7 набрал 80.7% в этом бенчмарке.
MMMU Pro
85.6%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude Opus 4.7 набрал 85.6% в этом бенчмарке.
ChartQA
79.5%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude Opus 4.7 набрал 79.5% в этом бенчмарке.
DocVQA
92.5%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude Opus 4.7 набрал 92.5% в этом бенчмарке.
Terminal-Bench
59.3%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude Opus 4.7 набрал 59.3% в этом бенчмарке.
ARC-AGI
68.8%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude Opus 4.7 набрал 68.8% в этом бенчмарке.

О модели Claude Opus 4.7

Узнайте о возможностях, функциях и способах использования Claude Opus 4.7.

Обзор модели

Claude Opus 4.7, флагманская модель в архитектурной серии Claude 4. Она использует framework Adaptive Thinking, позволяющий модели масштабировать когнитивные усилия в зависимости от сложности задачи. Это заменяет фиксированные бюджеты на размышления динамическими уровнями логики. Теперь разработчики могут контролировать глубину внутреннего reasoning через параметр усилия API, что позволяет найти лучший баланс между latency и логической строгостью. Модель специально настроена для корпоративных рабочих процессов с высокими ставками и автономных agentic циклов.

Контекст и возможности Multimodal

Эта модель предоставляет context window размером 1 млн tokens без наценок за большой контекст. Лимит вывода составляет 128 000 tokens, что позволяет генерировать массивные технические документы или полные репозитории кода за один ответ. Разрешение зрения в 3,3 раза выше, чем у предыдущих итераций. Это обеспечивает идеальное понимание пользовательского интерфейса и координатное соответствие 1:1 для изображений до 2576 пикселей. Эти улучшения делают модель надежным выбором для анализа документов и визуального аудита.

Agentic инженерия и безопасность

Архитектурные обновления направлены на решение задач с долгосрочным горизонтом планирования и программную инженерию. Модель набирает 87,6% в таблице лидеров SWE-bench Verified, на данный момент лидируя по способности решать реальные задачи из GitHub. Модель внедряет бюджеты задач, помогая управлять потреблением tokens в ходе многоходовых сессий агентов. Anthropic интегрировала средства кибербезопасности реального времени в базовую архитектуру, чтобы предотвратить участие модели в злонамеренных действиях, сохраняя при этом полезность для исследователей безопасности.

Claude Opus 4.7

Варианты использования Claude Opus 4.7

Откройте для себя различные способы использования Claude Opus 4.7 для достижения отличных результатов.

Agentic программная инженерия

Использование высокого уровня усилий для автономного рефакторинга репозиториев и разрешения сложных кросс-файловых зависимостей.

Синтез крупномасштабных репозиториев

Обработка 1 млн tokens исходного кода для отображения архитектурных потоков и генерации технической документации.

Анализ изображений высокого разрешения

Анализ плотных графиков и скриншотов пользовательского интерфейса с детализацией, в 3,3 раза превышающей показатели предыдущих frontier model.

Исследование уязвимостей кибербезопасности

Проведение глубоких аудитов безопасности и анализа zero-day в рамках проверенных границ безопасности.

Корпоративное извлечение знаний

Извлечение структурированных данных из огромных технических библиотек и выполнение сложного перекрестного анализа документов.

Интерактивное 3D-прототипирование

Генерация функциональных 3D-сред и игровой логики на основе описаний на естественном языке.

Преимущества

Ограничения

Лучшая в индустрии точность кода: Достигает 87,6% в SWE-bench Verified, превосходя все другие общедоступные модели для программной инженерии.
Более высокое потребление tokens: Новый токенизатор приводит к примерно на 35% большему потреблению tokens для того же текста по сравнению с предыдущими версиями Claude.
Стабильность при огромном контексте: Поддерживает 100% точность в пределах context window 1 млн tokens без дополнительных наценок за длину контекста.
Фиксированные параметры сэмплирования: Удаление элементов управления temperature и top-p ограничивает творческую гибкость для недетерминированных задач.
Превосходная визуальная острота: Поддерживает изображения до 2576 пикселей, обеспечивая отображение 1:1 для точного анализа документов и интерфейсов.
Высокая latency при максимальных усилиях: Генерация ответов с уровнем усилий 'xhigh' приводит к значительному времени ожидания при решении сложных задач.
Динамический контроль reasoning: Позволяет разработчикам переключать уровни усилий через framework адаптивного мышления для баланса между latency и логикой.
Агрессивные отказы по безопасности: Фильтры кибербезопасности в реальном времени могут приводить к ложным отказам при легитимных исследованиях безопасности.

Быстрый старт API

anthropic/claude-opus-4-7

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-opus-4-7",
  max_tokens: 4096,
  thinking: { type: "adaptive" },
  messages: [{ role: "user", content: "Проанализируй эту архитектуру на наличие багов параллелизма." }],
});

console.log(msg.content[0].text);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude Opus 4.7

Посмотрите, что думает сообщество о Claude Opus 4.7

Claude Opus 4.7 лидирует в SWE-bench и agentic reasoning, обходя GPT-5.4 и Gemini 3.1 Pro.
zarfet
twitter
Тот факт, что она может сгенерировать процедурную 3D-игру про скейтбординг за один раз, доказывает плотность логики модели.
jrandolph
hackernews
Вышел Opus 4.7. Результаты в cursorbench подскочили с 58% до 70%. Визуальная острота XBOW 98,5% против 54,5% у Opus 4.6.
hirenthakore
twitter
Claude склонен к избыточному проектированию: просишь простую функцию, а получаешь архитектуру, рассчитанную на масштабирование на десятилетие.
Ok_Today5649
reddit
Первые отзывы о Claude Opus 4.7 указывают на более высокое использование tokens и более строгие требования к prompt.
kimmonismus
twitter
Уровень мышления X-High, это недостающее звено для сложных agentic сценариев.
Bijan Bowen
youtube

Видео о Claude Opus 4.7

Смотрите обучающие материалы, обзоры и обсуждения о Claude Opus 4.7

Claude остается лучшей моделью для цитирования, доступной на сегодняшний день.

Она стоит столько же, сколько и раньше, но теперь дает больше контроля над процессом reasoning.

Это работает идеально. Модель подобрала инструменты, которые я бы выбрал сам.

Модель кажется заметно быстрее, когда вы не используете максимальные уровни мышления.

Видно, как она продумывает крайние случаи, прежде чем написать хотя бы одну строку кода.

Использование этой модели стоит значительно дороже... вы будете платить на 35% больше за Opus 4.7.

Только обновление визуальных возможностей того стоит... она может принимать изображения с разрешением в три раза выше без обрезки.

Если вы используете API, рассчитывайте платить на 35% больше, чем раньше.

Изменение токенизации, это скрытый удар по вашим счетам API, если не быть осторожным.

Она справляется с глубоким контекстом намного лучше, чем предыдущая версия Opus 4.

Визуальные возможности этой модели значительно лучше.

Уровень мышления X-High, это та недостающая середина, которая была нужна для сложных agentic рабочих процессов.

Это абсолютно на 100% оправдывает громкий заголовок. Она меня поразила.

Она правильно определила ошибку в моем устаревшем коде, которую пропустили три другие модели.

Уровень автономности в агентских циклах, это то, что отличает ее от GPT-5.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Claude Opus 4.7

Экспертные советы для максимальной эффективности Claude Opus 4.7.

Активация Adaptive Thinking

Явно активируйте режим адаптивного мышления в API-запросах, чтобы Claude выбрал оптимальную глубину reasoning.

Использование X-High для агентов

Установите параметр усилия на значение xhigh для agentic циклов, чтобы максимизировать самопроверку и логическую точность.

Удаление лишних инструкций

Удалите устаревшие prompt типа «дважды проверь свою работу», так как модель оптимизирована для внутренней самокоррекции.

Мониторинг потребления tokens

Используйте новый механизм отслеживания токенизации, чтобы контролировать 35%-ное увеличение количества tokens для идентичных текстовых входных данных.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Часто задаваемые вопросы о Claude Opus 4.7

Найдите ответы на частые вопросы о Claude Opus 4.7