anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet — первая model от Anthropic с гибридным reasoning, предлагающая state-of-the-art возможности кодинга, context window 200k и визуализированный...

anthropic logoanthropicClaude 3February 24, 2025
Контекст
200Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$3.00/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
84.8%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Claude 3.7 Sonnet набрал 84.8% в этом бенчмарке.
HLE
34%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Claude 3.7 Sonnet набрал 34% в этом бенчмарке.
MMLU
89%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Claude 3.7 Sonnet набрал 89% в этом бенчмарке.
MMLU Pro
74%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Claude 3.7 Sonnet набрал 74% в этом бенчмарке.
SimpleQA
42%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Claude 3.7 Sonnet набрал 42% в этом бенчмарке.
IFEval
93.2%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Claude 3.7 Sonnet набрал 93.2% в этом бенчмарке.
AIME 2025
54.8%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Claude 3.7 Sonnet набрал 54.8% в этом бенчмарке.
MATH
96.2%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Claude 3.7 Sonnet набрал 96.2% в этом бенчмарке.
GSM8k
97%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Claude 3.7 Sonnet набрал 97% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Claude 3.7 Sonnet набрал 92% в этом бенчмарке.
MathVista
70%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Claude 3.7 Sonnet набрал 70% в этом бенчмарке.
SWE-Bench
70.3%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Claude 3.7 Sonnet набрал 70.3% в этом бенчмарке.
HumanEval
94%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Claude 3.7 Sonnet набрал 94% в этом бенчмарке.
LiveCodeBench
65%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Claude 3.7 Sonnet набрал 65% в этом бенчмарке.
MMMU
75%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Claude 3.7 Sonnet набрал 75% в этом бенчмарке.
MMMU Pro
55%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Claude 3.7 Sonnet набрал 55% в этом бенчмарке.
ChartQA
89%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Claude 3.7 Sonnet набрал 89% в этом бенчмарке.
DocVQA
94%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Claude 3.7 Sonnet набрал 94% в этом бенчмарке.
Terminal-Bench
35.2%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Claude 3.7 Sonnet набрал 35.2% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Claude 3.7 Sonnet набрал 12% в этом бенчмарке.

Попробуйте Claude 3.7 Sonnet Бесплатно

Общайтесь с Claude 3.7 Sonnet бесплатно. Протестируйте возможности, задавайте вопросы и изучайте, на что способна эта ИИ-модель.

Промпт
Ответ
anthropic/claude-3-7-sonnet-20250219

Ваш ответ ИИ появится здесь

О модели Claude 3.7 Sonnet

Узнайте о возможностях, функциях и способах использования Claude 3.7 Sonnet.

Гибридный reasoning и прозрачность

Claude 3.7 Sonnet знаменует собой важный сдвиг в архитектуре LLM, являясь первой моделью Anthropic с «гибридным reasoning». Она уникальным образом позволяет пользователям переключаться между стандартными ответами с низкой latency и режимом «extended thinking», который отображает внутренний chain-of-thought. Эта прозрачность дает пользователям четкое представление о логике model, что делает ее особенно эффективной для сложного поиска неисправностей и ответственных аналитических задач.

Мастерство в программной инженерии

Разработанная с упором на разработку ПО и выдачу готовых к использованию результатов, эта model установила новые отраслевые стандарты в таких benchmark, как SWE-Bench Verified. Она преуспевает в «vibe кодинге», когда разработчики описывают высокоуровневые намерения, а model берет на себя реализацию в нескольких файлах. Она справляется с комплексным рефакторингом и архитектурными решениями с точностью, превосходящей предыдущие frontier model.

Огромный контекст и agentic-инструменты

Благодаря огромному context window в 200,000 tokens и набору agentic-инструментов под названием Claude Code, она превращается из простого чат-бота в полноценного технического партнера. Она способна управлять всем жизненным циклом проекта: от первоначального обзора документации до автоматизированных рабочих процессов git и выполнения тестов, гарантируя скорость разработки без багов.

Claude 3.7 Sonnet

Варианты использования Claude 3.7 Sonnet

Откройте для себя различные способы использования Claude 3.7 Sonnet для достижения отличных результатов.

Vibe Coding

Создание функционального ПО с нуля путем описания намерений на естественном языке.

Продвинутая отладка

Использование extended thinking для анализа сложных логов и предоставления точных исправлений с первой попытки.

Анализ большого контекста

Обзор и рефакторинг целых кодовых баз или объемной технической документации за один prompt.

Agentic-разработка

Работа терминальных инструментов, таких как Claude Code, для автоматизации git-процессов и выполнения тестов.

Генерация Frontend UI

Создание элегантных и поддерживаемых компонентов на React и Svelte с врожденным чувством дизайна.

Фактологические исследования

Анализ массивных PDF-документов и наборов данных с высокой точностью и низким уровнем галлюцинаций.

Преимущества

Ограничения

Лидирующий в индустрии кодинг: Достигнут показатель state-of-the-art в 70.3% на SWE-bench Verified — решение реальных проблем GitHub с беспрецедентной точностью.
Latency ответа: Включение режима «extended thinking» значительно увеличивает время до получения первого token по сравнению со стандартными ответами model.
Прозрачный reasoning: Первая model, предлагающая видимый и контролируемый пользователем «extended thinking» для решения сложных и ответственных задач.
Премиальная цена: Стоимость вывода в $15 за 1 млн tokens остается значительно выше, чем у большинства «mini» решений или альтернатив с открытыми весами.
Agentic-интеграция: Специально оптимизирована для использования инструментов и взаимодействия с CLI через фреймворк Claude Code для сквозной автоматизации задач.
Нет нативной поддержки аудио/видео: В отличие от GPT-4o или Gemini 2.0, у нее отсутствуют возможности нативной обработки аудио и видео на входе.
Превосходное чувство дизайна: Стабильно генерирует более элегантный, доступный и поддерживаемый код интерфейсов по сравнению с другими frontier model.
Вычислительная стоимость: Сессии с глубоким reasoning могут быстро расходовать бюджет tokens и лимиты контекста при рефакторинге масштабных кодовых баз.

Быстрый старт API

anthropic/claude-3-7-sonnet-20250219

Посмотреть документацию
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Claude 3.7 Sonnet

Посмотрите, что думает сообщество о Claude 3.7 Sonnet

"Claude 3.7 Sonnet — лучшая AI model для кодинга в мире; она поразила меня на сложнейших задачах."
rawcell4772
reddit
"С одного prompt она идеально справилась со всем в сложном TypeScript проекте."
rawcell4772
reddit
"Claude Code с Sonnet 3.7 намного лучше, чем Cline, и на данный момент это лучший инструмент."
peterkrueck
reddit
"Скачок качества с моделями топ-уровня, такими как 3.7, изменил мои взгляды на будущее."
lurking_horrors
reddit
"Claude 3.7 — это просто пушка, залетает совсем иначе... реально лучший, отвечаю."
Fireship
youtube
"Режим reasoning в Claude 3.7 — это полная смена парадигмы в отладке логики."
DevLead99
x

Видео о Claude 3.7 Sonnet

Смотрите обучающие материалы, обзоры и обсуждения о Claude 3.7 Sonnet

Новая model 3.7 абсолютно разнесла все остальные... теперь она способна решать 70.3% проблем на GitHub

Использование строго типизированного языка вместе с TDD — это способы для AI подтвердить, что написанный им код действительно валиден

Эта model невероятно умна в следовании инструкциям

Производительность на SWE-bench просто безумная

Визуализированный reasoning меняет правила игры в вопросах прозрачности

Claude 3.7 Sonnet... вероятно, это лучшая LLM для генерации кода

Если вы используете API, вы можете получить 128,000 tokens вывода за один раз

Лимит вывода в 128k — это масштабное обновление

Ее чувство дизайна в frontend-компонентах не имеет равных

Использование инструментов и agentic-возможности лежат в основе этой model

Reasoning должен быть интегрированной возможностью frontier model, а не отдельной моделью

Claude 3.7 удается превзойти эти модели [DeepSeek, o3] на довольно значительную величину

Latency немного выше в режиме reasoning

Она побеждает DeepSeek R1 в нескольких задачах на следование инструкциям

Anthropic действительно сфокусировались на результатах, готовых к продакшену

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Профессиональные Советы

Экспертные советы, которые помогут вам максимально использовать эту модель.

Бюджет на мышление

Используйте режим «extended thinking» специально для сложной логики или планирования архитектуры, чтобы получить результаты более высокого качества.

Контроль контекста

Регулярно используйте /clear или перезапускайте чаты, чтобы сэкономить на стоимости контекста и предотвратить замедление работы model.

Верификация

Просите Claude писать и запускать тесты для собственного кода с помощью инструмента Claude Code, чтобы гарантировать стабильность в продакшене.

Markdown-спецификации

Предоставляйте требования к функциям в структурированных Markdown-файлах для лучшего следования инструкциям в крупных проектах.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Часто Задаваемые Вопросы

Найдите ответы на частые вопросы об этой модели