anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet — це перша модель гібридного reasoning від Anthropic, що надає провідні можливості програмування, context window на 200К та видимий процес...

anthropic logoanthropicClaude 324 лютого 2025 р.
Контекст
200Kтокенів
Макс. вивід
128Kтокенів
Ціна вводу
$3.00/ 1M
Ціна виводу
$15.00/ 1M
Модальність:TextImage
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
84.8%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Claude 3.7 Sonnet набрав 84.8% у цьому бенчмарку.
HLE
34%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Claude 3.7 Sonnet набрав 34% у цьому бенчмарку.
MMLU
89%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Claude 3.7 Sonnet набрав 89% у цьому бенчмарку.
MMLU Pro
74%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Claude 3.7 Sonnet набрав 74% у цьому бенчмарку.
SimpleQA
42%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Claude 3.7 Sonnet набрав 42% у цьому бенчмарку.
IFEval
93.2%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Claude 3.7 Sonnet набрав 93.2% у цьому бенчмарку.
AIME 2025
54.8%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Claude 3.7 Sonnet набрав 54.8% у цьому бенчмарку.
MATH
96.2%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Claude 3.7 Sonnet набрав 96.2% у цьому бенчмарку.
GSM8k
97%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Claude 3.7 Sonnet набрав 97% у цьому бенчмарку.
MGSM
92%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Claude 3.7 Sonnet набрав 92% у цьому бенчмарку.
MathVista
70%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Claude 3.7 Sonnet набрав 70% у цьому бенчмарку.
SWE-Bench
70.3%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Claude 3.7 Sonnet набрав 70.3% у цьому бенчмарку.
HumanEval
94%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Claude 3.7 Sonnet набрав 94% у цьому бенчмарку.
LiveCodeBench
65%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Claude 3.7 Sonnet набрав 65% у цьому бенчмарку.
MMMU
75%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Claude 3.7 Sonnet набрав 75% у цьому бенчмарку.
MMMU Pro
55%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Claude 3.7 Sonnet набрав 55% у цьому бенчмарку.
ChartQA
89%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Claude 3.7 Sonnet набрав 89% у цьому бенчмарку.
DocVQA
94%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Claude 3.7 Sonnet набрав 94% у цьому бенчмарку.
Terminal-Bench
35.2%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Claude 3.7 Sonnet набрав 35.2% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Claude 3.7 Sonnet набрав 12% у цьому бенчмарку.

Про Claude 3.7 Sonnet

Дізнайтеся про можливості Claude 3.7 Sonnet, функції та як це може допомогти вам досягти кращих результатів.

Гібридний дизайн reasoning

Claude 3.7 Sonnet використовує нову архітектуру, яка дозволяє користувачам обирати між швидкістю та глибиною. Це перша model, що пропонує перемикач для extended thinking, дозволяючи системі опрацьовувати складну логіку перед наданням відповіді. Ця прозорість дозволяє розробникам точно бачити, як model приходить до висновку, зменшуючи ймовірність прихованих помилок у технічній роботі.

Технічне вирішення завдань

Ця model створена для високорівневої розробки програмного забезпечення. Вона набирає 62,1% у benchmark SWE-bench Verified, демонструючи сильні здібності до виправлення реальних GitHub issues. При використанні з такими інструментами, як Claude Code, вона керує редагуванням файлів та виконанням команд у великих репозиторіях. Вона справляється з математичними та програмними завданнями з точністю, яка відповідає або перевершує поточні топові моделі reasoning.

Масштабна ємність контексту

З context window у 200 000 tokens, model опрацьовує великі масиви документації або кодові бази за один раз. Вона підтримує до 128 000 tokens виводу, коли активовано режим thinking, що робить її корисною для генерації довгих скриптів або детальних звітів. Model також є multimodal, тобто може інтерпретувати діаграми та схеми поряд із текстом.

Claude 3.7 Sonnet

Випадки використання для Claude 3.7 Sonnet

Відкрийте різні способи використання Claude 3.7 Sonnet для досягнення чудових результатів.

Agentic розробка програмного забезпечення

Використання термінального інструменту для виправлення помилок та рефакторингу коду у великих структурах файлів.

Верифікація математичних доведень

Вирішення складних математичних завдань шляхом надання model можливості продумати логічні кроки.

Аналіз репозиторіїв

Вилучення даних та виявлення патернів з цілих технічних кодових баз за один prompt.

Парсинг візуальних даних

Конвертація складних діаграм, блок-схем та технічних креслень у структуровані JSON дані.

Планування системної архітектури

Проєктування програмних систем з детальними логічними перевірками за допомогою розширеного режиму thinking.

Автоматизовані Git-воркфлоу

Управління повідомленнями комітів, перевіркою коду та запуском тестів через агентне використання інструментів.

Сильні сторони

Обмеження

Варіанти гібридного мислення: Перша model, що дозволяє користувачам перемикатися між швидкими стандартними відповідями та режимами глибокого reasoning.
Latency при reasoning: Активація режиму thinking суттєво збільшує час, необхідний для відповіді model.
Провідний агент для програмування: Найвища продуктивність у SWE-bench Verified з показником 62,1% для виправлення проблем у продуктовому середовищі.
Вартість мислення: Внутрішні reasoning tokens оплачуються за тарифом $15 за мільйон вихідних одиниць, що може накопичуватися під час тривалих завдань.
Екстремальна продуктивність виводу: Генерує до 128 000 tokens в одній відповіді, що полегшує створення масивних обсягів коду та документації.
Відсутність підтримки відео: На відміну від деяких конкурентів, він не може нативно зчитувати або аналізувати raw відеофайли через API.
Прозора логіка: Зовнішній chain-of-thought дозволяє користувачам аудіювати та відлагоджувати процес внутрішнього reasoning model.
Обмеження знань: Навчальні дані актуальні лише до жовтня 2024 року, тому останні галузеві розробки не враховані.

Швидкий старт API

anthropic/claude-3-7-sonnet

Переглянути документацію
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyze this architectural flaw..." }],
});

console.log(message.content);

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Claude 3.7 Sonnet

Подивіться, що думає спільнота про Claude 3.7 Sonnet

Claude Code разом із 3.7 Sonnet, це, по суті, джуніор-розробник на стероїдах у моєму терміналі. Вперше агентний ШІ здається справжнім.
dev_guru_99
reddit
Гібридний reasoning, це велике оновлення. Мені не завжди потрібно, щоб він думав 30 секунд, але під час відлагодження це неймовірно.
TechLead_X
twitter
Anthropic вдалося створити model, яка конкурує з o1 у математиці, залишаючись корисною для щоденного спілкування.
logic_fanatic
hackernews
Claude створює всеосяжні, гарно оформлені звіти з посиланнями менш ніж за п'ять хвилин.
ThinkingDeeplyAI_mod
reddit
Ліміт виводу у 128k, це прихована фіча. Нарешті з'явилася model, яка не обриває відповідь посеред довгого скрипта.
code_monk_42
reddit
Claude 3.7 + MCP, це найближче до Джарвіса, що є на сьогодні. Він дійсно правильно використовує мої локальні інструменти.
julie_codes_it
twitter

Відео про Claude 3.7 Sonnet

Дивіться навчальні матеріали, огляди та обговорення про Claude 3.7 Sonnet

Claude 3.7, це просто космос. Нова базова model перевершила саму себе, ставши ще кращою у програмуванні.

Нова model 3.7 просто розгромила всі інші моделі, включаючи OpenAI o3 mini.

Він здатний розв'язати 70% GitHub issues.

Extended thinking дозволяє model обдумати проблему перед тим, як видати код.

Це величезна перемога для developer experience.

Чат-боти дають поради, а Claude Code діє. Він може створювати файли, будувати вебсайти та встановлювати пакети.

Extended thinking, це те, як Claude розмірковує перед виконанням реальних дій.

Інструмент оптимізовано для роботи в терміналі.

Підключення через MCP, це те, що справді відділяє цей продукт від звичайного ChatGPT.

Model розуміє намір, що стоїть за розмитими командами термінала.

Інтеграція з терміналом через Claude Code, це рівень агентності, якого ми ще не бачили.

Здатність Claude 3.7 Sonnet показувати процес своїх думок набагато прозоріша за конкурентів.

У SWE-bench Verified він досягає вражаючих 62%.

Гібридний reasoning означає, що ви не платите штраф за latency, коли він вам не потрібен.

Він зберігає високу якість стилю письма, притаманну попереднім моделям Claude.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Claude 3.7 Sonnet

Експертні поради, які допоможуть вам отримати максимум від Claude 3.7 Sonnet та досягти кращих результатів.

Встановлюйте бюджети для reasoning

Використовуйте параметр API thinking, щоб обмежити кількість reasoning tokens та контролювати витрати.

Переглядайте блоки міркувань

Перевіряйте внутрішній chain-of-thought у відповідях, щоб верифікувати логіку складних рішень.

Використовуйте MCP-конектори

Підключайте model до локальних баз даних та хмарних сховищ для отримання контексту проєкту в реальному часі.

Оновлення контексту

Використовуйте команди підсумовування у тривалих agentic циклах, щоб фокусувати context window на актуальних даних.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Часті запитання про Claude 3.7 Sonnet

Знайдіть відповіді на поширені запитання про Claude 3.7 Sonnet