anthropic

Claude 3.7 Sonnet

O Claude 3.7 Sonnet é o primeiro modelo de raciocínio híbrido da Anthropic, entregando capacidades de programação de última geração, context window de 200k e...

anthropic logoanthropicClaude 324 de fevereiro de 2025
Contexto
200Ktokens
Saida Max
128Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
84.8%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude 3.7 Sonnet pontuou 84.8% neste benchmark.
HLE
34%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Claude 3.7 Sonnet pontuou 34% neste benchmark.
MMLU
89%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude 3.7 Sonnet pontuou 89% neste benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude 3.7 Sonnet pontuou 74% neste benchmark.
SimpleQA
42%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Claude 3.7 Sonnet pontuou 42% neste benchmark.
IFEval
93.2%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude 3.7 Sonnet pontuou 93.2% neste benchmark.
AIME 2025
54.8%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude 3.7 Sonnet pontuou 54.8% neste benchmark.
MATH
96.2%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude 3.7 Sonnet pontuou 96.2% neste benchmark.
GSM8k
97%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude 3.7 Sonnet pontuou 97% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude 3.7 Sonnet pontuou 92% neste benchmark.
MathVista
70%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude 3.7 Sonnet pontuou 70% neste benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude 3.7 Sonnet pontuou 70.3% neste benchmark.
HumanEval
94%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude 3.7 Sonnet pontuou 94% neste benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude 3.7 Sonnet pontuou 65% neste benchmark.
MMMU
75%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude 3.7 Sonnet pontuou 75% neste benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude 3.7 Sonnet pontuou 55% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude 3.7 Sonnet pontuou 89% neste benchmark.
DocVQA
94%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude 3.7 Sonnet pontuou 94% neste benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude 3.7 Sonnet pontuou 35.2% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude 3.7 Sonnet pontuou 12% neste benchmark.

Sobre Claude 3.7 Sonnet

Aprenda sobre as capacidades do Claude 3.7 Sonnet, recursos e como ele pode ajuda-lo a obter melhores resultados.

Design de Raciocínio Híbrido

O Claude 3.7 Sonnet usa uma nova arquitetura que permite aos usuários escolher entre velocidade e profundidade. É o primeiro modelo a oferecer um botão para thinking estendido, permitindo que o sistema trabalhe a lógica complexa antes de fornecer uma resposta. Essa transparência permite que os desenvolvedores vejam exatamente como o modelo chega a uma conclusão, reduzindo a chance de erros ocultos em trabalhos técnicos.

Resolução de Problemas Técnicos

Este modelo foi construído para engenharia de software de alto nível. Ele pontua 62,1% no benchmark SWE-bench Verified, mostrando uma forte capacidade de corrigir problemas reais do GitHub. Quando usado com ferramentas como o Claude Code, ele gerencia a edição de arquivos e a execução de comandos em grandes repositórios. Ele lida com tarefas de matemática e programação com um nível de precisão que iguala ou excede os atuais modelos de raciocínio de ponta.

Capacidade de Contexto Massiva

Com uma context window de 200.000 tokens, o modelo processa grandes conjuntos de documentação ou bases de código de uma só vez. Ele suporta até 128.000 tokens de saída quando o modo de raciocínio está ativo, tornando-o útil para gerar scripts longos ou relatórios detalhados. O modelo também é multimodal, significando que ele pode interpretar gráficos e diagramas juntamente com texto.

Claude 3.7 Sonnet

Casos de Uso para Claude 3.7 Sonnet

Descubra as diferentes maneiras de usar Claude 3.7 Sonnet para obter otimos resultados.

Engenharia de Software Agentic

Uso da ferramenta de terminal para corrigir bugs e refatorar código em estruturas de arquivos massivas.

Verificação de provas matemáticas

Resolução de problemas matemáticos difíceis permitindo que o modelo pense sobre as etapas lógicas.

Análise de repositórios

Extração de dados e identificação de padrões de bases de código técnicas inteiras em um único prompt.

Parsing de dados visuais

Conversão de gráficos complexos, fluxogramas e diagramas técnicos em dados JSON estruturados.

Planejamento de arquitetura de sistemas

Design de sistemas de software com verificações lógicas detalhadas usando o modo de thinking estendido.

Workflows Git automatizados

Gerenciamento de mensagens de commit, revisões de código e execução de testes através do uso de ferramentas agentic.

Pontos Fortes

Limitacoes

Opções de raciocínio híbrido: O primeiro modelo que permite aos usuários alternar entre respostas padrão rápidas e modos de raciocínio profundo.
Latência de raciocínio: Ativar o modo de thinking aumenta significativamente o tempo necessário para o modelo responder.
Agente de programação de primeira linha: Desempenho de alto nível no SWE-bench Verified com uma pontuação de 62,1% para correção de problemas em produção.
Custo de raciocínio: Os tokens de raciocínio interno são cobrados à taxa de US$ 15 por milhão de tokens de saída, o que aumenta em tarefas longas.
Capacidade extrema de saída: Gera até 128.000 tokens em uma única resposta, facilitando a geração massiva de código e documentos.
Sem suporte a vídeo: Ao contrário de alguns concorrentes, ele não pode ingerir ou analisar nativamente arquivos de vídeo brutos via API.
Lógica transparente: O chain-of-thought externalizado permite que os usuários auditem e depurem o processo de raciocínio interno do modelo.
Data de corte de conhecimento: Os dados de treinamento vão apenas até outubro de 2024, perdendo desenvolvimentos recentes da indústria.

Inicio Rapido da API

anthropic/claude-3-7-sonnet

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyze this architectural flaw..." }],
});

console.log(message.content);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude 3.7 Sonnet

Veja o que a comunidade pensa sobre Claude 3.7 Sonnet

Claude Code mais 3.7 Sonnet é basicamente um desenvolvedor júnior com esteroides no meu terminal. É a primeira vez que uma AI agentic pareceu real.
dev_guru_99
reddit
O raciocínio híbrido é uma grande atualização. Nem sempre preciso que ele pense por 30 segundos, mas quando estou depurando, é incrível.
TechLead_X
twitter
A Anthropic conseguiu criar um modelo que compete com o o1 em matemática enquanto permanece útil para conversas do dia a dia.
logic_fanatic
hackernews
O Claude entrega relatórios abrangentes e lindamente formatados com citações em menos de cinco minutos.
ThinkingDeeplyAI_mod
reddit
O limite de saída de 128k é um recurso matador. Finalmente um modelo que não corta o texto no meio de um script longo.
code_monk_42
reddit
Claude 3.7 + MCP é a coisa mais próxima do Jarvis no momento. Ele realmente usa minhas ferramentas locais corretamente.
julie_codes_it
twitter

Videos Sobre Claude 3.7 Sonnet

Assista tutoriais, analises e discussoes sobre Claude 3.7 Sonnet

O Claude 3.7 é fantástico. O novo modelo base superou a si mesmo para se tornar ainda melhor em programação.

O novo modelo 3.7 superou absolutamente todos os outros modelos, incluindo o OpenAI o3 mini.

Ele é capaz de resolver 70% das issues do GitHub.

O thinking estendido permite que o modelo pondere sobre um problema antes de gerar o código.

Esta é uma grande vitória para a experiência do desenvolvedor.

Chatbots dão conselhos, mas o Claude Code toma ações. Ele pode criar arquivos, construir sites e instalar pacotes.

O thinking estendido é o Claude raciocinando antes de realmente tomar qualquer ação.

A ferramenta é otimizada para o ambiente de terminal.

A conectividade MCP é o que realmente diferencia isso do ChatGPT padrão.

O modelo entende a intenção por trás de comandos de terminal vagos.

A integração com o terminal via Claude Code é um nível de agentic que ainda não tínhamos visto.

A capacidade do Claude 3.7 Sonnet de mostrar seu processo de pensamento é muito mais transparente que a dos concorrentes.

No SWE-bench Verified, ele atinge impressionantes 62%.

O raciocínio híbrido significa que você não paga a penalidade de latência quando não precisa dela.

Ele mantém o estilo de escrita de alta qualidade dos modelos Claude anteriores.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Claude 3.7 Sonnet

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Claude 3.7 Sonnet e obter melhores resultados.

Defina orçamentos de raciocínio

Use o parâmetro de thinking da API para limitar o número de tokens de raciocínio e controlar os custos.

Revise os blocos de pensamento

Verifique o chain-of-thought interno nas respostas para validar a lógica de respostas complexas.

Use conectores MCP

Conecte o modelo a bancos de dados locais e armazenamento em nuvem para obter contexto de projeto em tempo real.

Atualização de contexto

Use comandos de resumo em loops agentic longos para manter a context window focada nos dados relevantes.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Perguntas Frequentes Sobre Claude 3.7 Sonnet

Encontre respostas para perguntas comuns sobre Claude 3.7 Sonnet