anthropic

Claude 3.7 Sonnet

O Claude 3.7 Sonnet é o primeiro model de hybrid reasoning da Anthropic, oferecendo capacidades de programação state-of-the-art, uma context window de 200k e...

anthropic logoanthropicClaude 3February 24, 2025
Contexto
200Ktokens
Saida Max
128Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
84.8%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude 3.7 Sonnet pontuou 84.8% neste benchmark.
HLE
34%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Claude 3.7 Sonnet pontuou 34% neste benchmark.
MMLU
89%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude 3.7 Sonnet pontuou 89% neste benchmark.
MMLU Pro
74%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude 3.7 Sonnet pontuou 74% neste benchmark.
SimpleQA
42%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Claude 3.7 Sonnet pontuou 42% neste benchmark.
IFEval
93.2%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude 3.7 Sonnet pontuou 93.2% neste benchmark.
AIME 2025
54.8%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude 3.7 Sonnet pontuou 54.8% neste benchmark.
MATH
96.2%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude 3.7 Sonnet pontuou 96.2% neste benchmark.
GSM8k
97%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude 3.7 Sonnet pontuou 97% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude 3.7 Sonnet pontuou 92% neste benchmark.
MathVista
70%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude 3.7 Sonnet pontuou 70% neste benchmark.
SWE-Bench
70.3%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude 3.7 Sonnet pontuou 70.3% neste benchmark.
HumanEval
94%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude 3.7 Sonnet pontuou 94% neste benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude 3.7 Sonnet pontuou 65% neste benchmark.
MMMU
75%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude 3.7 Sonnet pontuou 75% neste benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude 3.7 Sonnet pontuou 55% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude 3.7 Sonnet pontuou 89% neste benchmark.
DocVQA
94%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude 3.7 Sonnet pontuou 94% neste benchmark.
Terminal-Bench
35.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude 3.7 Sonnet pontuou 35.2% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude 3.7 Sonnet pontuou 12% neste benchmark.

Experimente Claude 3.7 Sonnet Gratis

Converse com Claude 3.7 Sonnet gratuitamente. Teste suas capacidades, faca perguntas e explore o que este modelo de IA pode fazer.

Prompt
Resposta
anthropic/claude-3-7-sonnet-20250219

Sua resposta de IA aparecera aqui

Sobre Claude 3.7 Sonnet

Aprenda sobre as capacidades do Claude 3.7 Sonnet, recursos e como ele pode ajuda-lo a obter melhores resultados.

Hybrid Reasoning e Transparência

O Claude 3.7 Sonnet representa uma mudança histórica na arquitetura de LLM como o primeiro model de 'hybrid reasoning' da Anthropic. Ele permite exclusivamente que os usuários alternem entre respostas padrão de baixa latency e um modo de 'extended thinking' que exibe seu chain-of-thought interno. Essa transparência oferece aos usuários uma janela clara para a lógica do model, tornando-o particularmente eficaz para resolução de problemas complexos e tarefas de reasoning críticas.

Maestria em Engenharia de Software

Projetado com um foco rigoroso em engenharia de software e outputs prontos para produção, o model estabeleceu novos padrões da indústria em benchmarks como o SWE-Bench Verified. Ele se destaca no 'vibe coding', onde desenvolvedores descrevem a intenção de alto nível e o model gerencia a implementação em múltiplos arquivos. Ele lida com refatorações complexas e decisões arquiteturais com uma precisão que supera os frontier models anteriores.

Contexto Massivo e Ferramentas Agentic

Com uma context window massiva de 200.000 tokens e um conjunto de ferramentas agentic chamado Claude Code, ele se transforma de um simples chatbot em um parceiro técnico colaborativo. É capaz de gerenciar ciclos de vida inteiros de projetos, desde a revisão inicial da documentação até fluxos de trabalho git automatizados e execução de testes, garantindo que o desenvolvimento permaneça rápido e livre de bugs.

Claude 3.7 Sonnet

Casos de Uso para Claude 3.7 Sonnet

Descubra as diferentes maneiras de usar Claude 3.7 Sonnet para obter otimos resultados.

Vibe Coding

Construção de software funcional do zero descrevendo a intenção em linguagem natural.

Debugging Avançado

Utilização de extended thinking para analisar logs complexos e fornecer correções precisas de uma só vez (one-shot).

Análise de Contexto Amplo

Revisão e refatoração de bases de código inteiras ou documentações técnicas extensas em um único prompt.

Desenvolvimento Agentic

Alimentação de ferramentas baseadas em terminal, como o Claude Code, para automatizar fluxos de trabalho git e execução de testes.

Geração de UI de Frontend

Criação de componentes React e Svelte elegantes e fáceis de manter, com sensibilidade de design integrada.

Pesquisa Factual

Análise de documentos PDF massivos e conjuntos de dados com alta precisão e baixas taxas de alucinação.

Pontos Fortes

Limitacoes

Liderança em Programação: Alcançou um resultado state-of-the-art de 70,3% no SWE-bench Verified, resolvendo problemas reais do GitHub com precisão sem precedentes.
Latency de Resposta: Ativar o modo 'extended thinking' aumenta significativamente o tempo para o primeiro token em comparação com as respostas padrão do model.
Reasoning Visível: O primeiro model a oferecer 'extended thinking' visível e controlável pelo usuário para resolução de problemas complexos e críticos.
Preço Premium: Os custos de output de $15 por 1M de tokens permanecem consideravelmente mais altos do que a maioria das alternativas 'mini' ou de pesos abertos (open-weights).
Integração Agentic: Otimizado especificamente para uso de ferramentas e interação via CLI através do framework de agente Claude Code para automação de tarefas de ponta a ponta.
Sem Áudio/Vídeo Nativo: Ao contrário do GPT-4o ou Gemini 2.0, carece de capacidades nativas de processamento de input de áudio e vídeo.
Gosto Superior por Design: Gera consistentemente código de UI mais elegante, acessível e fácil de manter em comparação com outros frontier models.
Custo Computacional: Sessões de reasoning profundo podem consumir rapidamente orçamentos de tokens e limites de contexto durante refatorações de bases de código em larga escala.

Inicio Rapido da API

anthropic/claude-3-7-sonnet-20250219

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Escreva uma função Rust de alta performance para multiplicação de matrizes." }],
});

console.log(msg.content);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude 3.7 Sonnet

Veja o que a comunidade pensa sobre Claude 3.7 Sonnet

"O Claude 3.7 Sonnet é o melhor AI model de programação do mundo; me deixou impressionado em tarefas desafiadoras."
rawcell4772
reddit
"Com um único prompt, ele acertou tudo perfeitamente em um projeto TypeScript complexo."
rawcell4772
reddit
"Claude Code com Sonnet 3.7 é muito melhor que o Cline e atualmente a melhor ferramenta."
peterkrueck
reddit
"O salto de qualidade com models de alto nível como o 3.7 foi transformador para a minha perspectiva."
lurking_horrors
reddit
"Claude 3.7 é brabo, a pegada é diferente... brabíssimo, sem mentira"
Fireship
youtube
"O modo de reasoning do Claude 3.7 é uma mudança completa de paradigma para debugging de lógica."
DevLead99
x

Videos Sobre Claude 3.7 Sonnet

Assista tutoriais, analises e discussoes sobre Claude 3.7 Sonnet

O novo model 3.7 esmagou absolutamente todos os outros models... agora capaz de resolver 70,3% dos problemas do GitHub

Usar uma linguagem fortemente tipada junto com TDD são formas de a IA validar que o código que escreve é realmente válido

O model é incrivelmente inteligente em seguir instruções

O desempenho no SWE-bench é realmente insano

Reasoning visível é um divisor de águas para a transparência

Claude 3.7 Sonnet... é provavelmente o melhor LLM para geração de código

Se você usar a API, pode gerar 128.000 tokens de uma só vez

O limite de output de 128k é um upgrade massivo

Seu bom gosto de design para componentes frontend é inigualável

Uso de ferramentas e capacidades agentic são fundamentais para este model

O reasoning deve ser uma capacidade integrada de frontier models, em vez de um model totalmente separado

O Claude 3.7 consegue superar esses models [DeepSeek, o3] por uma margem bastante significativa

A latency é um pouco maior no modo reasoning

Supera o DeepSeek R1 em várias tarefas de seguimento de instruções

A Anthropic focou muito em outputs prontos para produção

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais

Dicas de especialistas para ajuda-lo a aproveitar ao maximo este modelo e obter melhores resultados.

Budget de Pensamento

Use o modo 'extended thinking' especificamente para lógica complexa ou planejamento de arquitetura para obter resultados de maior qualidade.

Controle de Contexto

Use regularmente o comando /clear ou reinicie os chats para economizar custos de context e evitar que o model fique lento.

Verificação

Peça ao Claude para escrever e executar testes para seu próprio código usando a ferramenta Claude Code para garantir a estabilidade em produção.

Especificações em Markdown

Forneça os requisitos das funcionalidades em arquivos Markdown estruturados para um melhor seguimento de instruções em projetos grandes.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Perguntas Frequentes

Encontre respostas para perguntas comuns sobre este modelo