anthropic

Claude Sonnet 4.5

O Claude Sonnet 4.5 da Anthropic oferece codificação líder mundial (77,2% no SWE-bench) e um context window de 200K, otimizado para a próxima geração de...

Codificação com IAIA AgenticReasoning HíbridoAnthropicMultimodal
anthropic logoanthropicClaude 429 de Setembro de 2025
Contexto
200Ktokens
Saida Max
64Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
83%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude Sonnet 4.5 pontuou 83% neste benchmark.
HLE
34%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Claude Sonnet 4.5 pontuou 34% neste benchmark.
MMLU
89%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude Sonnet 4.5 pontuou 89% neste benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude Sonnet 4.5 pontuou 78% neste benchmark.
SimpleQA
52%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Claude Sonnet 4.5 pontuou 52% neste benchmark.
IFEval
88%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude Sonnet 4.5 pontuou 88% neste benchmark.
AIME 2025
87%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude Sonnet 4.5 pontuou 87% neste benchmark.
MATH
87%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude Sonnet 4.5 pontuou 87% neste benchmark.
GSM8k
98%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude Sonnet 4.5 pontuou 98% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude Sonnet 4.5 pontuou 92% neste benchmark.
MathVista
72%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude Sonnet 4.5 pontuou 72% neste benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude Sonnet 4.5 pontuou 77% neste benchmark.
HumanEval
94%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude Sonnet 4.5 pontuou 94% neste benchmark.
LiveCodeBench
68%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude Sonnet 4.5 pontuou 68% neste benchmark.
MMMU
78%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude Sonnet 4.5 pontuou 78% neste benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude Sonnet 4.5 pontuou 55% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude Sonnet 4.5 pontuou 89% neste benchmark.
DocVQA
92%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude Sonnet 4.5 pontuou 92% neste benchmark.
Terminal-Bench
50%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude Sonnet 4.5 pontuou 50% neste benchmark.
ARC-AGI
14%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude Sonnet 4.5 pontuou 14% neste benchmark.

Experimente Claude Sonnet 4.5 Gratis

Converse com Claude Sonnet 4.5 gratuitamente. Teste suas capacidades, faca perguntas e explore o que este modelo de IA pode fazer.

Prompt
Resposta
Claude Sonnet 4.5

Sua resposta de IA aparecera aqui

Sobre Claude Sonnet 4.5

Aprenda sobre as capacidades do Claude Sonnet 4.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

**A Fronteira da Inteligência Agentic**

O Claude Sonnet 4.5 representa o salto mais significativo da Anthropic em inteligência de frontier model, otimizado especificamente para a era dos agents de IA autônomos. Lançado no final de 2025, é o primeiro model de "reasoning híbrido" real da indústria, permitindo que desenvolvedores alternem entre execução de alta velocidade para tarefas rotineiras e extended thinking para desafios lógicos complexos. Ele eclipsou notavelmente os benchmarks anteriores em uso de computador e orquestração de ferramentas, tornando-se o motor preferido para agents baseados em terminal e engenharia de software de múltiplos arquivos.

**Precisão e Redução de Alucinações**

O model é construído sobre uma arquitetura que prioriza a lógica de "medir duas vezes, cortar uma", reduzindo significativamente a adulação (sycophancy) e as alucinações vistas na série 3.5. Com um limite massivo de 64.000 tokens de output e um context window de 200.000 tokens, ele pode ingerir repositórios inteiros enquanto gera arquivos de aplicação completos em uma única passagem. Também introduz "checkpoints" nativos para workflows de agents, permitindo que os agents revertam e corrijam seus próprios erros de forma autônoma.

**Proeza Multimodal e de Reasoning**

Além da codificação, o Sonnet 4.5 domina a análise multimodal de documentos e a modelagem financeira complexa. Sua lógica interna é treinada para priorizar o contexto arquitetural, permitindo-lhe mapear grandes bases de código melhor do que qualquer predecessor. Seja processando notas manuscritas ou implementando uma integração completa com o Stripe, o Sonnet 4.5 mantém um alto nível de precisão factual e seguimento de instruções.

Claude Sonnet 4.5

Casos de Uso para Claude Sonnet 4.5

Descubra as diferentes maneiras de usar Claude Sonnet 4.5 para obter otimos resultados.

Engenharia de Software Autônoma

Use o Claude Sonnet 4.5 para navegar em bases de código complexas, implementar funcionalidades em múltiplos arquivos e executar testes de forma independente.

Agents de Uso de Computador

Implante o model para controlar desktops e navegadores web para extração de dados, navegação em sistemas legados ou tarefas administrativas repetitivas.

Busca Agentic Empresarial

Orquestre consultas de busca em múltiplas etapas e sintetize informações díspares de documentação interna e da web ao vivo.

Modelagem Financeira Complexa

Aproveite seu score de 87% no AIME para realizar deduções lógicas profundas em relatórios financeiros e dados de mercado.

Refinamento de Conteúdo Técnico

Converta requisitos de alto nível em PRDs profissionais, especificações técnicas e bases de código prontas para copiar e colar.

Análise Multimodal de Documentos

Processe milhares de páginas de gráficos, notas manuscritas e diagramas técnicos com capacidades de visão state-of-the-art.

Pontos Fortes

Limitacoes

Poder de Codificação Agentic: Atualmente o detentor do recorde mundial no SWE-bench Verified com uma taxa de sucesso de 77,2% em issues reais do GitHub.
Limites de Uso: Usuários profissionais frequentemente relatam atingir os limites de uso semanais rapidamente no plano Pro de $20/mês.
Velocidade Incrível: Opera de 40 a 60 tokens por segundo, tornando-o significativamente mais rápido que frontier models anteriores para uso interativo.
Latency de Busca: A navegação web agentic (BrowseComp) continua sendo um ponto fraco em comparação com modelos de busca especializados.
Flexibilidade de Reasoning Híbrido: O primeiro model a equilibrar efetivamente o modo "chat rápido" com "extended thinking" para cadeias lógicas complexas.
Lacunas de Conhecimento de Nicho: Dificuldade com tarefas visuais altamente especializadas, como identificar manobras específicas de skate (29% de precisão no SkateBench).
Janela de Output Massiva: Um limite de 64K output tokens permite a geração de funcionalidades inteiras em múltiplos arquivos em uma única chamada de API.
Custos de Agentic: Executar o model autonomamente no modo terminal pode consumir de $50 a $100 em tokens para uma única sessão complexa de construção de aplicativos.

Inicio Rapido da API

anthropic/claude-sonnet-4.5

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude Sonnet 4.5

Veja o que a comunidade pensa sobre Claude Sonnet 4.5

"Claude Sonnet 4.5 é o novo rei da codificação com IA... está parecendo muito, muito bom"
James Montemagno
youtube
"O Sonnet 4.5 está fazendo um trabalho muito bom... foi muito mais rápido e consideravelmente melhor"
Cole Medin
youtube
"Estou impressionado com o Sonnet 4.5... este está projetando páginas absolutamente deslumbrantes"
Savage Reviews
youtube
"O agent baseado em terminal é um 'desenvolvedor vivendo no seu terminal'... ele pode ler bases de código e executar testes de forma autônoma"
DevUser_99
reddit
"O preço continua o mesmo do 3.5, mas o recurso de 'Checkpoints' faz com que ele valha 10 vezes mais para workflows profissionais"
AgentArchitect
x
"Com 77,2% no SWE-bench, este é o primeiro model que realmente parece um Engenheiro Sênior"
HackerNewsReader
hackernews

Videos Sobre Claude Sonnet 4.5

Assista tutoriais, analises e discussoes sobre Claude Sonnet 4.5

A Anthropic afirma que este é o 'melhor model de código do mundo', com ganhos substanciais em reasoning, matemática e uso de computador.

Embora o GPT-5 possa ser melhor para planejamento de alto nível, o Claude 4.5 Sonnet é atualmente o model mais 'agradável' de usar para implementação.

A velocidade é simplesmente incrível, fazendo com que a codificação interativa pareça muito mais fluida.

Ele lida com edições em múltiplos arquivos com um nível de precisão que não tínhamos visto antes.

A redução nas alucinações o torna um parceiro confiável para código em produção.

O Claude Sonnet 4.5 foi muito mais rápido e consideravelmente melhor do que o GPT-5 Codex.

Ele fez toda a implementação do Stripe em 15 minutos... mais de duas vezes mais rápido que o Opus 4.1.

A habilidade de seguir instruções complexas de tool-calling é o seu ingrediente secreto.

Estou vendo menos problemas de 'sycophancy', onde o model apenas concorda com minhas ideias ruins.

Este é o primeiro model que eu realmente confiaria para rodar um agent baseado em terminal sem supervisão.

Esta é uma das melhores landing pages, se não A melhor, que já vi ser criada a partir de um prompt.

É uma fera absoluta... está projetando páginas impressionantes com um código muito, muito bom.

As capacidades de visão para interpretar design de UI foram significativamente atualizadas.

Parece que ele entende os requisitos estéticos, não apenas os técnicos.

O Sonnet 4.5 é oficialmente o novo benchmark para engenharia front-end criativa.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais

Dicas de especialistas para ajuda-lo a aproveitar ao maximo este modelo e obter melhores resultados.

Aproveite o CLAUDE.md

Use um arquivo CLAUDE.md na raiz do seu repositório para fornecer resumos curtos e orientações ao model; isso reduz o desperdício de tokens em 30%.

Alternância de Reasoning Híbrido

Use o parâmetro de 'thinking' em suas chamadas de API apenas para tarefas com muita lógica para economizar em latency e custos durante operações rotineiras.

A pasta .claude/context

Crie um arquivo .claude/context.md para armazenar decisões arquiteturais; o model é treinado especificamente para priorizar este caminho para o mapeamento da base de código.

Prompt Caching

Ative o prompt caching para documentação estática ou grandes bases de código para economizar até 90% nos custos de input para consultas repetidas.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Perguntas Frequentes

Encontre respostas para perguntas comuns sobre este modelo