anthropic

Claude Sonnet 4.5

O Claude Sonnet 4.5 da Anthropic oferece programação líder mundial (77,2% no SWE-bench) e uma context window de 200K, otimizado para a próxima geração de...

Programação por AIAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29 de setembro de 2025
Contexto
200Ktokens
Saida Max
64Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
83%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude Sonnet 4.5 pontuou 83% neste benchmark.
HLE
34%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Claude Sonnet 4.5 pontuou 34% neste benchmark.
MMLU
89%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude Sonnet 4.5 pontuou 89% neste benchmark.
MMLU Pro
78%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude Sonnet 4.5 pontuou 78% neste benchmark.
SimpleQA
52%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Claude Sonnet 4.5 pontuou 52% neste benchmark.
IFEval
88%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude Sonnet 4.5 pontuou 88% neste benchmark.
AIME 2025
87%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude Sonnet 4.5 pontuou 87% neste benchmark.
MATH
87%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude Sonnet 4.5 pontuou 87% neste benchmark.
GSM8k
98%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude Sonnet 4.5 pontuou 98% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude Sonnet 4.5 pontuou 92% neste benchmark.
MathVista
72%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude Sonnet 4.5 pontuou 72% neste benchmark.
SWE-Bench
77%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude Sonnet 4.5 pontuou 77% neste benchmark.
HumanEval
94%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude Sonnet 4.5 pontuou 94% neste benchmark.
LiveCodeBench
68%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude Sonnet 4.5 pontuou 68% neste benchmark.
MMMU
78%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude Sonnet 4.5 pontuou 78% neste benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude Sonnet 4.5 pontuou 55% neste benchmark.
ChartQA
89%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude Sonnet 4.5 pontuou 89% neste benchmark.
DocVQA
92%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude Sonnet 4.5 pontuou 92% neste benchmark.
Terminal-Bench
50%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude Sonnet 4.5 pontuou 50% neste benchmark.
ARC-AGI
14%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude Sonnet 4.5 pontuou 14% neste benchmark.

Sobre Claude Sonnet 4.5

Aprenda sobre as capacidades do Claude Sonnet 4.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

**A Fronteira da Inteligência Agentic**

O Claude 4.5 Sonnet representa um avanço importante na inteligência de fronteira, otimizado para a era dos autonomous AI agents. Lançado no final de 2025, é um model de hybrid reasoning que permite aos desenvolvedores alternar entre execução de alta velocidade para tarefas rotineiras e pensamento estendido para desafios lógicos complexos. Ele lidera benchmarks em computer use e orquestração de ferramentas, tornando-o um motor preferido para agents baseados em terminal e engenharia de software com múltiplos arquivos.

**Precisão e Redução de Alucinações**

A arquitetura do model prioriza lógica e precisão, reduzindo a bajulação e alucinações observadas em séries anteriores. Com um limite de saída de 64.000 tokens e uma janela de entrada de 200.000 tokens, ele pode processar repositórios inteiros enquanto gera arquivos de aplicação completos em uma única passagem. Ele introduz checkpoints nativos para fluxos de trabalho agentic, permitindo que sistemas revertam e corrijam erros de forma autônoma sem intervenção humana.

**Proeza Multimodal e de Reasoning**

Além do desenvolvimento de software, o Sonnet 4.5 se destaca na análise multimodal de documentos e modelagem financeira. Sua lógica interna prioriza o contexto arquitetônico, permitindo que ele mapeie sistemas de larga escala de forma mais eficaz que seus predecessores. Seja processando notas manuscritas ou implementando integrações de API, o model mantém alta precisão factual e segue instruções rigorosas em tarefas de longo horizonte.

Claude Sonnet 4.5

Casos de Uso para Claude Sonnet 4.5

Descubra as diferentes maneiras de usar Claude Sonnet 4.5 para obter otimos resultados.

Engenharia de Software Autônoma

Gerenciamento do desenvolvimento de ponta a ponta, desde os requisitos iniciais até commits automatizados usando interfaces de terminal.

Automação Baseada em GUI

Automação de navegação web e inserção de dados em aplicações legadas usando capacidades nativas de computer use.

Orquestração de Multi-Agent

Delegação de tarefas especializadas para sub-agents, como revisores e construtores, dentro de um loop de planejamento central.

Refatoração Complexa de Código

Reestruturação de bases de código com múltiplos arquivos, mantendo a consistência em 200.000 tokens de contexto ativo.

Análise Financeira Nuanceada

Análise de relatórios trimestrais e planilhas com vision para identificar discrepâncias e insights de investimento.

Visualização de Dados Interativa

Geração de gráficos dinâmicos a partir de conjuntos de dados complexos usando execução de código incorporada e construção em tempo real.

Pontos Fortes

Limitacoes

Computer Use Nativo: O model interage com sistemas operacionais através do movimento do cursor e manipulação de GUI com 61,4% de precisão.
Sem Entrada de Áudio Nativa: O model não pode processar arquivos de áudio diretamente como uma modalidade nativa e requer ferramentas de transcrição externas.
Desempenho de Programação de Elite: Ele atinge 77,2% no SWE-bench Verified, liderando todos os outros models na resolução de problemas no GitHub.
Custo de Tokens de Reasoning: Tokens usados durante o extended thinking interno são cobrados como tokens de saída, aumentando o custo para consultas complexas.
Horizonte de Tarefa de 30 Horas: A arquitetura permite 30 horas de trabalho autônomo contínuo, mantendo o estado e o foco.
Latência no Modo Thinking: Quando o extended thinking está ativado, o model pode levar vários minutos para processar planos arquitetônicos complexos.
Limite de Saída de 64K: Capacidade de saída massiva que permite gerar arquiteturas de aplicação inteiras em uma única chamada de API.
Variância em Matemática Competitiva: Embora lidere em programação, ele ocasionalmente fica atrás de models de reasoning especializados em benchmarks específicos de programação competitiva.

Inicio Rapido da API

anthropic/claude-4-5-sonnet

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude Sonnet 4.5

Veja o que a comunidade pensa sobre Claude Sonnet 4.5

O Claude 4.5 Sonnet está disponível em toda parte hoje, o melhor model de programação do mundo.
ClaudeOfficial
reddit
Isso corrige um dos problemas de escalonamento mais dolorosos com configurações MCP. Eu via o contexto evaporar antes mesmo de começar o trabalho real.
Simon Willison
twitter
O Claude Code-Sonnet 4.5 está muito à frente do Gemini 3.0 Pro para tarefas complexas de refatoração em Docker.
Comfortable-Friend96
reddit
O padrão: erros se tornam documentação. Você adiciona uma regra ao CLAUDE.md e isso nunca mais acontece.
Boris Cherny
twitter
O modo hybrid reasoning é uma salvação para depurar lógica assíncrona complexa onde models comuns simplesmente entram em loop.
AsyncDev
hackernews
A paridade de preços com o 3.5 Sonnet torna este um upgrade fácil para todos os nossos pipelines de agent em produção.
StartupFounder2025
reddit

Videos Sobre Claude Sonnet 4.5

Assista tutoriais, analises e discussoes sobre Claude Sonnet 4.5

Este novo model 4.5 Sonnet está superando até o Opus 4.1 no teste Swaybench verified

Ele conseguiu manter o foco por mais de 30 horas em tarefas complexas de várias etapas

Ele lidera o benchmark de computer use OS world com uma pontuação de 61,4%

O mecanismo de reasoning interno lida com ambientes Python com muito mais estabilidade que o 3.5

A integração com o terminal parece muito mais firme, com quase zero comandos de shell alucinados

O Sonnet 4.5 agora lidera no uso de ferramentas agentic... um salto de 20%, o que é realmente empolgante

O Claude code com Sonnet 4.5 terminou toda a implementação do Stripe em 15 minutos

O Claude Sonnet 4.5 foi muito mais rápido e significativamente melhor

O toggle de thinking permite que você aloque mais compute em blocos específicos de código

Ele retém o contexto perfeitamente mesmo quando você está 150.000 tokens dentro de um projeto massivo

É o model de melhor desempenho já criado quando assume o controle do seu computador

Queda nas taxas de erro para programação de 9% para praticamente zero

O Claude imagine pode ser o recurso mais legal... uma experiência de construção de app em tempo real

A integração MCP permite buscar ferramentas sem consumir o seu contexto de prompt

A latência de vision é reduzida significativamente ao analisar layouts de UI complexos

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Claude Sonnet 4.5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Claude Sonnet 4.5 e obter melhores resultados.

Habilite a Busca de Ferramentas MCP

Use a Busca de Ferramentas do Model Context Protocol para reduzir o uso de contexto em 85% e liberar espaço para arquivos ativos.

Aproveite Checkpoints Agentic

Use o comando /checkpoint em interfaces de terminal para salvar o progresso antes de grandes refatorações, permitindo rollback instantâneo.

Gerenciamento de Contexto

Limpe o histórico entre tarefas não relacionadas para evitar a degradação do contexto e manter alta precisão lógica.

Hierarquia de System Prompt

Defina a persona do model e restrições de saída rígidas em um arquivo de configuração dedicado para consistência entre agents.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Claude Sonnet 4.5

Encontre respostas para perguntas comuns sobre Claude Sonnet 4.5