anthropic

Claude Sonnet 4.6

O Claude Sonnet 4.6 oferece frontier performance para coding e Computer Use com uma massiva context window de 1M de tokens por apenas $3/1M de tokens.

Agentic AIMultimodalCodingComputer UseContexto Longo
anthropic logoanthropicClaudeFebruary 17, 2026
Contexto
1.0Mtokens
Saida Max
64Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
89.9%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude Sonnet 4.6 pontuou 89.9% neste benchmark.
HLE
49%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Claude Sonnet 4.6 pontuou 49% neste benchmark.
MMLU
89.3%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude Sonnet 4.6 pontuou 89.3% neste benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude Sonnet 4.6 pontuou 79.2% neste benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Claude Sonnet 4.6 pontuou 48.5% neste benchmark.
IFEval
89.5%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude Sonnet 4.6 pontuou 89.5% neste benchmark.
AIME 2025
83%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude Sonnet 4.6 pontuou 83% neste benchmark.
MATH
85.3%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude Sonnet 4.6 pontuou 85.3% neste benchmark.
GSM8k
96.4%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude Sonnet 4.6 pontuou 96.4% neste benchmark.
MGSM
92.8%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude Sonnet 4.6 pontuou 92.8% neste benchmark.
MathVista
68.7%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude Sonnet 4.6 pontuou 68.7% neste benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude Sonnet 4.6 pontuou 79.6% neste benchmark.
HumanEval
92.1%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude Sonnet 4.6 pontuou 92.1% neste benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude Sonnet 4.6 pontuou 72.4% neste benchmark.
MMMU
74.2%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude Sonnet 4.6 pontuou 74.2% neste benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude Sonnet 4.6 pontuou 75.6% neste benchmark.
ChartQA
88.1%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude Sonnet 4.6 pontuou 88.1% neste benchmark.
DocVQA
93.4%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude Sonnet 4.6 pontuou 93.4% neste benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude Sonnet 4.6 pontuou 59.1% neste benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude Sonnet 4.6 pontuou 58.3% neste benchmark.

Sobre Claude Sonnet 4.6

Aprenda sobre as capacidades do Claude Sonnet 4.6, recursos e como ele pode ajuda-lo a obter melhores resultados.

**Um Salto Geracional em Inteligência**

O Claude Sonnet 4.6 é o model mais capaz e versátil da Anthropic até o momento, projetado para servir como um motor de alta performance para fluxos de trabalho complexos de empresas e desenvolvedores. Lançado em 17 de fevereiro de 2026, ele representa um grande salto geracional sobre a série 4.5, introduzindo capacidades de Computer Use em nível humano e uma massiva context window de 1 milhão de tokens em beta. O model é otimizado para tarefas agentic, o que significa que ele não apenas processa texto, mas pode planejar e executar autonomamente operações de múltiplas etapas em vários ambientes de software.

**Sofisticação Técnica e Multimodalidade**

Tecnicamente, o Sonnet 4.6 preenche a lacuna entre a velocidade dos models de nível intermediário e o reasoning profundo da classe Opus. Ele apresenta o Adaptive Thinking, permitindo que ele dimensione seu esforço interno de reasoning com base na complexidade da tarefa. Este model tornou-se o novo padrão para usuários do Claude Free e Pro, oferecendo inteligência de nível flagship em coding, análise financeira e compreensão de documentos. Ele é um multimodal verdadeiramente nativo, suportando inputs de texto, imagem, áudio e vídeo para processar uma variedade de tarefas de processamento de mídia com precisão state-of-the-art.

**O Novo Padrão da Indústria para Agentes**

Com sua relação performance-custo de elite, o Sonnet 4.6 posiciona-se como o motor principal para agentes de AI. Ele alcança pontuações líderes da indústria no SWE-bench Verified (79,6%) e OSWorld-Verified (72,5%), demonstrando sua capacidade superior de navegar em problemas reais de engenharia de software e tarefas complexas de sistemas operacionais. Ao fornecer inteligência próxima ao Opus por uma fração do custo, ele capacita desenvolvedores a construir sistemas autônomos que antes eram computacionalmente ou financeiramente proibitivos.

Claude Sonnet 4.6

Casos de Uso para Claude Sonnet 4.6

Descubra as diferentes maneiras de usar Claude Sonnet 4.6 para obter otimos resultados.

Engenharia de Software Autônoma

Usando Claude Code para refatorar repositórios inteiros e implementar recursos complexos com contexto de todo o repositório.

Computer Use em Nível Humano

Automatizando softwares legados e fluxos de trabalho na web ao visualizar a tela e interagir via mouse e teclado virtuais.

Compreensão de Documentos Financeiros

Analisando milhares de páginas de registros e tabelas para realizar o reasoning em estratégias de investimento ou riscos complexos.

Simulação de Negócios em Tempo Real

Executando simulações agentic onde o model gerencia um negócio virtual e otimiza a lucratividade.

Escrita Técnica Multilíngue

Gerando documentação técnica em dezenas de idiomas, mantendo a conformidade perfeita com as especificações arquitetônicas.

Geração de UI/UX Frontend

Criando interfaces de dashboard modernas e polidas com foco em tipografia, teoria das cores e layout responsivo.

Pontos Fortes

Limitacoes

Coding Líder do Setor: Alcança o estado-of-the-art de 79,6% no SWE-bench Verified, superando concorrentes na resolução de problemas reais do GitHub.
Latência no Modo Thinking: Orçamentos altos de thinking tokens aumentam o tempo para o primeiro token, tornando-o menos ideal para chats instantâneos em tempo real.
Relação Performance-Custo de Elite: Entrega níveis de inteligência próximos ao Opus com um custo 5x menor, tornando-o a escolha mais econômica para automações em larga escala.
Fricção por Rate Limiting: Usuários Free e Pro atingem limites de mensagens agressivos durante sessões intensas, necessitando a migração para a API.
Navegação de Computador em Nível Humano: Marca 72,5% no OSWorld-Verified, mostrando uma melhoria massiva na navegação de softwares complexos sem APIs.
Decaimento de Contexto Acima de 150k: Apesar da context window de 1M, o model ainda pode ocasionalmente perder detalhes específicos no meio de prompts muito grandes.
Poder de Reasoning Adaptativo: Apresenta um modo de Thinking escalável que permite aos desenvolvedores ajustar o esforço de reasoning para problemas de lógica difíceis.
Vulnerabilidade a Prompt Injection: O recurso de Computer Use apresenta riscos onde sites maliciosos podem tentar sequestrar a sessão de navegação virtual do model.

Inicio Rapido da API

anthropic/claude-sonnet-4-6

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude Sonnet 4.6

Veja o que a comunidade pensa sobre Claude Sonnet 4.6

O Claude Sonnet 4.6 atingiu 94% em nosso benchmark de seguros, tornando-o o model de maior performance que já testamos para computer use.
Swami Sivasubramanian
twitter
O hype é real, este é sem dúvida o melhor (e mais divertido) LLM que já usei! Muito acima do que vi até agora.
WolframRavenwolf
reddit
O Claude Sonnet 4.6 é hilário, não apenas 'engraçado às vezes'. Amplamente caloroso, honesto e prossocial.
Anton P.
twitter
O Sonnet 4.6 é muito melhor que o Cline para tarefas de coding. Eu nem estou mais abrindo arquivos manualmente.
semibaron
hackernews
A context window de 1M é um divisor de águas para migração de base de código. Acabei de carregar toda a minha stack legada.
DevOpsDan
reddit
Ele lida com planilhas complexas e formulários web com uma precisão quase assustadora. O beta do Computer Use finalmente está pronto.
AI_Insights_Daily
youtube

Videos Sobre Claude Sonnet 4.6

Assista tutoriais, analises e discussoes sobre Claude Sonnet 4.6

O Sonnet 4.6 obteve uma pontuação mais alta no GDP val, que mede tarefas significativas do mundo real.

Está se tornando mais difícil até mesmo saber se esses models são capazes de coisas CBRN.

A relação velocidade-inteligência aqui é essencialmente inigualável por qualquer outro model no mercado.

A Anthropic está claramente focando no lado agentic com este lançamento.

A estrutura de custos torna este o novo padrão para qualquer desenvolvedor de API de alto volume.

Este model é cerca de duas vezes mais rápido em comparação com o model Opus do mês passado.

Em conclusão, pessoal, este model é o melhor custo-benefício para coding corporativo.

As capacidades de visão para interpretar diagramas de arquitetura complexos melhoraram significativamente.

Consegui dar a ele 50 arquivos e ele refatorou toda a lógica de roteamento perfeitamente.

Ele parece muito mais humano em seu estilo de comunicação em comparação ao GPT-4o.

Ele está superando o Opus 4.6 em algumas áreas, custando 40% mais barato.

À medida que preenchemos a context window, ao atingir cerca de 150.000 tokens, a eficácia tende a cair.

O recurso de reasoning adaptativo permite que você alterne basicamente entre velocidade e lógica profunda.

Este lançamento parece o primeiro model verdadeiramente 'agent-first' da Anthropic.

Eu usaria isso para tudo, exceto talvez para escrita criativa do mais alto nível absoluto.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Claude Sonnet 4.6

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Claude Sonnet 4.6 e obter melhores resultados.

Aproveite a Compactação de Contexto

Ative o recurso de Compactação na API para resumir automaticamente o histórico de conversas antigas em sessões longas.

Use Thinking Tokens Estrategicamente

Para matemática ou lógica complexa, defina um orçamento maior para thinking tokens para permitir que o model explore múltiplos caminhos de reasoning.

Solicite Conformidade com SPEC

Peça explicitamente para o model seguir as melhores práticas de arquitetura moderna, já que ele naturalmente busca ferramentas atualizadas.

Utilize Artifacts para UI

Incentive o model a usar Artifacts de UI para separar as gerações de código do chat principal para iteração em tempo real.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Claude Sonnet 4.6

Encontre respostas para perguntas comuns sobre Claude Sonnet 4.6