anthropic

Claude Opus 4.5

O Claude 4.5 Opus é o frontier model mais poderoso da Anthropic, oferecendo um desempenho recorde de 80,9% no SWE-bench e capacidades avançadas de autonomia.

anthropic logoanthropicClaude24 de novembro de 2025
Contexto
200Ktokens
Saida Max
64Ktokens
Preco Entrada
$5.00/ 1M
Preco Saida
$25.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
87%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Claude Opus 4.5 pontuou 87% neste benchmark.
MMLU
90.8%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Claude Opus 4.5 pontuou 90.8% neste benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Claude Opus 4.5 pontuou 80% neste benchmark.
IFEval
90%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Claude Opus 4.5 pontuou 90% neste benchmark.
AIME 2025
37%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Claude Opus 4.5 pontuou 37% neste benchmark.
MATH
85%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Claude Opus 4.5 pontuou 85% neste benchmark.
GSM8k
95%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Claude Opus 4.5 pontuou 95% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Claude Opus 4.5 pontuou 92% neste benchmark.
MathVista
72%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Claude Opus 4.5 pontuou 72% neste benchmark.
SWE-Bench
80.9%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Claude Opus 4.5 pontuou 80.9% neste benchmark.
HumanEval
90%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Claude Opus 4.5 pontuou 90% neste benchmark.
LiveCodeBench
75%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Claude Opus 4.5 pontuou 75% neste benchmark.
MMMU
80.7%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Claude Opus 4.5 pontuou 80.7% neste benchmark.
MMMU Pro
60%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Claude Opus 4.5 pontuou 60% neste benchmark.
ChartQA
90%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Claude Opus 4.5 pontuou 90% neste benchmark.
DocVQA
94%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Claude Opus 4.5 pontuou 94% neste benchmark.
Terminal-Bench
59.3%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Claude Opus 4.5 pontuou 59.3% neste benchmark.
ARC-AGI
37.6%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Claude Opus 4.5 pontuou 37.6% neste benchmark.

Sobre Claude Opus 4.5

Aprenda sobre as capacidades do Claude Opus 4.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

O Ápice da Autonomia Agentic

O Claude Opus 4.5 representa o salto mais significativo da Anthropic em inteligência de frontier models, especificamente projetado para as tarefas mais complexas em engenharia de software e operação autônoma. Lançado no final de 2025, ele quebrou recordes no benchmark SWE-bench Verified com uma pontuação de 80,9%, tornando-se o primeiro model a automatizar efetivamente a depuração em larga escala e a refatoração de sistemas com intervenção humana mínima.

Inteligência com Alma

Além de sua proeza técnica, o Opus 4.5 introduz uma persona refinada guiada pelo "documento de alma" (soul document) da Anthropic, enfatizando a honestidade diplomática e a prestatividade sutil. Isso torna o model unicamente capaz de entender o estilo literário e o design centrado no ser humano. Ele é otimizado para fluxos de trabalho agentic, apresentando uma context window de 200.000 tokens e um "parâmetro de esforço" especializado que permite aos desenvolvedores escalar a profundidade de reasoning em relação aos custos computacionais.

Excelência Multimodal

Como uma potência multimodal, o Opus 4.5 se destaca em tarefas baseadas em visão, desde a análise de diagramas arquiteturais densos até a extração de dados de layouts de documentos complexos. Sua capacidade de navegar em um ambiente nativo de terminal via Claude Code permite realizar auditorias em todo o sistema e correções de segurança, posicionando-o como um parceiro persistente e altamente capaz para equipes de engenharia profissional.

Claude Opus 4.5

Casos de Uso para Claude Opus 4.5

Descubra as diferentes maneiras de usar Claude Opus 4.5 para obter otimos resultados.

Engenharia Autônoma

Automatiza todo o ciclo de vida de GitHub issues, incluindo reprodução, depuração e testes.

Administração de Sistemas

Realiza auditorias autônomas de servidores e correções de segurança através de interação direta no terminal.

Refatoração Arquitetural

Ingere repositórios massivos para sugerir e implementar o endurecimento de segurança (security hardening) em todo o sistema.

Síntese de Documentos Complexos

Transforma centenas de PDFs de várias páginas em modelos financeiros estruturados ou visualizações de dados.

Desenvolvimento Criativo de Jogos

Gera ambientes 3D funcionais com física operacional a partir de prompts únicos e complexos.

Assistente de Pesquisa Persistente

Cruza grandes conjuntos de dados para encontrar contradições não óbvias em arquivos jurídicos ou técnicos.

Pontos Fortes

Limitacoes

Codificação Recorde: Alcança 80,9% no SWE-bench Verified, automatizando tarefas complexas de engenharia de software.
Modelo de Preço Premium: A $5/$25 por 1M de tokens, é significativamente mais caro que os models de nível intermediário.
Eficiência Superior de Tokens: Atinge inteligência de frontier model usando até 76% menos tokens que o Sonnet para lógica semelhante.
Lacuna em Benchmarks de Matemática: Fica atrás de models de reasoning especializados em matemática de nível de competição, como o teste AIME.
Context Window de 200K: Lida com conjuntos massivos de documentos e repositórios com alta precisão de recuperação.
Sem Áudio/Vídeo Nativo: Atualmente carece da capacidade de processar diretamente fluxos de áudio ou vídeo sem pré-processamento.
Lógica de Agente Autônomo: Otimizado para sessões autônomas de longa duração através de ferramentas nativas de terminal e stop hooks.
Alta Latência de Execução: Tarefas de reasoning profundo podem levar um tempo substancial, exigindo às vezes sessões de horas para agentes.

Inicio Rapido da API

anthropic/claude-4.5-opus

Ver Documentacao
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Claude Opus 4.5

Veja o que a comunidade pensa sobre Claude Opus 4.5

"Cada linha do meu código de produção foi gerada pelo Claude Code rodando no Opus 4.5"
Boris Cherny
x
"O Opus 4.5 é onde você precisa pensar sobre o gosto literário e como ele soa como um humano"
Nate B Jones
youtube
"A inteligência finalmente está ficando mais barata; este model é 3x mais barato que o Opus anterior"
BuildwithVignesh
reddit
"O Claude Opus 4.5 quebrou um benchmark por ser inteligente demais e explorar uma brecha"
MetaKnowing
reddit
"A profundidade de reasoning e a capacidade de codificação estão em outro nível em comparação com qualquer outra coisa"
Santosh Gupta
x
"As capacidades agentic no terminal via Claude Code o tornam um destaque para devops"
hn_user_alpha
hackernews

Videos Sobre Claude Opus 4.5

Assista tutoriais, analises e discussoes sobre Claude Opus 4.5

O preço agora é três vezes mais barato... $5 por um milhão de input tokens.

Este é o melhor resultado que já obtive de um model neste teste de prompt único do Minecraft.

O Opus 4.5 obteve uma pontuação mais alta do que qualquer candidato humano jamais obteve neste exame prático.

O reasoning aqui não é apenas seguir instruções; é entender a intenção.

Se você está fazendo um trabalho arquitetural complexo, este é o único model que lida com isso de forma confiável.

80,9% no SWE-bench Verified... e usa 50% menos tokens que o Sonnet.

O Opus 4.5 é voltado diretamente para a engenharia de software profissional, não para codificação amadora.

Além do SWEBench, ele apresenta um ganho de 15% sobre o Sonnet no Terminal Bench.

O model é capaz de sessões autônomas de longa duração que podem durar horas.

O desempenho de visão é visivelmente mais detalhado ao analisar diagramas técnicos densos.

Pense no Claude Opus 4.5 como uma camada de persuasão e um monstro agentic absoluto.

Muitos engenheiros acabam preferindo o Opus 4.5 por causa da ergonomia e da infraestrutura.

O model está ciente de sua 'soul spec' de uma maneira fora de contexto.

O Opus 4.5 exibe um nível de gosto literário que o GPT-5.2 simplesmente não alcança.

Ele usa um parâmetro de esforço dinâmico para escalar sua inteligência com base na tarefa.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais para Claude Opus 4.5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Claude Opus 4.5 e obter melhores resultados.

Use Esforço Alto para Lógica

Defina o parâmetro 'effort' como 'high' para tarefas arquiteturais complexas para garantir a profundidade máxima de reasoning.

Implemente Stop Hooks

Utilize stop hooks especializados em fluxos de trabalho agentic para permitir que o model execute e se autocorrija ao longo de várias horas.

Aproveite o Claude Code

Combine o model com a ferramenta de CLI Claude Code para desbloquear todo o seu potencial em tarefas de sistema nativas de terminal.

Otimize o Uso de Tokens

Use o Opus 4.5 apenas para tarefas de alta lógica, pois ele produz qualidade equivalente ao Sonnet com até 76% menos tokens.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Perguntas Frequentes Sobre Claude Opus 4.5

Encontre respostas para perguntas comuns sobre Claude Opus 4.5