anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 ofrece un rendimiento frontier para codificación y computer use con una enorme context window de 1M de tokens por solo $3/1M de tokens.

Agentes de IAMultimodalCodificaciónComputer useContexto largo
anthropic logoanthropicClaude 417 de febrero de 2026
Contexto
1.0Mtokens
Salida máx.
64Ktokens
Precio entrada
$3.00/ 1M
Precio salida
$15.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
89.9%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Claude Sonnet 4.6 obtuvo 89.9% en este benchmark.
HLE
49%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Claude Sonnet 4.6 obtuvo 49% en este benchmark.
MMLU
89.3%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Claude Sonnet 4.6 obtuvo 89.3% en este benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Claude Sonnet 4.6 obtuvo 79.2% en este benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Claude Sonnet 4.6 obtuvo 48.5% en este benchmark.
IFEval
89.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Claude Sonnet 4.6 obtuvo 89.5% en este benchmark.
AIME 2025
83%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Claude Sonnet 4.6 obtuvo 83% en este benchmark.
MATH
85.3%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Claude Sonnet 4.6 obtuvo 85.3% en este benchmark.
GSM8k
96.4%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Claude Sonnet 4.6 obtuvo 96.4% en este benchmark.
MGSM
92.8%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Claude Sonnet 4.6 obtuvo 92.8% en este benchmark.
MathVista
68.7%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Claude Sonnet 4.6 obtuvo 68.7% en este benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Claude Sonnet 4.6 obtuvo 79.6% en este benchmark.
HumanEval
92.1%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Claude Sonnet 4.6 obtuvo 92.1% en este benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Claude Sonnet 4.6 obtuvo 72.4% en este benchmark.
MMMU
74.2%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Claude Sonnet 4.6 obtuvo 74.2% en este benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Claude Sonnet 4.6 obtuvo 75.6% en este benchmark.
ChartQA
88.1%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Claude Sonnet 4.6 obtuvo 88.1% en este benchmark.
DocVQA
93.4%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Claude Sonnet 4.6 obtuvo 93.4% en este benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Claude Sonnet 4.6 obtuvo 59.1% en este benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Claude Sonnet 4.6 obtuvo 58.3% en este benchmark.

Acerca de Claude Sonnet 4.6

Conoce las capacidades, características y formas de uso de Claude Sonnet 4.6.

Inteligencia agentic de alto rendimiento

Claude Sonnet 4.6 es el model más versátil de Anthropic, diseñado para actuar como motor principal de flujos de trabajo empresariales complejos y agentes autónomos. Lanzado el 17 de febrero de 2026, introduce capacidades de computer use a nivel humano y una context window de 1 millón de tokens. La arquitectura del model equilibra la velocidad de los sistemas de nivel intermedio con la profundidad de razonamiento típicamente reservada para la clase Opus, lo que la convierte en una opción sostenible para entornos de producción de alto volumen.

Razonamiento adaptativo y multimodalidad

En su núcleo técnico, Sonnet 4.6 utiliza un mecanismo de Adaptive Thinking. Esto permite a los desarrolladores escalar el esfuerzo de razonamiento interno en función de los requisitos específicos de una tarea, optimizando ya sea para una latencia de subsegundos o una verificación lógica profunda. El model es nativamente multimodal, ofreciendo un rendimiento state-of-the-art en el procesamiento de texto, imágenes de alta resolución y archivos de audio. Destaca en la interpretación de documentación técnica densa y datos visuales complejos, como planos arquitectónicos o gráficos financieros.

El estándar de la industria para la codificación

Con un récord de 79.6% en SWE-bench Verified, Sonnet 4.6 se ha convertido en la opción predeterminada para la automatización de la ingeniería de software. Su capacidad para razonar a través de vastas bases de código dentro de su context window de 1M le permite resolver errores en múltiples archivos y planificar refactorizaciones arquitectónicas con una mínima intervención humana. Al ofrecer una inteligencia cercana al nivel Opus por $3 por millón de tokens de entrada, elimina las barreras financieras asociadas anteriormente con el despliegue de sistemas de IA verdaderamente autónomos.

Claude Sonnet 4.6

Casos de uso de Claude Sonnet 4.6

Descubre las diferentes formas de usar Claude Sonnet 4.6 para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas complejos de GitHub que involucran múltiples archivos y ejecución de refactorizaciones de repositorios completos utilizando su precisión del 79.6% en SWE-bench.

Computer use a nivel humano

Navegación directa por software de escritorio e interfaces web para completar tareas administrativas de varios pasos sin integraciones de API personalizadas.

Análisis de documentos a gran escala

Revisión de miles de páginas de contratos legales o artículos de investigación simultáneamente dentro de la context window de 1 millón de tokens.

Inteligencia y pronósticos financieros

Procesamiento de llamadas de ganancias e informes trimestrales para identificar anomalías sutiles del mercado utilizando razonamiento adaptativo de alto esfuerzo.

Soporte técnico multimodal

Interpretación de diagramas técnicos complejos, fotos de placas de circuitos y grabaciones de audio para proporcionar pasos de resolución de problemas precisos.

Estrategia de negocios agentic

Planificación y ejecución de operaciones a largo plazo aprovechando las puntuaciones líderes en benchmarks de estrategia y lógica.

Fortalezas

Limitaciones

Precisión de codificación de élite: Establece el estándar de la industria con un 79.6% en SWE-bench Verified, superando a todos los demás modelos de nivel intermedio y a la mayoría de los modelos flagship.
Falta de entrada de video nativa: Requiere la extracción manual de fotogramas para el procesamiento visual de archivos de video, lo que añade complejidad a los flujos de trabajo multimedia.
Capacidad de contexto inigualable: La ventana de 1 millón de tokens permite la ingesta de bibliotecas técnicas completas o bases de código masivas sin degradación del rendimiento.
Mayor latencia de razonamiento: Utilizar el razonamiento adaptativo de alto esfuerzo aumenta significativamente el tiempo hasta el primer token en comparación con la inference estándar.
Computer use autónomo: Logra una puntuación del 72.5% en OSWorld, lo que permite al model navegar por GUI complejas y herramientas de software como un operador virtual.
Altos costes de razonamiento de salida: Si bien el precio de entrada es competitivo, las tareas de razonamiento de esfuerzo máximo pueden consumir grandes cantidades de tokens de salida, aumentando los costes.
Relación precio-rendimiento optimizada: Ofrece niveles de inteligencia cercanos a Opus por 1/5 del costo, lo que lo convierte en la opción más económica para despliegues de agentes a gran escala.
Ruido en la recuperación de contexto: En el límite de 1M de tokens, el model puede sufrir ocasionalmente una disminución de enfoque si el contexto está lleno de datos irrelevantes.

Inicio rápido de API

anthropic/claude-sonnet-4-6

Ver documentación
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Claude Sonnet 4.6

Mira lo que la comunidad piensa sobre Claude Sonnet 4.6

El contexto es ruido. Las ventanas de tokens más grandes son una trampa. Dale a los agentes solo la señal estrecha y curada que necesitan.
Logical-Storm-1180
reddit
Este es Claude Sonnet 4.6: nuestro model Sonnet más capaz hasta la fecha. Es una mejora completa en codificación, computer use y planificación de agentes.
Claude
twitter
La relación rendimiento-coste de Claude Sonnet 4.6 es extraordinaria; es difícil exagerar lo rápido que están evolucionando estos modelos.
Replit
youtube
Sonnet 4.6 ya está disponible en Claude Code. Es más barato que Opus 4.6 y se acerca a la inteligencia de nivel Opus.
Boris Cherny
twitter
Claude 4.6 es el nuevo líder en rendimiento agentic, ligeramente por delante de Opus 4.6 en tareas de conocimiento del mundo real.
Artificial Analysis
twitter
El hecho de que este model pueda navegar por una interfaz de computadora con un 72% de precisión básicamente elimina la necesidad de la mayoría de las API a medida.
DevOpsGuru
hackernews

Videos sobre Claude Sonnet 4.6

Mira tutoriales, reseñas y discusiones sobre Claude Sonnet 4.6

Sonic 4.6 ha llegado y puede reemplazar a Opus en el 90% de lo que haces a diario.

Pero la mejor parte es que es un 40% más barato que usar Opus 4.6.

Los resultados de SWE-bench son realmente increíbles para un model de nivel intermedio.

Puedes alimentarlo con una base de código completa y no pierde el hilo.

El esfuerzo de pensamiento adaptativo te permite cambiar velocidad por una lógica más profunda.

Los primeros usuarios informan que es capaz de un rendimiento casi humano en la manipulación compleja de hojas de cálculo.

Este model es aproximadamente el doble de rápido en comparación con Opus.

La context window de 1 millón de tokens está actualmente en beta pero funciona muy bien.

Navega por interfaces de software sin necesidad de integraciones de API específicas.

La capacidad de codificación en Python y JavaScript está básicamente en el techo.

Anthropic dice que la nueva context window es lo suficientemente grande como para contener bases de código completas y razonar eficazmente a través de todo ese contexto.

Opus 4.6 es la opción de fuerza bruta... pero ahora finalmente tenemos un bisturí, lo cual es una noticia fantástica.

Computer use es la característica destacada aquí, moviendo realmente el mouse y escribiendo.

A los analistas financieros les encantará la profundidad de razonamiento para la revisión de documentos.

Es la primera vez que un model 'Sonnet' se siente como el mejor de su clase.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Claude Sonnet 4.6

Consejos de expertos para ayudarte a sacar el máximo provecho de Claude Sonnet 4.6.

Optimizar el esfuerzo de pensamiento

Utiliza el modo de pensamiento 'adaptive' para ahorrar costes en consultas sencillas, reservando el esfuerzo 'max' para tareas de matemáticas y lógica.

Implementar compactación de contexto

Habilita las funciones de prompt caching y compactación para manejar la ventana de 1M de tokens de manera eficiente sin costes redundantes.

Anclaje conductual estructurado

Utiliza un archivo markdown central del proyecto para mantener una fuente de verdad persistente para las decisiones arquitectónicas del model.

Extracción de fotogramas de video

Dado que el video nativo no es compatible, extrae fotogramas clave a 1fps para obtener el análisis visual más preciso del contenido de video.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Preguntas Frecuentes Sobre Claude Sonnet 4.6

Encuentra respuestas a preguntas comunes sobre Claude Sonnet 4.6