moonshot

Kimi k2.6

Kimi k2.6 es el model MoE de 1T-parameters de Moonshot AI, que cuenta con una context window de 256K, entrada de video nativa y un rendimiento de élite en...

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20 de abril de 2026
Contexto
256Ktokens
Salida máx.
33Ktokens
Precio entrada
$0.95/ 1M
Precio salida
$4.00/ 1M
Modalidad:TextImageVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
90.5%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Kimi k2.6 obtuvo 90.5% en este benchmark.
HLE
54%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Kimi k2.6 obtuvo 54% en este benchmark.
MMLU
86.4%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Kimi k2.6 obtuvo 86.4% en este benchmark.
MMLU Pro
84.6%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Kimi k2.6 obtuvo 84.6% en este benchmark.
SimpleQA
43%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Kimi k2.6 obtuvo 43% en este benchmark.
IFEval
89.8%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Kimi k2.6 obtuvo 89.8% en este benchmark.
AIME 2025
97.3%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Kimi k2.6 obtuvo 97.3% en este benchmark.
MATH
98.2%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Kimi k2.6 obtuvo 98.2% en este benchmark.
GSM8k
97.3%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Kimi k2.6 obtuvo 97.3% en este benchmark.
MGSM
91.5%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Kimi k2.6 obtuvo 91.5% en este benchmark.
MathVista
67.1%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Kimi k2.6 obtuvo 67.1% en este benchmark.
SWE-Bench
80.2%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Kimi k2.6 obtuvo 80.2% en este benchmark.
HumanEval
92%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Kimi k2.6 obtuvo 92% en este benchmark.
LiveCodeBench
83.1%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Kimi k2.6 obtuvo 83.1% en este benchmark.
MMMU
77.3%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Kimi k2.6 obtuvo 77.3% en este benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Kimi k2.6 obtuvo 75.6% en este benchmark.
ChartQA
87.4%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Kimi k2.6 obtuvo 87.4% en este benchmark.
DocVQA
94.9%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Kimi k2.6 obtuvo 94.9% en este benchmark.
Terminal-Bench
60.2%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Kimi k2.6 obtuvo 60.2% en este benchmark.
ARC-AGI
68.8%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Kimi k2.6 obtuvo 68.8% en este benchmark.

Acerca de Kimi k2.6

Conoce las capacidades, características y formas de uso de Kimi k2.6.

Diseño arquitectónico y escala

Kimi k2.6 es un model multimodal de vanguardia Mixture-of-Experts (MoE) a escala de un billón de parameters. Utiliza 32 mil millones de active parameters por token, equilibrando la eficiencia computacional con un rendimiento cognitivo de alto nivel. La arquitectura admite un reasoning de cadena de pensamiento interno (chain-of-thought), donde el model genera pasos de razonamiento ocultos antes de emitir una respuesta final. Este diseño le permite abordar problemas complejos de varios pasos que normalmente bloquean a los grandes models de lenguaje estándar.

Inteligencia agentic y coordinación

El model está específicamente optimizado para la ingeniería de software autónoma y tareas de largo plazo. Puede gestionar Agent Swarms de hasta 300 sub-agents en paralelo, que se coordinan para refactorizar grandes bases de código o gestionar pipelines de DevOps complejos. Al utilizar llamadas a herramientas nativas y comprensión visual, Kimi k2.6 opera como un agente autónomo capaz de resolver problemas de GitHub en múltiples archivos y crear interfaces web ricas en movimiento a partir de referencias visuales.

Capacidades multimodales

El soporte nativo para entradas de video e imagen distingue a Kimi k2.6 de muchos de sus pares con open-weights. Procesa archivos de video directamente para realizar análisis de escenas, reproducción de errores y extracción de datos estructurados. El model actúa como un arquitecto visual, generando shaders 3D y animaciones complejas utilizando librerías como Three.js y GSAP basadas en descripciones visuales o mockups cargados.

Kimi k2.6

Casos de uso de Kimi k2.6

Descubre las diferentes formas de usar Kimi k2.6 para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas complejos de GitHub coordinando hasta 300 sub-agents en paralelo durante sesiones de 12 horas.

Generación de frontend rica en movimiento

Creación de interfaces web modernas con shaders de WebGL y GSAP a partir de simples prompt de texto o imagen.

Análisis profundo de video

Análisis de grabaciones para realizar reproducciones visuales de errores, descripción de escenas o extracción de datos estructurados.

Investigación de mercado agentic

Ejecución de búsquedas web y llamadas a herramientas en múltiples pasos para sintetizar informes de análisis competitivo a partir de cientos de fuentes.

Optimización de código heredado

Identificación de cuellos de botella en el rendimiento de bases de código antiguas mediante el análisis de flame graphs de CPU y datos de asignación.

Resolución de problemas científicos

Respuesta a preguntas de ciencia y matemáticas de nivel universitario utilizando reasoning asistido por Python y verificación mediante herramientas.

Fortalezas

Limitaciones

Coding agentic superior: Logra una puntuación del 80.2% en SWE-Bench Verified, situándose entre los models más capaces para la ingeniería autónoma.
Altos requisitos de VRAM local: Ejecutar el model completo de forma local requiere 600GB de VRAM, lo que limita el autoalojamiento a estaciones de trabajo de gama alta especializadas.
Escala de coordinación masiva: Gestiona 300 sub-agents en paralelo, lo que le permite manejar tareas de refactorización a nivel empresarial en una sola pasada.
Latency de la API regional: La infraestructura está optimizada para Asia, lo que puede dar lugar a tiempos de respuesta más elevados para los usuarios en regiones occidentales.
Versatilidad multimodal nativa: Admite entradas de video e imagen nativas, lo que permite flujos de trabajo de agent visual-language avanzados para tareas de UI/UX.
Brechas de recall en contextos largos: El model puede tener dificultades con un recall perfecto en los límites extremos de su buffer de 256,000 tokens.
Ventaja competitiva en precios agresivos: Con $0.95 por millón de tokens de entrada, es significativamente más económico que competidores cerrados como Claude 3.7 o GPT-4o.
Licencia comercial restringida: El lanzamiento de open-weights utiliza una licencia modificada que requiere un cumplimiento específico para implementaciones empresariales a gran escala.

Inicio rápido de API

moonshotai/kimi-k2.6

Ver documentación
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Kimi k2.6

Mira lo que la comunidad piensa sobre Kimi k2.6

Conoce Kimi K2.6: impulsando el coding open-source. Un prompt, más de 100 archivos. Más de 4,000 llamadas a herramientas durante 12 horas de ejecución continua.
@Kimi_Moonshot
twitter
Kimi 2.6 SUPERA a Opus 4.7 y es el MEJOR model open-source del mundo. Es un model muy bueno a un coste 10 veces menor.
@bindureddy
twitter
El delta de precios es lo que nadie está valorando. Kimi K2.6 es 5 veces más barato que Sonnet 4.6. La brecha en los benchmark se ha invertido oficialmente.
@aakashgupta
twitter
Lo probé contra un bug que tenía. Lo resolvió con éxito por poco más de $1. Era un bug difícil con el que Sonnet tuvo problemas.
@uworldhits1391
youtube
Kimi K2.6 es transformador, aunque tiene margen de mejora en el recall para tareas ultra largas. Aun así, 300 agentes en paralelo es una locura.
@Radiant-Act4707
reddit
La serie Kimi K2 marca el momento en que los laboratorios de open-source de vanguardia finalmente están rivalizando y superando a los gigantes de código cerrado.
@zxytim
twitter

Videos sobre Kimi k2.6

Mira tutoriales, reseñas y discusiones sobre Kimi k2.6

Kimi K2.6 no destruirá a Claude, pero SÍ destruirá los precios premium de los laboratorios cerrados.

La capacidad de Agent Swarm, con 300 agentes en paralelo, es algo que no hemos visto aún en el open-source.

La puntuación HLE de 54.0 es la más alta que hemos visto en un model de open weights.

Un prompt puede llevar a 12 horas de ejecución continua, lo cual es una nueva frontera para los agents.

Gestiona la invocación de herramientas en múltiples pasos con una estabilidad que iguala a los mejores models propietarios.

El vision model admite entrada de video nativa, una característica rara incluso en 2026.

Gestiona la invocación de herramientas en múltiples pasos con un modo de thinking estable que rivaliza con la serie o de OpenAI.

Para el desarrollo frontend, las generaciones ricas en movimiento son significativamente mejores que las de K2.5.

La context window de 256K permite analizar conjuntos de documentación completos de una sola vez.

Es uno de los primeros models en mostrar verdadera autonomía en entornos de terminal.

Combinar K2.6 con la Kimi Code CLI permite sesiones de coding autónomo de más de 12 horas.

Refactorizó un motor financiero de hace 8 años y obtuvo una ganancia de throughput del 185% de forma autónoma.

Es un model de un billón de parameters, pero los active parameters son solo 32B, manteniéndolo rápido.

El ahorro de costes para los desarrolladores que pasan de Claude a Kimi es astronómico.

Resolvió un bug en una librería compleja de Rust que llevaba abierta tres meses.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Kimi k2.6

Consejos de expertos para ayudarte a sacar el máximo provecho de Kimi k2.6.

Habilitar el uso de herramientas para Reasoning

Los benchmark muestran que la puntuación HLE salta de 23.9 a 54.0 cuando se le permite al model utilizar herramientas externas de búsqueda y computación.

Monitorizar los límites del buffer de contexto

El recall es más preciso en los primeros 200,000 tokens del buffer de 256,000 tokens.

Usar el modo Thinking con moderación

Desactiva el parámetro de thinking en tareas de chat sencillas para reducir la latency y el consumo total de tokens.

Estandarizar con etiquetas XML

El model sigue las instrucciones con mayor precisión cuando el contexto y las tareas están envueltos en etiquetas XML.

Aprovechar las subidas de video nativas

Utiliza métodos de carga de archivos en lugar de codificación base64 para videos de más de 100MB para evitar límites de tamaño de solicitud.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Preguntas Frecuentes Sobre Kimi k2.6

Encuentra respuestas a preguntas comunes sobre Kimi k2.6