¿Cuál es el precio de Kimi k2.6?

Kimi k2.6 cuesta $0.95 por cada 1 millón de tokens de entrada y $4.00 por cada 1 millón de tokens de salida. Para la entrada con caché, el precio baja a $0.16 por millón de tokens.

¿Cómo accedo a la API de Kimi k2.6?

Accede a la API a través de la plataforma Moonshot AI en platform.kimi.ai utilizando un SDK compatible con OpenAI. La URL base es https://api.moonshot.ai/v1.

¿Kimi k2.6 es compatible con entrada de video?

Sí, es compatible con entrada de video nativa en formatos como MP4, MOV y WEBM para descripciones de escenas y análisis de movimiento.

¿Cuál es el tamaño de la context window?

El model admite una context window de 256,000 tokens, lo que equivale aproximadamente a un libro de 300 páginas.

¿Qué es un model Thinking?

El modo Thinking permite al model generar un chain-of-thought interno antes de responder, lo que mejora el rendimiento en tareas de lógica compleja.

¿Es Kimi k2.6 open-source?

Kimi k2.6 es un model con open-weights, lo que significa que los pesos están disponibles para descargar en plataformas como Hugging Face para alojamiento local.

¿Qué son los Agent Swarms?

Los Agent Swarms permiten que el model inicie 300 sub-agents en paralelo para manejar tareas masivas en 100 o más archivos simultáneamente.

¿Cuáles son los requisitos de hardware para el alojamiento local?

Ejecutar el model completo de 1T-parameters de forma local requiere aproximadamente 600GB de VRAM, aunque las versiones cuantizadas pueden ejecutarse en configuraciones más modestas.

Kimi k2.6

Kimi k2.6 es el model MoE de 1T-parameters de Moonshot AI, que cuenta con una context window de 256K, entrada de video nativa y un rendimiento de élite en...

ReasoningMultimodalCoding AgentOpen WeightsMoE

moonshotKimi20 de abril de 2026

Contexto

256Ktokens

Salida máx.

33Ktokens

Precio entrada

$0.95/ 1M

Precio salida

$4.00/ 1M

Modalidad:TextImageVideo

Capacidades:VisiónHerramientasStreamingRazonamiento

Benchmarks

GPQA

90.5%

HLE

54%

MMLU

86.4%

MMLU Pro

84.6%

SimpleQA

43%

IFEval

89.8%

AIME 2025

97.3%

MATH

98.2%

GSM8k

97.3%

MGSM

91.5%

MathVista

67.1%

SWE-Bench

80.2%

HumanEval

92%

LiveCodeBench

83.1%

MMMU

77.3%

MMMU Pro

75.6%

ChartQA

87.4%

DocVQA

94.9%

Terminal-Bench

60.2%

ARC-AGI

68.8%

Ver documentación API

Acerca de Kimi k2.6

Conoce las capacidades, características y formas de uso de Kimi k2.6.

Diseño arquitectónico y escala

Kimi k2.6 es un model multimodal de vanguardia Mixture-of-Experts (MoE) a escala de un billón de parameters. Utiliza 32 mil millones de active parameters por token, equilibrando la eficiencia computacional con un rendimiento cognitivo de alto nivel. La arquitectura admite un reasoning de cadena de pensamiento interno (chain-of-thought), donde el model genera pasos de razonamiento ocultos antes de emitir una respuesta final. Este diseño le permite abordar problemas complejos de varios pasos que normalmente bloquean a los grandes models de lenguaje estándar.

Inteligencia agentic y coordinación

El model está específicamente optimizado para la ingeniería de software autónoma y tareas de largo plazo. Puede gestionar Agent Swarms de hasta 300 sub-agents en paralelo, que se coordinan para refactorizar grandes bases de código o gestionar pipelines de DevOps complejos. Al utilizar llamadas a herramientas nativas y comprensión visual, Kimi k2.6 opera como un agente autónomo capaz de resolver problemas de GitHub en múltiples archivos y crear interfaces web ricas en movimiento a partir de referencias visuales.

Capacidades multimodales

El soporte nativo para entradas de video e imagen distingue a Kimi k2.6 de muchos de sus pares con open-weights. Procesa archivos de video directamente para realizar análisis de escenas, reproducción de errores y extracción de datos estructurados. El model actúa como un arquitecto visual, generando shaders 3D y animaciones complejas utilizando librerías como Three.js y GSAP basadas en descripciones visuales o mockups cargados.

Casos de uso de Kimi k2.6

Descubre las diferentes formas de usar Kimi k2.6 para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas complejos de GitHub coordinando hasta 300 sub-agents en paralelo durante sesiones de 12 horas.

Generación de frontend rica en movimiento

Creación de interfaces web modernas con shaders de WebGL y GSAP a partir de simples prompt de texto o imagen.

Análisis profundo de video

Análisis de grabaciones para realizar reproducciones visuales de errores, descripción de escenas o extracción de datos estructurados.

Investigación de mercado agentic

Ejecución de búsquedas web y llamadas a herramientas en múltiples pasos para sintetizar informes de análisis competitivo a partir de cientos de fuentes.

Optimización de código heredado

Identificación de cuellos de botella en el rendimiento de bases de código antiguas mediante el análisis de flame graphs de CPU y datos de asignación.

Resolución de problemas científicos

Respuesta a preguntas de ciencia y matemáticas de nivel universitario utilizando reasoning asistido por Python y verificación mediante herramientas.

Fortalezas

Limitaciones

Coding agentic superior: Logra una puntuación del 80.2% en SWE-Bench Verified, situándose entre los models más capaces para la ingeniería autónoma.

Altos requisitos de VRAM local: Ejecutar el model completo de forma local requiere 600GB de VRAM, lo que limita el autoalojamiento a estaciones de trabajo de gama alta especializadas.

Escala de coordinación masiva: Gestiona 300 sub-agents en paralelo, lo que le permite manejar tareas de refactorización a nivel empresarial en una sola pasada.

Latency de la API regional: La infraestructura está optimizada para Asia, lo que puede dar lugar a tiempos de respuesta más elevados para los usuarios en regiones occidentales.

Versatilidad multimodal nativa: Admite entradas de video e imagen nativas, lo que permite flujos de trabajo de agent visual-language avanzados para tareas de UI/UX.

Brechas de recall en contextos largos: El model puede tener dificultades con un recall perfecto en los límites extremos de su buffer de 256,000 tokens.

Ventaja competitiva en precios agresivos: Con $0.95 por millón de tokens de entrada, es significativamente más económico que competidores cerrados como Claude 3.7 o GPT-4o.

Licencia comercial restringida: El lanzamiento de open-weights utiliza una licencia modificada que requiere un cumplimiento específico para implementaciones empresariales a gran escala.

Inicio rápido de API

moonshotai/kimi-k2.6

Ver documentación

moonshot SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Kimi k2.6

Mira lo que la comunidad piensa sobre Kimi k2.6

“Conoce Kimi K2.6: impulsando el coding open-source. Un prompt, más de 100 archivos. Más de 4,000 llamadas a herramientas durante 12 horas de ejecución continua.”

— @Kimi_Moonshot

twitter

“Kimi 2.6 SUPERA a Opus 4.7 y es el MEJOR model open-source del mundo. Es un model muy bueno a un coste 10 veces menor.”

— @bindureddy

twitter

“El delta de precios es lo que nadie está valorando. Kimi K2.6 es 5 veces más barato que Sonnet 4.6. La brecha en los benchmark se ha invertido oficialmente.”

— @aakashgupta

twitter

“Lo probé contra un bug que tenía. Lo resolvió con éxito por poco más de $1. Era un bug difícil con el que Sonnet tuvo problemas.”

— @uworldhits1391

youtube

“Kimi K2.6 es transformador, aunque tiene margen de mejora en el recall para tareas ultra largas. Aun así, 300 agentes en paralelo es una locura.”

— @Radiant-Act4707

“La serie Kimi K2 marca el momento en que los laboratorios de open-source de vanguardia finalmente están rivalizando y superando a los gigantes de código cerrado.”

— @zxytim

twitter

Videos sobre Kimi k2.6

Mira tutoriales, reseñas y discusiones sobre Kimi k2.6

“Kimi K2.6 no destruirá a Claude, pero SÍ destruirá los precios premium de los laboratorios cerrados.”

“La capacidad de Agent Swarm, con 300 agentes en paralelo, es algo que no hemos visto aún en el open-source.”

“La puntuación HLE de 54.0 es la más alta que hemos visto en un model de open weights.”

“Un prompt puede llevar a 12 horas de ejecución continua, lo cual es una nueva frontera para los agents.”

“Gestiona la invocación de herramientas en múltiples pasos con una estabilidad que iguala a los mejores models propietarios.”

“El vision model admite entrada de video nativa, una característica rara incluso en 2026.”

“Gestiona la invocación de herramientas en múltiples pasos con un modo de thinking estable que rivaliza con la serie o de OpenAI.”

“Para el desarrollo frontend, las generaciones ricas en movimiento son significativamente mejores que las de K2.5.”

“La context window de 256K permite analizar conjuntos de documentación completos de una sola vez.”

“Es uno de los primeros models en mostrar verdadera autonomía en entornos de terminal.”

“Combinar K2.6 con la Kimi Code CLI permite sesiones de coding autónomo de más de 12 horas.”

“Refactorizó un motor financiero de hace 8 años y obtuvo una ganancia de throughput del 185% de forma autónoma.”

“Es un model de un billón de parameters, pero los active parameters son solo 32B, manteniéndolo rápido.”

“El ahorro de costes para los desarrolladores que pasan de Claude a Kimi es astronómico.”

“Resolvió un bug en una librería compleja de Rust que llevaba abierta tres meses.”

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA

Automatización Web

Flujos Inteligentes

Comenzar Gratis

Consejos Pro para Kimi k2.6

Consejos de expertos para ayudarte a sacar el máximo provecho de Kimi k2.6.

Habilitar el uso de herramientas para Reasoning

Los benchmark muestran que la puntuación HLE salta de 23.9 a 54.0 cuando se le permite al model utilizar herramientas externas de búsqueda y computación.

Monitorizar los límites del buffer de contexto

El recall es más preciso en los primeros 200,000 tokens del buffer de 256,000 tokens.

Usar el modo Thinking con moderación

Desactiva el parámetro de thinking en tareas de chat sencillas para reducir la latency y el consumo total de tokens.

Estandarizar con etiquetas XML

El model sigue las instrucciones con mayor precisión cuando el contexto y las tareas están envueltos en etiquetas XML.

Aprovechar las subidas de video nativas

Utiliza métodos de carga de archivos en lugar de codificación base64 para videos de más de 100MB para evitar límites de tamaño de solicitud.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Preguntas Frecuentes Sobre Kimi k2.6

Encuentra respuestas a preguntas comunes sobre Kimi k2.6