¿Cuánto cuesta utilizar Kimi K2.5?

El costo de los input tokens es de $0.60 por millón y el de los output tokens es de $3.00 por millón. Esta estructura de precios lo convierte en uno de los modelos frontier-class más asequibles del mercado.

¿Cuál es la longitud máxima de contexto para Kimi K2.5?

Kimi K2.5 admite una context window de 256,000 tokens. Esto permite a los usuarios procesar libros completos o grandes bases de código en un solo prompt.

¿Puede Kimi K2.5 procesar archivos de video?

Sí, cuenta con un codificador nativo MoonViT-3D para procesar contenido de video largo. Puede analizar horas de metraje para identificar eventos, resúmenes y detalles visuales.

¿Es Kimi K2.5 open-source?

Moonshot AI ha publicado los pesos del model bajo una licencia MIT modificada. Esto permite a los desarrolladores alojar el model en su propia infraestructura.

¿Qué es la funcionalidad Agent Swarm?

Es un modo de orquestación donde el model gestiona hasta 100 sub-agents en paralelo. Se utiliza para tareas que requieren investigación de alta concurrencia o edición de múltiples archivos.

¿Cómo se compara Kimi K2.5 con Claude 3.7 Sonnet?

Kimi K2.5 ofrece capacidades de reasoning similares, pero incluye soporte nativo para video y precios significativamente más bajos. También destaca por su arquitectura única de swarm paralelo.

¿Qué hardware se requiere para ejecutar Kimi K2.5 localmente?

El model completo sin cuantizar requiere aproximadamente 632GB de VRAM. La mayoría de los usuarios locales deberán utilizar versiones cuantizadas en hardware de consumo de gama alta.

¿Cómo accedo al modo Thinking a través de la API?

Puedes activarlo añadiendo un objeto thinking con el tipo configurado en enabled dentro del extra_body de tu llamada a la API. Esto mejora el rendimiento en tareas de alta carga lógica.

Kimi K2.5

Descubre Kimi K2.5 de Moonshot AI, un model agentic open-source de 1T de parámetros con capacidades multimodales nativas, context window de 262K y reasoning de...

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27 de enero de 2026

Contexto

256Ktokens

Salida máx.

66Ktokens

Precio entrada

$0.60/ 1M

Precio salida

$3.00/ 1M

Modalidad:TextImageVideo

Capacidades:VisiónHerramientasStreamingRazonamiento

Benchmarks

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

Ver documentación API

Acerca de Kimi K2.5

Conoce las capacidades, características y formas de uso de Kimi K2.5.

Kimi K2.5 es un model multimodal open-source de Moonshot AI. Utiliza una arquitectura Mixture-of-Experts (MoE) de 1 billón de parámetros donde 32 mil millones de parámetros están activos por token. El sistema unifica el procesamiento de texto, imágenes y video a través de un framework de razonamiento único en lugar de utilizar codificadores externos independientes para cada modalidad. Esta arquitectura permite al model manejar 256,000 tokens de contexto manteniendo una alta precisión de recuperación y consistencia lógica en secuencias muy largas.

El model destaca por su capacidad Agent Swarm. Esta funcionalidad permite al sistema coordinar hasta 100 sub-agents en paralelo para ejecutar tareas complejas de investigación o ingeniería de forma simultánea. Al integrar un codificador MoonViT-3D de 400M de parámetros, K2.5 puede analizar varias horas de video con precisión temporal. Está diseñado específicamente para la ejecución autónoma, superando a muchos modelos propietarios en benchmarks agentic como SWE-Bench y BrowseComp.

Kimi K2.5 ofrece un Thinking mode dedicado para tareas que requieren una lógica profunda. Cuando se activa, el model genera una cadena de razonamiento interna para autocorregirse y verificar pasos antes de producir una respuesta final. Esto lo hace altamente efectivo para matemáticas de nivel de competición y desarrollo de software a gran escala. Su economía de tokens está optimizada para el despliegue empresarial, ofreciendo inteligencia de nivel frontier a una fracción del costo de los sistemas cerrados de la competencia.

Casos de uso de Kimi K2.5

Descubre las diferentes formas de usar Kimi K2.5 para lograr excelentes resultados.

Ingeniería de Software Autónoma

Resolución de problemas complejos de GitHub y construcción de arquitecturas de proyectos con múltiples archivos mediante lógica optimizada con SWE-Bench.

Desarrollo Web Visual

Creación de código frontend funcional y diseños de UI directamente a partir de grabaciones de pantalla de interacciones en sitios web existentes.

Investigación Multihilo

Uso de Agent Swarm para rastrear y sintetizar información de más de 100 fuentes en un solo flujo de trabajo paralelo.

Análisis de video largo

Extracción de eventos específicos y datos temporales de horas de grabaciones de seguridad o conferencias sin herramientas de extracción de fotogramas.

Generación de pruebas matemáticas

Aplicación del modo de deep thinking para resolver problemas matemáticos de nivel olímpico con una tasa de precisión del 96 por ciento.

Automatización de documentos empresariales

Generación de informes PDF de varias páginas y hojas de cálculo financieras complejas a partir de fuentes de datos empresariales no estructurados.

Fortalezas

Limitaciones

Rendimiento Agentic de élite: Obtiene una puntuación de 76.8 en SWE-Bench Verified, superando a muchos modelos frontier propietarios en tareas de ingeniería de software.

Necesidades extremas de VRAM local: Requiere 632GB de VRAM para el model completo sin cuantizar, haciendo que el despliegue local sea imposible para la mayoría de los usuarios domésticos.

Economía de tokens inigualable: Ofrece inteligencia MoE de 1T de parámetros a $0.60 por millón de input tokens, aproximadamente el 10 por ciento del costo de Claude Opus.

Mayor latencia de reasoning: El modo thinking puede introducir retrasos significativos mientras el model genera cadenas de lógica interna antes de responder.

Comprensión nativa de video: Procesa archivos de video complejos sin extracción externa de fotogramas, permitiendo un análisis temporal preciso de grabaciones largas.

Repetición en el formato: Puede generar bloques de texto excesivamente largos a menos que se le indique estrictamente que utilice estructuras de párrafos específicas.

Orquestación de enjambres paralelos: El único model abierto entrenado para coordinar hasta 100 sub-agents para flujos de trabajo de investigación masivos y multihilo.

Preocupaciones sobre la residencia de datos: La infraestructura principal tiene su sede en China, lo que puede presentar problemas de cumplimiento para ciertas empresas occidentales.

Inicio rápido de API

fireworks/kimi-k2p5

Ver documentación

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Kimi K2.5

Mira lo que la comunidad piensa sobre Kimi K2.5

“Kimi K2.5 cuesta casi el 10 por ciento de lo que cuesta Opus a un nivel de rendimiento similar.”

— Odd_Tumbleweed574

“La gente olvida que Nvidia perdió 600 mil millones de dólares cuando un laboratorio chino lanzó algo importante como open-source. Kimi está haciendo lo mismo con inteligencia de frontera.”

— chetaslua

twitter

“El concepto de Attention Residuals en K2.5 es el primer cambio arquitectónico en años que realmente soluciona el problema de olvido de los LLM.”

— logic_king

hackernews

“Workers AI ya ejecuta modelos grandes. Kimi K2.5 primero. Es uno de los mejores modelos open-source que existen, muy bueno también para programar.”

— dok2001

twitter

“Kimi K2.5 es otra bestia. Es un model de RP increíble e inteligente, pero puede volverse neurótico si no usas los ajustes preestablecidos de la comunidad.”

— dptgreg

“He reemplazado mi flujo de trabajo de GPT 4 con Kimi K2.5 porque el modo thinking es más transparente y la context window maneja todo mi repositorio.”

— Dev_Max

Videos sobre Kimi K2.5

Mira tutoriales, reseñas y discusiones sobre Kimi K2.5

“Kimi K2.5 supera a GPT 5.2 con su thinking avanzado, destruyendo por completo a otros modelos Frontier.”

“Es el model de programación open-source más potente hasta la fecha con 76.8 en SWE verified.”

“El Agent swarm supone un cambio: del agente único al multi-agente ejecutando flujos de trabajo paralelos en hasta 1500 pasos coordinados.”

“La context window es masiva, con 256k tokens, lo cual es suficiente para la mayoría de los proyectos.”

“Moonshot realmente está superando los límites de lo que pueden hacer los open weights a principios de 2026.”

“Realmente captó toda la estética de diseño de Apple y produjo un sitio web atractivo con animaciones solo a partir de un video.”

“La funcionalidad Swarm parece genial y es muy divertida de usar, ya que asigna insignias de ID a cada sub-agent.”

“K2.5 es mucho más barato: 60 centavos por millón de input tokens y 3 dólares por millón de output tokens.”

“El procesamiento nativo de video significa que no tienes que usar herramientas externas costosas para procesar fotogramas.”

“Este model cambia las reglas del juego para los desarrolladores que necesitan agentes autónomos con un presupuesto limitado.”

“Moonshot logró esto dando a cada sub-agent recompensas en diferentes etapas críticas del proceso para evitar el colapso serial.”

“El model aprende a elegir el paralelismo solo cuando acorta el camino crítico, una innovación muy inteligente.”

“Kimi K2.5 está a punto de poder ejecutarse en hardware de consumo usando GGUF.”

“El modo thinking es increíblemente robusto para resolver errores lógicos complejos en Python.”

“Ver el lanzamiento de un model de 1 billón de parámetros de esta manera es enorme para la comunidad open-source.”

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA

Automatización Web

Flujos Inteligentes

Comenzar Gratis

Consejos Pro para Kimi K2.5

Consejos de expertos para ayudarte a sacar el máximo provecho de Kimi K2.5.

Activa el modo Thinking

Incluye el parámetro thinking en tu solicitud de API para obtener la máxima precisión en tareas de matemáticas y programación.

Inicia un Agent Swarm

Indica al model que despliegue un enjambre (swarm) para tareas de investigación y así forzar la orquestación paralela entre los sub-agents.

Optimiza la Temperature

Utiliza una temperature de 1.0 para el modo thinking y permitir un razonamiento diverso, pero redúcela a 0.6 para chats estándar.

Prompts visuales conjuntos

Sube capturas de pantalla con errores junto a fragmentos de código para aprovechar el entrenamiento unificado de texto-visión del model.

Context Caching

Utiliza context caching para documentos extensos y recurrentes con el fin de reducir los costos de input hasta en un 90 por ciento.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

Preguntas Frecuentes Sobre Kimi K2.5

Encuentra respuestas a preguntas comunes sobre Kimi K2.5