moonshot

Kimi K2.7 Code

Kimi K2.7 Code es un model MoE de 1T de parameters de Moonshot AI. Cuenta con un context window de 262k y un razonamiento un 30% más eficiente para ingeniería...

Coding FlagshipOpen WeightsMoE ArchitectureMultimodal AIReasoning Model
moonshot logomoonshotKimi12 de junio de 2026
Contexto
262Ktokens
Salida máx.
262Ktokens
Precio entrada
$0.95/ 1M
Precio salida
$4.00/ 1M
Modalidad:TextImageVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
65.8%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Kimi K2.7 Code obtuvo 65.8% en este benchmark.
HLE
38.2%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Kimi K2.7 Code obtuvo 38.2% en este benchmark.
MMLU
87.2%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Kimi K2.7 Code obtuvo 87.2% en este benchmark.
MMLU Pro
71.4%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Kimi K2.7 Code obtuvo 71.4% en este benchmark.
SimpleQA
52.4%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Kimi K2.7 Code obtuvo 52.4% en este benchmark.
IFEval
88.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Kimi K2.7 Code obtuvo 88.5% en este benchmark.
AIME 2025
91.5%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Kimi K2.7 Code obtuvo 91.5% en este benchmark.
MATH
81.3%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Kimi K2.7 Code obtuvo 81.3% en este benchmark.
GSM8k
97.2%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Kimi K2.7 Code obtuvo 97.2% en este benchmark.
MGSM
92.4%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Kimi K2.7 Code obtuvo 92.4% en este benchmark.
MathVista
65.5%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Kimi K2.7 Code obtuvo 65.5% en este benchmark.
SWE-Bench
78.2%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Kimi K2.7 Code obtuvo 78.2% en este benchmark.
HumanEval
94.2%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Kimi K2.7 Code obtuvo 94.2% en este benchmark.
LiveCodeBench
68.5%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Kimi K2.7 Code obtuvo 68.5% en este benchmark.
MMMU
72.4%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Kimi K2.7 Code obtuvo 72.4% en este benchmark.
MMMU Pro
48.2%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Kimi K2.7 Code obtuvo 48.2% en este benchmark.
ChartQA
84.2%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Kimi K2.7 Code obtuvo 84.2% en este benchmark.
DocVQA
90.1%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Kimi K2.7 Code obtuvo 90.1% en este benchmark.
Terminal-Bench
67%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Kimi K2.7 Code obtuvo 67% en este benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Kimi K2.7 Code obtuvo 12.5% en este benchmark.

Acerca de Kimi K2.7 Code

Conoce las capacidades, características y formas de uso de Kimi K2.7 Code.

Mixture of Experts de un billón de parameters

Kimi K2.7 Code es la última iteración del model Mixture of Experts (MoE) de un billón de parameters de Moonshot AI. Está optimizado para la ingeniería de software y la automatización de agentes. El model activa 32 mil millones de parameters por paso de inference, lo que equilibra una alta inteligencia con velocidad operativa. Introduce un mecanismo de razonamiento refinado que utiliza un 30 por ciento menos de tokens para pensar en comparación con versiones anteriores. La resolución de problemas técnicos es más rápida y rentable para conversaciones de múltiples turnos.

Multimodalidad nativa y contexto visual

Este model es multimodal de forma nativa y procesa entradas de texto, imagen y video. Su context window de 262,144 tokens maneja grandes bases de código y stack traces complejos. Al lanzar el model como open-weights, Moonshot AI proporciona una alternativa a los modelos propietarios de frontera para los desarrolladores que construyen agentes de IA autónomos. Mantiene la consistencia en tareas de programación a largo plazo y traduce diseños visuales en código funcional sin necesidad de descripciones de texto intermedias.

Kimi K2.7 Code

Casos de uso de Kimi K2.7 Code

Descubre las diferentes formas de usar Kimi K2.7 Code para lograr excelentes resultados.

Programación con agentes autónomos

Potenciar agentes de múltiples pasos que navegan por estructuras de archivos complejas y ejecutan refactorizaciones en múltiples archivos mediante acceso a la terminal.

Traducción de visual a código

Convertir diseños de UI complejos o diagramas de arquitectura directamente en código funcional para sistemas o front-end.

Debugging de largo alcance

Analizar historiales completos de proyectos y stack traces dentro del context window de 262k para identificar errores arquitectónicos.

Síntesis de escenas 3D

Generar entornos 3D interactivos de alta fidelidad usando Three.js o C++ a partir de descripciones en lenguaje natural.

Aseguramiento de calidad basado en video

Analizar sesiones de pantalla grabadas o demostraciones en video para identificar errores visuales y transiciones de UI inconsistentes.

Modernización de sistemas legacy

Automatizar la migración de bases de código antiguas a frameworks modernos manteniendo un chain-of-thought consistente.

Fortalezas

Limitaciones

Benchmarks de código de primer nivel: Obtiene 78.2 por ciento en SWE-bench Verified y 94.2 por ciento en HumanEval, superando a la mayoría de modelos con open-weights.
Formateo inconsistente en C++: Puede requerir múltiples intentos para reescribir archivos grandes de C++ sin introducir errores menores de sintaxis o formato.
Eficiencia en razonamiento: Reduce la sobrecarga de los tokens de pensamiento en un 30 por ciento en comparación con las generaciones anteriores, acelerando los ciclos complejos.
Context window frente a competidores: Aunque 262k es un tamaño grande, se queda atrás de los context windows de un millón de tokens ofrecidos por Google Gemini 2.0.
Soporte nativo para video: Uno de los pocos modelos capaces de procesar entrada de video directa para pruebas de UI y debugging visual.
Estabilidad del navegador headless: Los pipelines de QA autónomos que usan Chrome headless pueden colgarse ocasionalmente durante pasos largos de verificación.
Relación precio-rendimiento: Ofrece un rendimiento de nivel GPT-5.5 en tareas de programación a un bajo costo de $0.95 por millón de tokens de entrada.
Precisión en física 3D: Puede tener dificultades con la gravedad realista o la fricción compleja en simulaciones de física generadas, requiriendo ajuste manual.

Inicio rápido de API

moonshot/kimi-k2.7-code

Ver documentación
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Kimi K2.7 Code

Mira lo que la comunidad piensa sobre Kimi K2.7 Code

Kimi 2.7 ocupó el segundo lugar después de Fable 5 y antes de GPT-5 xhigh... Kimi 2.7 es increíblemente bueno.
Przemek Chojecki
twitter
Kimi K2.7 Code acaba de hacer que Kimi K2.6 parezca dolorosamente anticuado... ¡dio la representación más realista de ondas de agua!
GMI Cloud
twitter
Es el model de open-weight número 1 en SWE-bench (78.2%) y Terminal-Bench 2.1.
Vals AI
twitter
¡Kimi-K2.7-Code ya fue lanzado y es open-source! Rendimiento de programación y agentes mejorado sobre K2.6.
Kimi.ai
twitter
Manejó 50 PDFs legales de una sola vez sin despeinarse.
ThePromptEngineer
youtube
El precio bajó de $20/mes a $1.5/mes con la API. UX decente.
LocalLLaMA-User
reddit

Videos sobre Kimi K2.7 Code

Mira tutoriales, reseñas y discusiones sobre Kimi K2.7 Code

Comenzó a pensar mucho más y por mucho más tiempo.

La versión 2.7 entregó mejores resultados, más rápido, pero un poco más caro en términos de tokens totales utilizados.

Profundizó más en la implementación de proyectos largos hasta lograr el éxito.

No solo genera código, primero planifica la arquitectura en sus tokens de pensamiento.

La lógica en el script de Python fue impecable comparada con la versión 2.6 anterior.

Ha mejorado la eficiencia de tokens respecto a Kimi K2.6, reduciendo el uso de tokens de pensamiento en aproximadamente un 30%.

El proceso de razonamiento es mucho más directo mientras mantiene la alta tasa de éxito del model.

La diferencia entre ambos no es una locura si consideras que este model es 12.5 veces más barato que Claude Fable.

Este model es 12.5 veces más barato que Claude Fable al precio actual de la API.

El rendimiento en SWE-bench Verified es de primer nivel para un lanzamiento de open-weights.

El context window de 256k es increíblemente estable para la generación de proyectos con múltiples archivos.

Manejó la lógica de C++ sin necesidad de documentación de librerías externas.

El proceso de razonamiento es mucho más lineal ahora, sin bucles redundantes.

Construyó toda la estructura del proyecto en 15 minutos, incluidos los componentes del backend.

Es el mejor model de open-weights para tareas de programación disponible en el mercado ahora mismo.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Kimi K2.7 Code

Consejos de expertos para ayudarte a sacar el máximo provecho de Kimi K2.7 Code.

Preservar el Modo Pensamiento

Habilite siempre preserve_thinking en sus llamadas a la API para asegurar que el model utilice su cadena de razonamiento optimizada para la lógica.

Prompting Multimodal

Proporcione capturas de pantalla de errores actuales o mockups de UI junto con instrucciones de texto para mejorar la tasa de éxito en la generación de código.

Gestionar el presupuesto de contexto

Mantenga las instrucciones críticas para el rendimiento al principio o al final del prompt para obtener el seguimiento de instrucciones más confiable.

Integración con CLI

Utilice la CLI oficial de Kimi Code para desarrollo local a fin de aprovechar la capacidad nativa del model para interactuar con entornos locales.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Preguntas Frecuentes Sobre Kimi K2.7 Code

Encuentra respuestas a preguntas comunes sobre Kimi K2.7 Code