Kimi K2.5

Descubra o Kimi K2.5 da Moonshot AI, um model agentic open-source de 1T de parameters com capacidades multimodais nativas, context window de 262K e reasoning...

Agentic AIMultimodalOpen-sourceReasoningMoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
Contexto
262Ktokens
Saida Max
33Ktokens
Preco Entrada
$0.60/ 1M
Preco Saida
$2.50/ 1M
Modalidade:TextImageVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
87.6%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Kimi K2.5 pontuou 87.6% neste benchmark.
HLE
50.2%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Kimi K2.5 pontuou 50.2% neste benchmark.
MMLU
92%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Kimi K2.5 pontuou 92% neste benchmark.
MMLU Pro
87.1%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Kimi K2.5 pontuou 87.1% neste benchmark.
SimpleQA
54%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Kimi K2.5 pontuou 54% neste benchmark.
IFEval
94%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Kimi K2.5 pontuou 94% neste benchmark.
AIME 2025
96.1%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Kimi K2.5 pontuou 96.1% neste benchmark.
MATH
98%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Kimi K2.5 pontuou 98% neste benchmark.
GSM8k
99%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Kimi K2.5 pontuou 99% neste benchmark.
MGSM
96%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Kimi K2.5 pontuou 96% neste benchmark.
MathVista
84.2%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Kimi K2.5 pontuou 84.2% neste benchmark.
SWE-Bench
76.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Kimi K2.5 pontuou 76.8% neste benchmark.
HumanEval
99%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Kimi K2.5 pontuou 99% neste benchmark.
LiveCodeBench
85%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Kimi K2.5 pontuou 85% neste benchmark.
MMMU
84%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Kimi K2.5 pontuou 84% neste benchmark.
MMMU Pro
78.5%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Kimi K2.5 pontuou 78.5% neste benchmark.
ChartQA
77.5%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Kimi K2.5 pontuou 77.5% neste benchmark.
DocVQA
88.8%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Kimi K2.5 pontuou 88.8% neste benchmark.
Terminal-Bench
50.8%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Kimi K2.5 pontuou 50.8% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Kimi K2.5 pontuou 12% neste benchmark.

Sobre Kimi K2.5

Aprenda sobre as capacidades do Kimi K2.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

Uma Nova Fronteira na Inteligência Agentic

O Kimi K2.5 é o model agentic open-source flagship da Moonshot AI, representando um grande salto na inteligência multimodal unificada. Construído sobre uma arquitetura massiva de 1 trilhão de parameters Mixture-of-Experts (MoE) com 32 bilhões de parameters ativos, ele integra nativamente o processamento de texto, imagem e vídeo em um único framework de reasoning. Diferente dos LLMs tradicionais, o K2.5 foi projetado especificamente para execução autônoma, apresentando um 'Thinking mode' exclusivo que permite autocorreção e reasoning em problemas complexos de múltiplas etapas sem intervenção humana.

Avanços Arquitetônicos

O model introduz um recurso revolucionário conhecido como 'Agent Swarm', que permite ao sistema coordenar dinamicamente até 100 sub-agentes paralelos para resolver tarefas massivas de pesquisa ou engenharia. Ao alcançar um desempenho de alto nível em benchmarks como SWE-Bench e AIME 2025, o Kimi K2.5 efetivamente reduz a lacuna entre models open-source e a frontier AI proprietária, oferecendo capacidades de elite por uma fração do custo operacional. Sua integração do encoder MoonViT-3D permite uma compreensão de vídeo sem precedentes, abrangendo várias horas de conteúdo com alta precisão temporal.

Eficiência Inigualável

Além do poder bruto, o K2.5 foca em uma economia de tokens sustentável. Ao utilizar context caching agressivo e uma estrutura MoE altamente otimizada, ele entrega um desempenho que rivaliza com os models proprietários mais caros, mantendo um ponto de preço altamente competitivo de $0,60 por milhão de input tokens. Isso o torna a espinha dorsal ideal para empresas que buscam implantar agentes autônomos complexos de longo contexto em escala.

Kimi K2.5

Casos de Uso para Kimi K2.5

Descubra as diferentes maneiras de usar Kimi K2.5 para obter otimos resultados.

Engenharia de Software Autônoma

Resolução de problemas complexos no GitHub e clonagem full-stack de sites a partir de esboços visuais de UI.

Resolução de Matemática em Nível de Olimpíada

Solução de provas matemáticas avançadas e problemas de nível de competição com mais de 96% de precisão no AIME 2025.

Reasoning de Vídeos de Longa Duração

Análise e sumarização de conteúdo de vídeos de até duas horas sem perda de contexto ou degradação temporal.

Agentes de Pesquisa Dinâmicos

Uso do 'Agent Swarm' para realizar pesquisas web multi-threaded e sintetizar dados de centenas de fontes em paralelo.

Geração de Frontend Estético

Conversão de wireframes de UI desenhados à mão ou capturas de tela em código React funcional e polido com animações expressivas.

Controle de Terminal Autônomo

Execução de comandos bash complexos e operações em nível de sistema para gerenciar clusters de servidores e ambientes de desenvolvimento.

Pontos Fortes

Limitacoes

Reasoning Matemático de Elite: Com pontuação de 96,1% no AIME 2025, supera quase todos os models proprietários em dedução lógica pura.
Exigente em Hardware: Rodar o model completo de 1T localmente requer um cluster de AI de nível empresarial com múltiplas GPUs H100 ou B200.
Paralelismo Massivo: A capacidade 'Agent Swarm' permite mais de 100 sub-agentes, reduzindo drasticamente o tempo de conclusão para tarefas de pesquisa.
Latência de Thinking: Ativar o modo de deep reasoning aumenta significativamente o tempo para o primeiro token em comparação com o processamento padrão.
Arquitetura Multimodal Unificada: Processa nativamente vídeos de 2 horas e imagens de alta resolução sem a necessidade de encoders de visão separados.
Lacuna de Conhecimento em Nível de Doutorado: Seu score de 50,2% no 'Humanity's Last Exam' mostra espaço para melhorias em expertise científica de alto nível.
Economia de Tokens Agressiva: A $0,60 por 1M de input tokens, é cerca de 8 a 10 vezes mais barato que frontier models comparáveis como o Claude 4.5.
Preocupações Regulatórias: Por ser um model chinês, o uso da API e a soberania dos dados podem estar sujeitos a diferentes estruturas regulatórias para empresas ocidentais.

Inicio Rapido da API

fireworks/kimi-k2p5

Ver Documentacao
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Kimi K2.5

Veja o que a comunidade pensa sobre Kimi K2.5

"As capacidades de reasoning no AIME 2025 são absolutamente insanas para um model aberto."
LogicLover
reddit
"O Kimi K2.5 acabou de estabelecer o novo padrão para compreensão de vídeos longos. Finalmente um model que não esquece o início do clipe."
AI_Pioneer
x
"Usar o K2.5 como um agente de coding mudou o jogo. Sua pontuação no SWE-Bench não é apenas um número, você consegue sentir a competência."
DevGuru
hackernews
"A China acaba de lançar o Kimi K2.5 e, como um relógio, o desempenho está no mesmo nível dos models de frontier AI americanos."
BasedTorba
x
"O Kimi da China acabou de destruir o sonho de trilhões da OpenAI... 8 vezes mais barato."
nrqa__
x
"O Kimi K2.5 é o primeiro model que realmente parece um co-pilot em vez de apenas uma caixa de chat."
CodeWizard
reddit

Videos Sobre Kimi K2.5

Assista tutoriais, analises e discussoes sobre Kimi K2.5

Testando os problemas do AIME, o Kimi K2.5 acertou quase tudo, até mesmo aqueles em que o GPT-4o teve dificuldade.

Para tarefas de coding, as capacidades agentic são claramente onde este model brilha em comparação com LLMs padrão.

A natureza open-source de um model de um trilhão de parameters como este é sem precedentes no mercado atual.

Você está vendo um processamento de lógica aqui que rivalizou com o o1 nos meus testes iniciais de matemática.

O preço dos tokens é tão baixo que efetivamente acaba com o argumento de usar models fechados proprietários para tarefas básicas.

A capacidade de processar vídeos de duas horas de uma só vez sem perder o contexto é um avanço massivo.

Não é apenas um chat model; ele foi projetado do zero para usar ferramentas e terminais.

Quando você aciona o modo Swarm, o paralelismo para pesquisa na web é basicamente inigualável.

Isso é a Moonshot AI avisando ao mundo que eles têm o compute e o talento.

Vê-lo navegar em um terminal ao vivo para corrigir um bug é o futuro da engenharia autônoma.

O salto do Kimi K2.5 no benchmark BrowseComp sugere que ele pode navegar na web com um nível de persistência que ainda não tínhamos visto.

O fato de estar unificando os modos de visão e thinking em uma única arquitetura é a verdadeira história arquitetônica aqui.

O desempenho no MMLU e GSM8k prova que a qualidade dos dados usados para o treinamento foi de alto nível.

Diferente de versões anteriores, a compreensão de vídeo aqui não sofre de degradação temporal.

Se você é um desenvolvedor, a compatibilidade com OpenAI torna a migração para este model para testes algo que exige esforço zero.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais para Kimi K2.5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Kimi K2.5 e obter melhores resultados.

Aproveite o Thinking Mode

Use explicitamente o prompt 'Think step-by-step' para ativar seu modo de reasoning em tarefas de lógica pesada, matemática ou coding.

Vantagem do Contexto de Vídeo

Use o encoder MoonViT-3D do model para processar vídeos extremamente longos; ele é excelente para encontrar detalhes específicos em clipes de 2 horas.

Orquestração de Agentes

Para projetos grandes, utilize a capacidade de swarm para permitir que o K2.5 divida tarefas em sub-tarefas para uma execução mais rápida.

Economia com Cache Hit

Estruture suas chamadas de API para tirar vantagem do context caching agressivo da Moonshot para reduzir os custos de input em até 75%.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Perguntas Frequentes Sobre Kimi K2.5

Encontre respostas para perguntas comuns sobre Kimi K2.5