moonshot

Kimi K2.5

Conheça o Kimi K2.5 da Moonshot AI, um modelo agentic open-source de 1T de parameters com recursos multimodais nativos, context window de 262K e SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27 de janeiro de 2026
Contexto
256Ktokens
Saida Max
66Ktokens
Preco Entrada
$0.60/ 1M
Preco Saida
$3.00/ 1M
Modalidade:TextImageVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
87.6%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Kimi K2.5 pontuou 87.6% neste benchmark.
HLE
50.2%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Kimi K2.5 pontuou 50.2% neste benchmark.
MMLU
91.5%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Kimi K2.5 pontuou 91.5% neste benchmark.
MMLU Pro
87.1%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Kimi K2.5 pontuou 87.1% neste benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Kimi K2.5 pontuou 48% neste benchmark.
IFEval
85%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Kimi K2.5 pontuou 85% neste benchmark.
AIME 2025
96.1%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Kimi K2.5 pontuou 96.1% neste benchmark.
MATH
90.1%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Kimi K2.5 pontuou 90.1% neste benchmark.
GSM8k
97.1%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Kimi K2.5 pontuou 97.1% neste benchmark.
MGSM
95%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Kimi K2.5 pontuou 95% neste benchmark.
MathVista
90.1%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Kimi K2.5 pontuou 90.1% neste benchmark.
SWE-Bench
76.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Kimi K2.5 pontuou 76.8% neste benchmark.
HumanEval
88%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Kimi K2.5 pontuou 88% neste benchmark.
LiveCodeBench
85%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Kimi K2.5 pontuou 85% neste benchmark.
MMMU
78.5%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Kimi K2.5 pontuou 78.5% neste benchmark.
MMMU Pro
78.5%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Kimi K2.5 pontuou 78.5% neste benchmark.
ChartQA
77.5%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Kimi K2.5 pontuou 77.5% neste benchmark.
DocVQA
88.8%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Kimi K2.5 pontuou 88.8% neste benchmark.
Terminal-Bench
50.8%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Kimi K2.5 pontuou 50.8% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Kimi K2.5 pontuou 12% neste benchmark.

Sobre Kimi K2.5

Aprenda sobre as capacidades do Kimi K2.5, recursos e como ele pode ajuda-lo a obter melhores resultados.

O Kimi K2.5 é um modelo multimodal open-source da Moonshot AI. Ele utiliza uma arquitetura Mixture-of-Experts de 1 trilhão de parameters, onde 32 bilhões de parameters estão ativos por token. O sistema unifica o processamento de texto, imagem e vídeo através de uma única estrutura de reasoning, em vez de usar encoders externos separados para cada modalidade. Essa arquitetura permite que o modelo lide com 256.000 tokens de contexto enquanto mantém uma alta precisão de recuperação e consistência lógica em sequências muito longas.

O modelo se destaca pela sua capacidade de Agent Swarm. Este recurso permite que o sistema coordene até 100 sub-agents paralelos para executar tarefas complexas de pesquisa ou engenharia simultaneamente. Ao integrar um encoder MoonViT-3D de 400M de parameters, o K2.5 pode analisar várias horas de conteúdo de vídeo com precisão temporal. Ele foi projetado especificamente para execução autônoma, superando muitos modelos proprietários em benchmarks agentic como o SWE-Bench e BrowseComp.

O Kimi K2.5 oferece um modo Thinking dedicado para tarefas que exigem lógica profunda. Quando ativado, o modelo gera uma cadeia de reasoning interna para corrigir e verificar etapas antes de produzir uma resposta final. Isso o torna altamente eficaz para matemática de nível competitivo e desenvolvimento de software em grande escala. Sua economia de tokens é otimizada para implantação empresarial, oferecendo inteligência de nível frontier por uma fração do custo de sistemas fechados concorrentes.

Kimi K2.5

Casos de Uso para Kimi K2.5

Descubra as diferentes maneiras de usar Kimi K2.5 para obter otimos resultados.

Engenharia de Software Autônoma

Resolução de issues complexas no GitHub e construção de arquiteturas de projetos com múltiplos arquivos usando lógica otimizada para o SWE-Bench.

Desenvolvimento Web Visual

Criação de código frontend funcional e designs de UI diretamente a partir de gravações de tela de interações de sites existentes.

Pesquisa Multi-Threaded

Uso do Agent Swarm para rastrear e sintetizar informações de mais de 100 fontes em um único fluxo de trabalho paralelo.

Análise de Vídeos Longos

Extração de eventos específicos e dados temporais de horas de filmagens de segurança ou palestras sem ferramentas de extração de quadros.

Geração de Provas Matemáticas

Aplicação do modo de deep thinking para resolver problemas matemáticos de nível olímpico com uma taxa de precisão de 96 por cento.

Automação de Documentos Empresariais

Geração de relatórios em PDF de várias páginas e planilhas financeiras complexas a partir de fontes de dados corporativos não estruturados.

Pontos Fortes

Limitacoes

Desempenho Agentic de Elite: Pontua 76.8 no SWE-Bench Verified, superando muitos modelos frontier proprietários em tarefas de engenharia de software.
Necessidades extremas de VRAM local: Requer 632GB de VRAM para o modelo completo não quantizado, tornando a implementação local impossível para a maioria dos usuários comuns.
Economia de tokens inigualável: Fornece inteligência de 1T de parameters MoE a $0,60 por milhão de tokens de entrada, aproximadamente 10 por cento do custo do Claude Opus.
Maior latência de reasoning: O modo thinking pode introduzir atrasos significativos à medida que o modelo gera cadeias de lógica interna antes de responder.
Compreensão de vídeo nativa: Processa arquivos de vídeo complexos sem extração externa de quadros, permitindo uma análise temporal precisa de gravações longas.
Repetição de formatação: Pode produzir paredes de texto excessivamente longas, a menos que seja estritamente instruído a usar estruturas de parágrafo específicas.
Orquestração de Swarm paralela: O único modelo aberto treinado para coordenar até 100 sub-agents para fluxos de trabalho de pesquisa massivos e multi-threaded.
Preocupações com residência de dados: A infraestrutura principal está sediada na China, o que pode apresentar problemas de conformidade para certas empresas ocidentais.

Inicio Rapido da API

fireworks/kimi-k2p5

Ver Documentacao
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Kimi K2.5

Veja o que a comunidade pensa sobre Kimi K2.5

O Kimi K2.5 custa quase 10 por cento do que o Opus custa em um nível de desempenho similar.
Odd_Tumbleweed574
reddit
As pessoas esquecem que a Nvidia perdeu 600 bilhões de dólares quando um laboratório chinês abriu algo importante. O Kimi está fazendo isso de novo com inteligência frontier.
chetaslua
twitter
O conceito de Attention Residuals no K2.5 é a primeira mudança arquitetônica em anos que realmente corrige o problema de esquecimento dos LLMs.
logic_king
hackernews
O Workers AI executa grandes modelos agora. O Kimi K2.5 primeiro. É um dos melhores modelos open-source por aí, muito bom para coding também.
dok2001
twitter
O Kimi K2.5 é uma fera diferente. É um modelo RP inteligente e incrível, mas pode ficar neurótico se você não usar presets da comunidade.
dptgreg
reddit
Substituí meu fluxo de trabalho no GPT 4 pelo Kimi K2.5 porque o modo thinking é mais transparente e a context window lida com todo o meu repositório.
Dev_Max
reddit

Videos Sobre Kimi K2.5

Assista tutoriais, analises e discussoes sobre Kimi K2.5

O Kimi K2.5 superando o GPT 5.2 com alto poder de thinking, destruindo absolutamente os outros modelos frontier.

É o modelo de coding open-source mais forte até hoje, com 76.8 no SWE verified.

O Agent swarm é uma mudança do single agent para o multi agent executando fluxos de trabalho paralelos em até 1500 passos coordenados.

A context window é massiva, com 256k tokens, o que é suficiente para a maioria dos projetos.

A Moonshot está realmente ultrapassando os limites do que pesos abertos podem fazer no início de 2026.

Ele realmente acertou toda a estética de design da Apple e produziu um site bonito com animações apenas a partir de um vídeo.

O recurso Swarm parece muito legal e é definitivamente divertido de usar, pois ele atribui crachás de ID a cada sub-agent.

O K2.5 é muito mais barato, a 60 centavos por milhão de tokens de entrada e 3 dólares por milhão de tokens de saída.

O processamento de vídeo nativo significa que você não precisa usar ferramentas externas caras para processar quadros.

Este modelo é um divisor de águas para desenvolvedores que precisam de agentes autônomos com um orçamento limitado.

A Moonshot conseguiu isso dando a cada sub-agent recompensas em estágios críticos separados para evitar o colapso serial.

O modelo aprende a escolher o paralelismo apenas quando isso encurta o caminho crítico, o que é uma inovação muito inteligente.

O Kimi K2.5 está quase no limite para ser executado em hardware de consumo usando GGUF.

O modo thinking é incrivelmente robusto para resolver erros lógicos complexos em Python.

Ver um modelo de 1 trilhão de parameters lançado dessa forma é enorme para a comunidade open-source.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Kimi K2.5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Kimi K2.5 e obter melhores resultados.

Ative o modo Thinking

Passe o parâmetro thinking na sua requisição de API para atingir a precisão máxima em tarefas de matemática e coding.

Acione o Agent Swarm

Instrua o modelo a implementar um swarm para tarefas de pesquisa para forçar a orquestração paralela entre sub-agents.

Otimize a Temperature

Use uma temperature de 1.0 para o modo thinking para permitir um reasoning diversificado, mas reduza para 0.6 para chat padrão.

Prompts de visão combinada

Envie capturas de tela de erros junto com snippets de código para aproveitar o treinamento unificado de texto e visão do modelo.

Context Caching

Utilize context caching para documentos longos repetidos para reduzir os custos de entrada em até 90 por cento.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Kimi K2.5

Encontre respostas para perguntas comuns sobre Kimi K2.5