Kimi K2.5

Ontdek Moonshot AI's Kimi K2.5, een open-source agentic model met 1T parameters, native multimodal-mogelijkheden, een context window van 262K en SOTA reasoning.

Agentic AIMultimodalOpen-sourceReasoningMoE
moonshot logomoonshotKimi K-series27 januari 2026
Context
262Ktokens
Max output
33Ktokens
Invoerprijs
$0.60/ 1M
Uitvoerprijs
$2.50/ 1M
Modaliteit:TextImageVideo
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
87.6%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Kimi K2.5 scoorde 87.6% op deze benchmark.
HLE
50.2%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Kimi K2.5 scoorde 50.2% op deze benchmark.
MMLU
92%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Kimi K2.5 scoorde 92% op deze benchmark.
MMLU Pro
87.1%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Kimi K2.5 scoorde 87.1% op deze benchmark.
SimpleQA
54%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Kimi K2.5 scoorde 54% op deze benchmark.
IFEval
94%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Kimi K2.5 scoorde 94% op deze benchmark.
AIME 2025
96.1%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Kimi K2.5 scoorde 96.1% op deze benchmark.
MATH
98%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Kimi K2.5 scoorde 98% op deze benchmark.
GSM8k
99%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Kimi K2.5 scoorde 99% op deze benchmark.
MGSM
96%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Kimi K2.5 scoorde 96% op deze benchmark.
MathVista
84.2%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Kimi K2.5 scoorde 84.2% op deze benchmark.
SWE-Bench
76.8%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Kimi K2.5 scoorde 76.8% op deze benchmark.
HumanEval
99%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Kimi K2.5 scoorde 99% op deze benchmark.
LiveCodeBench
85%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Kimi K2.5 scoorde 85% op deze benchmark.
MMMU
84%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Kimi K2.5 scoorde 84% op deze benchmark.
MMMU Pro
78.5%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Kimi K2.5 scoorde 78.5% op deze benchmark.
ChartQA
77.5%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Kimi K2.5 scoorde 77.5% op deze benchmark.
DocVQA
88.8%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Kimi K2.5 scoorde 88.8% op deze benchmark.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Kimi K2.5 scoorde 50.8% op deze benchmark.
ARC-AGI
12%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Kimi K2.5 scoorde 12% op deze benchmark.

Over Kimi K2.5

Leer over de mogelijkheden van Kimi K2.5, functies en hoe het je kan helpen betere resultaten te behalen.

Een nieuwe grens in agentic intelligence

Kimi K2.5 is een flagship open-source agentic model van Moonshot AI, dat een grote sprong voorwaarts betekent in unified multimodal intelligentie. Gebouwd op een massale Mixture-of-Experts (MoE) architectuur met 1 biljoen parameters (waarvan 32 miljard actieve parameters), integreert het native tekst-, beeld- en videoverwerking in één enkel reasoning-framework. In tegenstelling tot traditionele LLMs is K2.5 specifiek ontworpen voor autonome uitvoering, met een unieke 'Thinking'-modus die het in staat stelt zichzelf te corrigeren en complexe, meerstaps problemen op te lossen zonder menselijke tussenkomst.

Architecturale doorbraken

Het model introduceert een revolutionaire functie genaamd 'Agent Swarm', waarmee het systeem dynamisch tot 100 parallelle sub-agents kan coördineren om enorme onderzoeks- of engineeringstaken op te lossen. Door topprestaties te leveren op benchmarks zoals SWE-Bench en AIME 2025, overbrugt Kimi K2.5 effectief de kloof tussen open-source modellen en proprietary frontier AI, en biedt het elite mogelijkheden tegen een fractie van de operationele kosten. De integratie van de MoonViT-3D encoder zorgt voor ongekend video-begrip, waarbij meerdere uren aan inhoud worden begrepen met hoge temporele nauwkeurigheid.

Ongeëvenaarde efficiëntie

Naast pure rekenkracht richt K2.5 zich op duurzame token-economie. Door gebruik te maken van agressieve context caching en een sterk geoptimaliseerde MoE-structuur, levert het prestaties die wedijveren met de duurste proprietary modellen, terwijl een zeer competitieve prijs van $0,60 per miljoen input tokens wordt gehandhaafd. Dit maakt het een ideale basis voor ondernemingen die complexe autonome agents met een lang context window op grote schaal willen inzetten.

Kimi K2.5

Gebruikscases voor Kimi K2.5

Ontdek de verschillende manieren waarop je Kimi K2.5 kunt gebruiken voor geweldige resultaten.

Autonome software-engineering

Het oplossen van complexe GitHub-issues en het klonen van full-stack websites op basis van visuele UI-schetsen.

Wiskunde op Olympiade-niveau

Het aanpakken van geavanceerde wiskundige bewijzen en problemen op wedstrijdniveau met meer dan 96% nauwkeurigheid op AIME 2025.

Reasoning over long-form video

Het analyseren en samenvatten van inhoud van video's tot twee uur lang zonder verlies van context of temporele degradatie.

Dynamische research-agents

Gebruik maken van 'Agent Swarm' om multi-threaded webresearch uit te voeren en gegevens uit honderden bronnen parallel te synthetiseren.

Esthetische frontend-generatie

Het omzetten van handgetekende UI-wireframes of screenshots naar gepolijste, functionele React-code met expressieve animaties.

Autonome terminal-controle

Het uitvoeren van complexe bash-commando's en operaties op systeemniveau om serverclusters en ontwikkelomgevingen te beheren.

Sterke punten

Beperkingen

Elite wiskundige reasoning: Met een score van 96,1% op AIME 2025 presteert het beter dan bijna alle closed-source modellen in pure logische deductie.
Hardware-intensief: Voor het lokaal draaien van het volledige 1T-model is een enterprise-grade AI-cluster met meerdere H100 of B200 GPU's vereist.
Massale parallellisatie: De 'Agent Swarm'-functionaliteit maakt 100+ sub-agents mogelijk, wat de voltooiingstijd voor onderzoekstaken drastisch verkort.
Thinking-latentie: Het activeren van de deep reasoning-modus verhoogt de time-to-first-token aanzienlijk vergeleken met standaardverwerking.
Unified multimodal architectuur: Verwerkt video's van 2 uur en afbeeldingen in hoge resolutie native zonder dat er aparte vision-encoders nodig zijn.
Kloof in kennis op PhD-niveau: De score van 50,2% op 'Humanity's Last Exam' laat zien dat er ruimte is voor verbetering in hoogwaardige wetenschappelijke expertise.
Agressieve token-economie: Met $0,60/1M input tokens is het ongeveer 8-10x goedkoper dan vergelijkbare frontier modellen zoals Claude 4.5.
Regelgeving: Omdat het een Chinees model is, kunnen API-gebruik en datasoevereiniteit onderworpen zijn aan andere regelgevingskaders voor westerse ondernemingen.

API snelstart

fireworks/kimi-k2p5

Bekijk documentatie
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Kimi K2.5

Bekijk wat de community denkt over Kimi K2.5

"De reasoning-capaciteiten op AIME 2025 zijn absoluut bizar voor een open model."
LogicLover
reddit
"Kimi K2.5 heeft zojuist de nieuwe standaard gezet voor het begrijpen van lange video's. Eindelijk een model dat het begin van de clip niet vergeet."
AI_Pioneer
x
"K2.5 gebruiken als coding agent is een gamechanger. De SWE-Bench score is niet zomaar een getal, je voelt de bekwaamheid echt."
DevGuru
hackernews
"China heeft net Kimi K2.5 uitgebracht en zoals verwacht zijn de prestaties gelijkwaardig aan Amerikaanse frontier AI modellen."
BasedTorba
x
"Kimi uit China heeft zojuist de droom van OpenAI over een business van een biljoen dollar vernietigd... 8x goedkoper."
nrqa__
x
"Kimi K2.5 is het eerste model dat echt aanvoelt als een co-pilot in plaats van alleen een chatbox."
CodeWizard
reddit

Video's over Kimi K2.5

Bekijk tutorials, reviews en discussies over Kimi K2.5

Bij het testen van de AIME-problemen had Kimi K2.5 bijna alles goed, zelfs de vragen waar GPT-4o moeite mee had.

Voor codeertaken zijn de agentic mogelijkheden duidelijk het punt waarop dit model uitblinkt vergeleken met standaard LLMs.

Het open-source karakter van een model met een biljoen parameters als dit is ongekend in de huidige markt.

Je ziet hier logische verwerking die in mijn eerste wiskundetests kon wedijveren met o1.

De token-prijzen zijn zo laag dat het argument om closed-source modellen te gebruiken voor basistaken effectief vervalt.

De mogelijkheid om video's van twee uur in één keer te verwerken zonder context te verliezen is een enorme doorbraak.

Het is niet alleen een chatmodel; het is vanaf de basis ontworpen om tools en terminals te gebruiken.

Wanneer je de Swarm-modus activeert, is de parallellisatie voor webresearch in principe ongeëvenaard.

Hiermee laat Moonshot AI de wereld weten dat ze over de rekenkracht en het talent beschikken.

Het zien navigeren in een live terminal om een bug te fixen, is de toekomst van autonome engineering.

De sprong van Kimi K2.5 in de BrowseComp benchmark suggereert dat het over het web kan navigeren met een niveau van volharding dat we nog niet eerder hebben gezien.

Het feit dat het vision- en thinking-modi verenigt in één architectuur is het echte architecturale verhaal hier.

Prestaties op MMLU en GSM8k bewijzen dat de datakwaliteit die voor de training is gebruikt van topniveau was.

In tegenstelling tot eerdere versies heeft het video-begrip hier geen last van temporele degradatie.

Als je een developer bent, maakt de OpenAI-compatibiliteit het overstappen naar dit model voor testen bijna moeiteloos.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows
Bekijk demo

Pro-tips voor Kimi K2.5

Experttips om je te helpen het maximale uit Kimi K2.5 te halen en betere resultaten te behalen.

Maak gebruik van de Thinking-modus

Geef het model expliciet de prompt 'Think step-by-step' om de reasoning-modus te activeren voor logisch zware wiskunde- of codeertaken.

Video-context voordeel

Gebruik de MoonViT-3D encoder van het model om extreem lange video's te verwerken; het is uitstekend in het vinden van specifieke details in clips van 2 uur.

Agent-orkestratie

Gebruik voor grote projecten de swarm-mogelijkheid om K2.5 taken te laten opsplitsen in subtaken voor een snellere uitvoering.

Bespaar op kosten met cache hits

Structureer je API-calls om te profiteren van de agressieve context caching van Moonshot om de inputkosten tot wel 75% te verlagen.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Veelgestelde vragen over Kimi K2.5

Vind antwoorden op veelvoorkomende vragen over Kimi K2.5