moonshot

Kimi k2.6

Kimi k2.6 is het 1T-parameter MoE model van Moonshot AI met een 256K context window, native video-input en elite prestaties in autonoom agentic programmeren.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20 april 2026
Context
256Ktokens
Max output
33Ktokens
Invoerprijs
$0.95/ 1M
Uitvoerprijs
$4.00/ 1M
Modaliteit:TextImageVideo
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
90.5%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Kimi k2.6 scoorde 90.5% op deze benchmark.
HLE
54%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Kimi k2.6 scoorde 54% op deze benchmark.
MMLU
86.4%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Kimi k2.6 scoorde 86.4% op deze benchmark.
MMLU Pro
84.6%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Kimi k2.6 scoorde 84.6% op deze benchmark.
SimpleQA
43%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Kimi k2.6 scoorde 43% op deze benchmark.
IFEval
89.8%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Kimi k2.6 scoorde 89.8% op deze benchmark.
AIME 2025
97.3%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Kimi k2.6 scoorde 97.3% op deze benchmark.
MATH
98.2%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Kimi k2.6 scoorde 98.2% op deze benchmark.
GSM8k
97.3%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Kimi k2.6 scoorde 97.3% op deze benchmark.
MGSM
91.5%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Kimi k2.6 scoorde 91.5% op deze benchmark.
MathVista
67.1%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Kimi k2.6 scoorde 67.1% op deze benchmark.
SWE-Bench
80.2%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Kimi k2.6 scoorde 80.2% op deze benchmark.
HumanEval
92%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Kimi k2.6 scoorde 92% op deze benchmark.
LiveCodeBench
83.1%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Kimi k2.6 scoorde 83.1% op deze benchmark.
MMMU
77.3%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Kimi k2.6 scoorde 77.3% op deze benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Kimi k2.6 scoorde 75.6% op deze benchmark.
ChartQA
87.4%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Kimi k2.6 scoorde 87.4% op deze benchmark.
DocVQA
94.9%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Kimi k2.6 scoorde 94.9% op deze benchmark.
Terminal-Bench
60.2%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Kimi k2.6 scoorde 60.2% op deze benchmark.
ARC-AGI
68.8%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Kimi k2.6 scoorde 68.8% op deze benchmark.

Over Kimi k2.6

Leer over de mogelijkheden van Kimi k2.6, functies en hoe het je kan helpen betere resultaten te behalen.

Architectonisch ontwerp en schaal

Kimi k2.6 is een frontier multimodal Mixture-of-Experts (MoE) model met een schaal van een biljoen parameters. Het gebruikt 32 miljard actieve parameters per token, wat rekenefficiëntie in evenwicht brengt met cognitieve prestaties op hoog niveau. De architectuur ondersteunt interne chain-of-thought reasoning, waarbij het model verborgen redeneerstappen genereert voordat het een definitief antwoord geeft. Dit ontwerp stelt het in staat om complexe, meerstaps-problemen aan te pakken die standaard LLM's meestal vertragen.

Agentic intelligentie en coördinatie

Het model is specifiek geoptimaliseerd voor autonome software engineering en taken met een lange horizon. Het kan Agent Swarms van maximaal 300 parallelle sub-agents beheren, die samenwerken om grote codebases te refactoren of complexe DevOps-pipelines te beheren. Door gebruik te maken van native tool-aanroepen en visueel begrip, fungeert Kimi k2.6 als een autonome agent die in staat is om GitHub-issues met meerdere bestanden op te lossen en motion-rich webinterfaces te creëren op basis van visuele referenties.

Multimodale mogelijkheden

Native ondersteuning voor video- en afbeeldings-input onderscheidt Kimi k2.6 van veel open-weights concurrenten. Het verwerkt videobestanden direct om scène-analyse, bug-reproductie en gestructureerde data-extractie uit te voeren. Het model fungeert als een visuele architect die 3D-shaders en complexe animaties genereert met behulp van bibliotheken zoals Three.js en GSAP op basis van visuele beschrijvingen of geüploade mockups.

Kimi k2.6

Gebruikscases voor Kimi k2.6

Ontdek de verschillende manieren waarop je Kimi k2.6 kunt gebruiken voor geweldige resultaten.

Autonome software engineering

Het oplossen van complexe GitHub-issues door tot 300 parallelle sub-agents te coördineren over sessies van 12 uur.

Genereren van motion-rich frontend

Het creëren van moderne webinterfaces met WebGL- en GSAP-shaders op basis van korte tekst- of afbeeldings-prompts.

Diepgaande videoanalyse

Het analyseren van opnames om visuele bugs te reproduceren, scènes te beschrijven of gestructureerde data te extraheren.

Agentic marktonderzoek

Het uitvoeren van meerstaps-webzoekopdrachten en tool-aanroepen om concurrentieanalyses samen te stellen op basis van honderden bronnen.

Optimalisatie van legacy code

Het identificeren van performance-knelpunten in oudere codebases door CPU-flamegraphs en allocatiedata te analyseren.

Wetenschappelijke probleemoplossing

Het beantwoorden van wetenschappelijke en wiskundige vragen op universitair niveau met behulp van Python-ondersteunde reasoning en tool-verificatie.

Sterke punten

Beperkingen

Superieure agentic coding: Behaalt een score van 80,2% op SWE-Bench Verified, wat het tot een van de meest capabele modellen voor autonoom programmeren maakt.
Hoge lokale VRAM-vereisten: Het lokaal draaien van het volledige model vereist 600GB VRAM, wat self-hosting beperkt tot gespecialiseerde high-end werkstations.
Enorme coördinatieschaal: Beheert 300 parallelle sub-agents, waardoor het in één keer refactoring-taken op ondernemingsniveau kan afhandelen.
Regionale API-latency: De infrastructuur is geoptimaliseerd voor Azië, wat kan leiden tot hogere responstijden voor gebruikers in westerse regio's.
Native multimodale veelzijdigheid: Ondersteunt native video- en afbeeldings-input, wat geavanceerde visual-language agent-workflows voor UI/UX-taken mogelijk maakt.
Recall-gaten bij lange context: Het model kan moeite hebben met perfecte recall aan de uiterste randen van zijn buffer van 256.000 tokens.
Agressief prijsvoordeel: Met $0,95 per miljoen input tokens is het aanzienlijk goedkoper dan propriëtaire concurrenten zoals Claude 3.7 of GPT-4o.
Beperkte commerciële licentie: De open-weights release maakt gebruik van een aangepaste licentie die specifieke compliance vereist voor grootschalige bedrijfsimplementaties.

API snelstart

moonshotai/kimi-k2.6

Bekijk documentatie
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Kimi k2.6

Bekijk wat de community denkt over Kimi k2.6

Maak kennis met Kimi K2.6: Vooruitgang in open-source programmeren. Eén prompt, 100+ bestanden. 4000+ tool-aanroepen gedurende 12 uur onafgebroken uitvoering.
@Kimi_Moonshot
twitter
Kimi 2.6 VERSLAAT Opus 4.7 en is het BESTE open-source model ter wereld. Het is een zeer goed model tegen 10x lagere kosten.
@bindureddy
twitter
Het prijsverschil is iets waar niemand rekening mee houdt. Kimi K2.6 is 5x goedkoper dan Sonnet 4.6. Het benchmark-gat is officieel omgedraaid.
@aakashgupta
twitter
Ik heb het getest tegen een bug die ik had. Het loste het succesvol op voor iets meer dan $1. Het was een lastige bug waar Sonnet moeite mee had.
@uworldhits1391
youtube
Kimi K2.6 is transformatief, hoewel er ruimte is voor verbeteringen in recall bij extreem lange taken. Desalniettemin zijn 300 parallelle agents krankzinnig.
@Radiant-Act4707
reddit
De Kimi K2-serie markeert het moment waarop open-source frontier-labs eindelijk de gesloten giganten evenaren en overtreffen.
@zxytim
twitter

Video's over Kimi k2.6

Bekijk tutorials, reviews en discussies over Kimi k2.6

Kimi K2.6 zal Claude niet vernietigen, maar het zal de premium prijzen van gesloten laboratoria WEL vernietigen.

De agent swarm-capaciteit, 300 agents parallel, is iets wat we nog niet eerder in open source hebben gezien.

De HLE-score van 54,0 is de hoogste die we tot nu toe hebben gezien voor een open weights model.

Eén prompt kan leiden tot 12 uur continue uitvoering, wat een nieuwe grens is voor agents.

Het handelt meerstaps tool-aanroepen af met een stabiliteit die overeenkomt met de beste propriëtaire modellen.

Het vision-model ondersteunt native video-input, wat zelfs in 2026 een zeldzame functie is.

Het voert meerstaps tool-aanroepen uit met een stabiele thinking mode die de o-serie van OpenAI evenaart.

Voor frontend-ontwikkeling zijn de motion-rich generaties aanzienlijk beter dan die van K2.5.

De context window van 256K maakt het mogelijk om volledige documentatiesets in één keer te parsen.

Het is een van de eerste modellen die echte autonomie vertoont in terminal-omgevingen.

Door K2.6 te koppelen aan de Kimi Code CLI zijn autonome programmeersessies van 12+ uur mogelijk.

Het heeft een 8 jaar oude financiële engine ge-refactored en autonoom een doorvoerwinst van 185% behaald.

Dit is een model met een biljoen parameters, maar de actieve parameters zijn slechts 32B, waardoor het snel blijft.

De kostenbesparingen voor ontwikkelaars die overstappen van Claude naar Kimi zijn astronomisch.

Het loste een bug op in een complexe Rust-bibliotheek die al drie maanden openstond.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Kimi k2.6

Experttips om je te helpen het maximale uit Kimi k2.6 te halen en betere resultaten te behalen.

Activeer tool use voor reasoning

Benchmarks tonen aan dat de HLE-score stijgt van 23,9 naar 54,0 wanneer het model toegang krijgt tot externe zoek- en rekentools.

Monitor de randen van de context buffer

De recall is het meest nauwkeurig in de eerste 200.000 tokens van de buffer van 256.000 tokens.

Gebruik Thinking mode spaarzaam

Schakel de thinking parameter uit voor eenvoudige chat-taken om de latency en het totale tokenverbruik te verlagen.

Standaardiseer met XML-tags

Het model volgt instructies nauwkeuriger op wanneer context en taken in XML-tags worden geplaatst.

Maak gebruik van native video-uploads

Gebruik methoden voor het uploaden van bestanden in plaats van base64-codering voor video's groter dan 100MB om limieten op de grootte van verzoeken te vermijden.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Veelgestelde vragen over Kimi k2.6

Vind antwoorden op veelvoorkomende vragen over Kimi k2.6