moonshot

Kimi k2.6

Kimi k2.6 är Moonshot AI:s MoE-modell med 1T parametrar, 256K context window, inbyggd video-input och elitprestanda inom autonom agent-baserad kodning.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20 april 2026
Kontext
256Ktokens
Max utdata
33Ktokens
Inmatningspris
$0.95/ 1M
Utdatapris
$4.00/ 1M
Modalitet:TextImageVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
90.5%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Kimi k2.6 fick 90.5% pa detta benchmark.
HLE
54%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Kimi k2.6 fick 54% pa detta benchmark.
MMLU
86.4%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Kimi k2.6 fick 86.4% pa detta benchmark.
MMLU Pro
84.6%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Kimi k2.6 fick 84.6% pa detta benchmark.
SimpleQA
43%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Kimi k2.6 fick 43% pa detta benchmark.
IFEval
89.8%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Kimi k2.6 fick 89.8% pa detta benchmark.
AIME 2025
97.3%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Kimi k2.6 fick 97.3% pa detta benchmark.
MATH
98.2%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Kimi k2.6 fick 98.2% pa detta benchmark.
GSM8k
97.3%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Kimi k2.6 fick 97.3% pa detta benchmark.
MGSM
91.5%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Kimi k2.6 fick 91.5% pa detta benchmark.
MathVista
67.1%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Kimi k2.6 fick 67.1% pa detta benchmark.
SWE-Bench
80.2%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Kimi k2.6 fick 80.2% pa detta benchmark.
HumanEval
92%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Kimi k2.6 fick 92% pa detta benchmark.
LiveCodeBench
83.1%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Kimi k2.6 fick 83.1% pa detta benchmark.
MMMU
77.3%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Kimi k2.6 fick 77.3% pa detta benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Kimi k2.6 fick 75.6% pa detta benchmark.
ChartQA
87.4%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Kimi k2.6 fick 87.4% pa detta benchmark.
DocVQA
94.9%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Kimi k2.6 fick 94.9% pa detta benchmark.
Terminal-Bench
60.2%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Kimi k2.6 fick 60.2% pa detta benchmark.
ARC-AGI
68.8%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Kimi k2.6 fick 68.8% pa detta benchmark.

Om Kimi k2.6

Lar dig om Kimi k2.6s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Arkitektur och skalbarhet

Kimi k2.6 är en multimodal Mixture-of-Experts (MoE) frontier-modell med en skala på en biljon parametrar. Den använder 32 miljarder aktiva parametrar per token, vilket balanserar beräkningseffektivitet med kognitiv prestanda på hög nivå. Arkitekturen stödjer internt chain-of-thought-resonemang, där modellen genererar dolda resonemangssteg innan den levererar ett slutgiltigt svar. Denna design gör det möjligt att hantera komplexa problem i flera steg som vanligtvis stoppar standard-LLM:er.

Agent-intelligens och koordinering

Modellen är specifikt optimerad för autonom mjukvaruutveckling och långsiktiga uppgifter. Den kan hantera Agent Swarms med upp till 300 parallella sub-agenter som koordinerar för att refaktorera stora kodbaser eller hantera komplexa DevOps-pipelines. Genom inbyggda verktygsanrop och visuell förståelse fungerar Kimi k2.6 som en autonom agent som kan lösa GitHub-ärenden med flera filer och skapa rörelseintensiva webbgränssnitt baserat på visuella referenser.

Multimodala förmågor

Inbyggt stöd för video- och bild-input särskiljer Kimi k2.6 från många open-weights-konkurrenter. Den bearbetar videofiler direkt för att utföra scenanalys, buggåterskapande och extrahera strukturerad data. Modellen fungerar som en visuell arkitekt som genererar 3D-shaders och komplexa animationer med hjälp av bibliotek som Three.js och GSAP, baserat på visuella beskrivningar eller uppladdade mockuper.

Kimi k2.6

Anvandningsfall for Kimi k2.6

Upptack de olika satten du kan anvanda Kimi k2.6 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Löser komplexa GitHub-ärenden genom att koordinera upp till 300 parallella sub-agenter under 12-timmars sessioner.

Generering av avancerade frontend-rörelser

Skapar moderna webbgränssnitt med WebGL och GSAP-shaders baserat på enkla text- eller bild-prompts.

Djupgående videoanalys

Analyserar inspelningar för att återskapa visuella buggar, beskriva scener eller extrahera strukturerad data.

Agent-baserad marknadsundersökning

Utför webbsökningar i flera steg och anropar verktyg för att syntetisera konkurrensanalyser från hundratals källor.

Optimering av äldre kodbaser

Identifierar prestandaflaskhalsar i äldre kod genom att analysera CPU-flamegrafer och allokeringsdata.

Vetenskaplig problemlösning

Besvarar naturvetenskapliga och matematiska frågor på universitetsnivå med hjälp av Python-assisterat resonemang och verifiering via verktyg.

Styrkor

Begransningar

Överlägsen agent-baserad kodning: Uppnår 80,2 % poäng på SWE-Bench Verified, vilket placerar den bland de mest kapabla modellerna för autonom ingenjörskonst.
Höga krav på lokal VRAM: Att köra den fullständiga modellen lokalt kräver 600 GB VRAM, vilket begränsar self-hosting till specialiserade arbetsstationer.
Massiv koordineringsskala: Hanterar 300 parallella sub-agenter, vilket gör det möjligt att utföra omfattande refaktoriseringar på företagsnivå i ett svep.
Regional API-latency: Infrastrukturen är optimerad för Asien, vilket kan leda till högre svarstider för användare i västerländska regioner.
Inbyggd multimodal mångsidighet: Stödjer inbyggd video- och bild-input, vilket möjliggör avancerade visual-language-agent-arbetsflöden för UI/UX-uppgifter.
Brister i minnesåterkallning i lång kontext: Modellen kan ha svårt med perfekt återkallning vid de extrema gränserna av dess 256 000-tokens buffert.
Aggressiv prisfördel: Med 0,95 USD per miljon input tokens är den betydligt billigare än proprietära konkurrenter som Claude 3.7 eller GPT-4o.
Begränsad kommersiell licens: Open-weights-versionen använder en modifierad licens som kräver specifik efterlevnad för storskaliga företagsdistributioner.

API snabbstart

moonshotai/kimi-k2.6

Visa dokumentation
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "Du är en expert på kodning." },
      { role: "user", content: "Optimera denna Rust-funktion för throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Kimi k2.6

Se vad communityt tycker om Kimi k2.6

Möt Kimi K2.6: Utvecklar open-source kodning. En prompt, 100+ filer. 4 000+ verktygsanrop under 12 timmars kontinuerlig körning.
@Kimi_Moonshot
twitter
Kimi 2.6 SLÅR Opus 4.7 och är DEN BÄSTA open-source-modellen i världen. Det är en riktigt bra modell till 10x lägre kostnad.
@bindureddy
twitter
Prisskillnaden är den del ingen räknar med. Kimi K2.6 är 5x billigare än Sonnet 4.6. Benchmark-gapet har officiellt vänts.
@aakashgupta
twitter
Jag testade den mot en bugg jag hade. Den löste den framgångsrikt för lite drygt 1 USD. Det var en svår bugg som Sonnet kämpade med.
@uworldhits1391
youtube
Kimi K2.6 är transformativ, även om den har utrymme för förbättringar gällande minnesåterkallning i extremt långa uppgifter. Men 300 parallella agenter är galet.
@Radiant-Act4707
reddit
Kimi K2-serien markerar ögonblicket då open-source frontier-labb äntligen utmanar och överträffar slutna giganter.
@zxytim
twitter

Videor om Kimi k2.6

Se handledningar, recensioner och diskussioner om Kimi k2.6

Kimi K2.6 kommer inte att utplåna Claude, men den KOMMER att utplåna premiumprissättningen från slutna labb.

Förmågan med agentsvärmar, 300 agenter parallellt, är något vi inte sett i open source tidigare.

HLE-poängen på 54,0 är den högsta vi sett för en open-weights-modell.

En prompt kan leda till 12 timmars kontinuerlig körning, vilket är en ny gräns för agenter.

Den hanterar verktygsanrop i flera steg med en stabilitet som matchar de bästa proprietära modellerna.

Vision-modellen stödjer inbyggd video-input, vilket är en sällsynt funktion även 2026.

Den hanterar verktygsanrop i flera steg med ett stabilt thinking mode som konkurrerar med OpenAIs o-serie.

För frontend-utveckling är de rörelseintensiva genereringarna betydligt bättre än i K2.5.

Context window på 256K gör att hela dokumentationsset kan tolkas på en gång.

Det är en av de första modellerna som uppvisar sann autonomi i terminalmiljöer.

Att para ihop K2.6 med Kimi Code CLI möjliggör autonoma kodningssessioner på 12+ timmar.

Den refaktorerade en 8 år gammal finansiell motor och fick 185 % högre throughput autonomt.

Detta är en modell med en biljon parametrar, men aktiva parametrar är bara 32B, vilket håller den snabb.

Kostnadsbesparingarna för utvecklare som går från Claude till Kimi är astronomiska.

Den löste en bugg i ett komplext Rust-bibliotek som varit öppen i tre månader.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Kimi k2.6

Experttips for att hjalpa dig fa ut det mesta av Kimi k2.6 och uppna battre resultat.

Aktivera Tool Use för Reasoning

Benchmark-resultat visar att HLE-poängen hoppar från 23,9 till 54,0 när modellen får tillgång till externa sök- och beräkningsverktyg.

Övervaka context-buffertens gränser

Minnesåterkallningen är mest exakt inom de första 200 000 tokens i bufferten på 256 000 tokens.

Använd Thinking mode sparsamt

Inaktivera thinking-parametern för enkla chattuppgifter för att minska latency och den totala token-förbrukningen.

Standardisera med XML-taggar

Modellen följer instruktioner mer exakt när kontext och uppgifter är inneslutna i XML-taggar.

Utnyttja inbyggd videouppladdning

Använd metoder för filuppladdning istället för base64-kodning för videor över 100 MB för att undvika begränsningar i förfrågningsstorlek.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Vanliga fragor om Kimi k2.6

Hitta svar pa vanliga fragor om Kimi k2.6