Hvad er context window-størrelsen for Kimi K2 Thinking?

Det understøtter op til 256.000 tokens. Dette muliggør behandling af hele bøger eller store kode-repositories i en enkelt prompt.

Modellen koster $0,60 pr. 1 million input-tokens og $2,50 pr. 1 million output-tokens. Dette er væsentligt billigere end konkurrerende closed-source reasoning-modeller.

Kan jeg køre Kimi K2 Thinking lokalt?

Ja, modellens vægte er tilgængelige på HuggingFace til offentlig download. Du skal bruge omkring 245 GB VRAM for at køre den 1-bit kvantiserede version effektivt.

Hvad er unikt ved dens evner inden for tool use?

Den kan håndtere 200 til 300 tool calls sekventielt i én vending. Dette gør den til en ekspert i autonom browsing og agentic opgaver i flere trin.

Understøtter den multimodale inputs som f.eks. billeder?

Denne specifikke Thinking-variant er kun til tekst. Til vision-opgaver tilbyder Moonshot Kimi-VL-serien, som er optimeret til multimodal forståelse.

Hvordan klarer den sig i forhold til OpenAI o1?

K2 Thinking matcher o1 i reasoning-benchmarks som AIME og MATH. Den overgår specifikt o1 inden for agentic browsing og HLE-benchmarken.

Er streaming understøttet i API'en?

Ja, API'en understøtter token-by-token streaming. Dette er nyttigt til at overvåge modellens reasoning-proces i realtid.

Hvilken arkitektur bruger den?

Den bruger en Mixture-of-Experts-arkitektur med i alt 1 billion parametre. Kun 32 milliarder parametre aktiveres under hvert inference-trin.

Kimi K2 Thinking

Kimi K2 Thinking er Moonshot AI's reasoning-model med 1 billion parametre. Den overgår GPT-5 i HLE og understøtter 300 sekventielle tool calls autonomt til...

moonshotKimi K26. november 2025

Kontekst

256Ktokens

Maks output

16Ktokens

Input-pris

$0.15/ 1M

Output-pris

$0.15/ 1M

Modalitet:Text

Funktioner:VærktøjerStreamingRæsonnering

Benchmarks

GPQA

93%

HLE

44.9%

MMLU

90%

MMLU Pro

78%

SimpleQA

55%

IFEval

92%

AIME 2025

99.1%

MATH

99.1%

GSM8k

99%

MGSM

95%

MathVista

75%

SWE-Bench

71.3%

HumanEval

83%

LiveCodeBench

83.1%

MMMU

80%

MMMU Pro

60%

ChartQA

88%

DocVQA

94%

Terminal-Bench

55%

ARC-AGI

12%

Se API-dokumentation

Om Kimi K2 Thinking

Lær om Kimi K2 Thinkings muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Mixture of Experts med 1 billion parametre

Kimi K2 Thinking er en reasoning-model med 1 billion parametre, der benytter en Mixture-of-Experts (MoE) arkitektur. Den er udviklet af Moonshot AI og udgivet sent i 2025. Den aktiverer kun 32B parametre til inference, hvilket balancerer en massiv videnskapacitet med beregningsmæssig effektivitet. Den er designet specifikt som en tænkende agent, der skalerer sin beregning i løbet af inference-fasen for at løse komplekse logiske problemer. Denne tilgang giver modellen mulighed for at reflektere over sin egen logik og rette fejl, før den giver et endeligt svar.

Agentic tool use og planlægning

Modellen udmærker sig ved sin evne til autonomt at håndtere op til 300 sekventielle tool calls. Mens de fleste standardsprogmodeller kæmper med planlægning over lang tid, er K2 Thinking bygget til agentic-workflows såsom autonom websurfing og softwareudvikling i flere trin. Den understøtter indfødt INT4-præcision via Quantization-Aware Training, hvilket gør det muligt for modellen at opretholde performance på frontier-niveau, mens den kører på standard enterprise hardware-clusters.

Fokus på udvikling og research

Med et context window på 256K tokens er modellen bygget til dyb research og komplekse tekniske opgaver. Den bygger bro over performance-kløften mellem closed-source systemer og open-weights modeller. Dens evne til at besvare videnskabelige spørgsmål på ph.d.-niveau og konkurrence-matematikopgaver gør den til et passende valg til akademisk research, automatiserede koder-assistenter og reasoning-applikationer med høj præcision, hvor logisk konsistens er det primære krav.

Anvendelser for Kimi K2 Thinking

Opdag de forskellige måder, du kan bruge Kimi K2 Thinking til at opnå gode resultater.

Kompleks softwareudvikling

Løsning af reelle GitHub-issues og arkitektur af kodebaser med mange filer ved hjælp af iterativ selvkorrektion.

Autonome research-agenter

Udførelse af hundreder af sekventielle tool calls for at indsamle og syntetisere obskure tekniske data.

Matematik på olympiade-niveau

Løsning af avancerede geometri- og algebrapopgaver med dyb chain-of-thought-verificering.

Videnskabelig undersøgelse på ph.d.-niveau

Besvarelse af ekspertspecifikke spørgsmål inden for fysik og biologi, der kræver logisk deduktion i flere trin.

Interaktiv computerstyring

Navigering i terminalmiljøer og cloud-infrastruktur for at automatisere devops-workflows.

Logik-tung kreativ skrivning

Generering af langt indhold, der kræver streng overholdelse af komplekse regler for world-building.

Styrker

Begrænsninger

State-of-the-art Reasoning: Opnår 44,9 % i HLE med tools, hvilket overgår førende closed-source modeller inden for logik på ekspertniveau.

Massive ressourcekrav: Lokal inference kræver mindst 245 GB VRAM, selv med kvantisering, hvilket begrænser brugen til high-end server-clusters.

Ekstraordinær agentic dybde: I stand til 300 sekventielle tool calls, hvilket muliggør reelt autonom web-research og browser-opgaver.

Inherent responslatency: Den dybe tænkeproces resulterer i betydelige ventetider, efterhånden som modellen skalerer sin test-time compute.

Matematisk nøjagtighed i topklasse: Opnår 94,5 % i AIME 2025, hvilket beviser dens pålidelighed til løsning af avancerede matematiske problemer.

Manglende indbygget multimodalitet: Denne variant kan ikke behandle billed- eller video-inputs direkte, hvilket kræver en separat vision model til multimodale opgaver.

Tilgængelighed med open-weights: Tilbyder intelligens på frontier-niveau til udviklermiljøet til lokal deployment og fine-tuning.

Højt token-overhead: Interne reasoning-trin forbruger et stort antal output-tokens, hvilket øger API-omkostningerne ved simple forespørgsler.

API hurtig start

moonshot/kimi-k2-thinking

Se dokumentation

moonshot SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [{ role: 'user', content: 'Design a system for autonomous code review using 300 tool calls.' }],
  });
  console.log(response.choices[0].message.content);
}

main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Kimi K2 Thinking

Se hvad fællesskabet mener om Kimi K2 Thinking

“Kimi K2.5 er den bedste open model til kodning, de har virkelig gjort et godt stykke arbejde.”

— npc_gooner

“Moonshot AI har lige udgivet Kimi K2 Thinking. 300 sekventielle tool calls? Det er fremtiden for agentic AI.”

— @tech_trends

twitter

“Kimi udgav Kimi K2 Thinking, en open-source reasoning-model på 1 billion parametre. Det her er den ægte vare.”

— nekofneko

“Det faktum, at den kan håndtere 300 tool calls sekventielt, åbner op for helt nye agent-workflows.”

— AI Explained

youtube

“Imponerende at se en open-source model nå disse tal. Tilgangen med test-time scaling giver tydeligvis pote.”

— jsmith23

hackernews

“Det er en udfordring at køre denne model lokalt, men reasoning-dybden er ulig noget andet i open weights-rummet.”

— LocalLlamaEnthusiast

Videoer om Kimi K2 Thinking

Se vejledninger, anmeldelser og diskussioner om Kimi K2 Thinking

“Kimmy K2 thinking er den bedste AI-model, jeg nogensinde har brugt.”

“Det er den mest agentic uafhængige model, der nogensinde er skabt. Det betyder, at den kan køre i timevis af sig selv.”

“Den er i stand til at tænke og reflektere hvert eneste skridt på vejen. Så den farer aldrig vild.”

“Reasoning-hastigheden er overraskende hurtig trods den ene billion parametre.”

“Hvis du bygger agenter, er dette den arkitektur, du bør kigge på.”

“Kimi K2 Thinking... er en tænkningsopgradering til Kimi K2-modellen, som ærligt talt virker til at være meget bredt anerkendt.”

“Dette er naturligvis en open-source model... med en samlet størrelse på omkring 1 billion parametre.”

“Alle benchmark-resultater er rapporteret under int4-præcision.”

“Den håndterer komplekse matematikopgaver med et logikniveau, der udfordrer de førende proprietære laboratorier.”

“Installationsprocessen for de lokale vægte er ret ligetil, hvis du har VRAM'en.”

“Kimi K2.5 er den seneste open-source model udviklet af en kinesisk virksomhed kaldet Moonshot AI.”

“Den er i stand til at starte op til 100 under-agenter og 1.500 tool calls og køre dem samtidigt.”

“Jeg vil bestemt anbefale den, hvis du ønsker at lave en virkelig smuk hjemmeside.”

“Den interne chain-of-thought gør det muligt for den at selvkorrigere kodefejl, før den giver det endelige svar.”

“Moonshot har virkelig fokuseret på langsigtede planlægningshorisonter til denne specifikke udgivelse.”

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter

Webautomatisering

Smarte arbejdsgange

Kom i gang gratis

Pro-tips til Kimi K2 Thinking

Eksperttips til at hjælpe dig med at få mest muligt ud af Kimi K2 Thinking og opnå bedre resultater.

Aktivér Thinking Output

Brug flaget for special tokens i din inference-engine for at se modellens interne reasoning-trin.

Optimér Temperature

Sæt sampling-temperaturen til 1.0 og min_p til 0,01 for at opnå det mest konsistente reasoning-flow.

Udnyt System Prompts

Start samtaler med den officielle Moonshot AI-identitets-prompt for at stabilisere modellens adfærd.

Skalér test-time compute

Giv modellen lov til at generere flere interne tokens ved sværere problemer for at øge nøjagtigheden.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context

$0.75/$4.50/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Ofte stillede spørgsmål om Kimi K2 Thinking

Find svar på almindelige spørgsmål om Kimi K2 Thinking

Kimi K2 Thinking

Om Kimi K2 Thinking

Mixture of Experts med 1 billion parametre

Agentic tool use og planlægning

Fokus på udvikling og research

Anvendelser for Kimi K2 Thinking

Kompleks softwareudvikling

Autonome research-agenter

Matematik på olympiade-niveau

Videnskabelig undersøgelse på ph.d.-niveau

Interaktiv computerstyring

Logik-tung kreativ skrivning

Styrker

Begrænsninger

API hurtig start

Hvad folk siger om Kimi K2 Thinking

Videoer om Kimi K2 Thinking

Supercharg din arbejdsgang med AI-automatisering

Pro-tips til Kimi K2 Thinking

Aktivér Thinking Output

Optimér Temperature

Udnyt System Prompts

Skalér test-time compute

Hvad vores brugere siger

Relateret AI Models

GPT-5.2 Pro

Kimi K3

Qwen 3.7 Max

GPT-5.5

Grok-3

Gemini 3.1 Flash Live Preview

Gemini 3 Pro

Claude Opus 4.7

Ofte stillede spørgsmål om Kimi K2 Thinking

Hvad er context window-størrelsen for Kimi K2 Thinking?

Hvad koster API'en?

Kan jeg køre Kimi K2 Thinking lokalt?

Hvad er unikt ved dens evner inden for tool use?

Understøtter den multimodale inputs som f.eks. billeder?

Hvordan klarer den sig i forhold til OpenAI o1?

Er streaming understøttet i API'en?

Hvilken arkitektur bruger den?