moonshot

Kimi K2.7 Code

Kimi K2.7 Code er en 1T parameter MoE model fra Moonshot AI. Den har et 262k context window og 30% mere effektiv reasoning til softwareudvikling.

Coding FlagshipOpen WeightsMoE ArchitectureMultimodal AIReasoning Model
moonshot logomoonshotKimi12. juni 2026
Kontekst
262Ktokens
Maks output
262Ktokens
Input-pris
$0.95/ 1M
Output-pris
$4.00/ 1M
Modalitet:TextImageVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
65.8%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Kimi K2.7 Code scorede 65.8% på denne benchmark.
HLE
38.2%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Kimi K2.7 Code scorede 38.2% på denne benchmark.
MMLU
87.2%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Kimi K2.7 Code scorede 87.2% på denne benchmark.
MMLU Pro
71.4%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Kimi K2.7 Code scorede 71.4% på denne benchmark.
SimpleQA
52.4%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Kimi K2.7 Code scorede 52.4% på denne benchmark.
IFEval
88.5%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Kimi K2.7 Code scorede 88.5% på denne benchmark.
AIME 2025
91.5%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Kimi K2.7 Code scorede 91.5% på denne benchmark.
MATH
81.3%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Kimi K2.7 Code scorede 81.3% på denne benchmark.
GSM8k
97.2%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Kimi K2.7 Code scorede 97.2% på denne benchmark.
MGSM
92.4%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Kimi K2.7 Code scorede 92.4% på denne benchmark.
MathVista
65.5%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Kimi K2.7 Code scorede 65.5% på denne benchmark.
SWE-Bench
78.2%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Kimi K2.7 Code scorede 78.2% på denne benchmark.
HumanEval
94.2%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Kimi K2.7 Code scorede 94.2% på denne benchmark.
LiveCodeBench
68.5%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Kimi K2.7 Code scorede 68.5% på denne benchmark.
MMMU
72.4%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Kimi K2.7 Code scorede 72.4% på denne benchmark.
MMMU Pro
48.2%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Kimi K2.7 Code scorede 48.2% på denne benchmark.
ChartQA
84.2%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Kimi K2.7 Code scorede 84.2% på denne benchmark.
DocVQA
90.1%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Kimi K2.7 Code scorede 90.1% på denne benchmark.
Terminal-Bench
67%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Kimi K2.7 Code scorede 67% på denne benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Kimi K2.7 Code scorede 12.5% på denne benchmark.

Om Kimi K2.7 Code

Lær om Kimi K2.7 Codes muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Trillion parameter Mixture of Experts

Kimi K2.7 Code er den seneste iteration af Moonshot AI's trillion parameter Mixture of Experts (MoE) model. Den er optimeret til softwareudvikling og agentic automatisering. Modellen aktiverer 32 milliarder parameters pr. inference trin, hvilket skaber en balance mellem høj intelligens og driftshastighed. Den introducerer en forfinet reasoning-mekanisme, der bruger 30 procent færre tokens til tænkning sammenlignet med tidligere versioner. Teknisk problemløsning er hurtigere og mere omkostningseffektiv for multi-turn samtaler.

Nativ multimodalitet og visuel kontekst

Denne model er nativt multimodal og behandler input fra tekst, billeder og video. Dens 262.144 token context window håndterer store kodebaser og komplekse stack traces. Ved at udgive modellen som open weights tilbyder Moonshot AI et alternativ til proprietære frontier models for udviklere, der bygger autonome AI-agenter. Den opretholder konsistens på tværs af langsigtede kodningsopgaver og oversætter visuelle designs til funktionel kode uden behov for mellemliggende tekstbeskrivelser.

Kimi K2.7 Code

Anvendelser for Kimi K2.7 Code

Opdag de forskellige måder, du kan bruge Kimi K2.7 Code til at opnå gode resultater.

Autonom agentic kodning

Driver multi-step agenter, der navigerer i komplekse filstrukturer og udfører refactoring på tværs af flere filer via terminaladgang.

Oversættelse fra visuelt design til kode

Konverterer komplekse UI-designs eller arkitekturdiagrammer direkte til funktionel frontend- eller systemkode.

Long-horizon debugging

Analyserer hele projekthistorikker og stack traces inden for rammerne af et 262k context window for at identificere arkitektoniske fejl.

Syntese af 3D-scener

Genererer high-fidelity interaktive 3D-miljøer ved hjælp af Three.js eller C++ baseret på beskrivelser i naturligt sprog.

Videobaseret kvalitetssikring

Analyserer optagede skærmsessioner eller videodemoer for at identificere visuelle fejl og inkonsistente UI-overgange.

Modernisering af legacy-kode

Automatisering af migrering af ældre kodebaser til moderne frameworks ved at opretholde en konsistent chain-of-thought.

Styrker

Begrænsninger

Top-tier kodnings-benchmarks: Opnår 78,2 procent på SWE-bench Verified og 94,2 procent på HumanEval, hvilket overgår de fleste open-weight modeller.
Inkonsistent C++ formatering: Kan kræve flere forsøg på at omskrive store C++ filer uden at introducere mindre syntaks- eller formateringsfejl.
Reasoning-effektivitet: Reducerer overhead af thinking-tokens med 30 procent sammenlignet med tidligere generationer, hvilket fremskynder komplekse processer.
Context window sammenlignet med konkurrenter: Selvom 262k er meget, ligger det under de 1 million token context windows, som Google Gemini 2.0 tilbyder.
Nativ video-understøttelse: En af de få modeller, der er i stand til at behandle direkte video-input til UI-test og visuel debugging.
Stabilitet med headless browser: Autonome QA-pipelines, der bruger headless Chrome, kan indimellem fryse under lange verifikationstrin.
Forholdet mellem pris og ydeevne: Leverer ydeevne på GPT-5.5-niveau i kodningsopgaver til en lav pris på $0,95 pr. million input tokens.
Præcision i 3D-fysik: Kan have udfordringer med realistisk tyngdekraft eller kompleks friktion i genererede fysiksimuleringer, hvilket kræver manuel finjustering.

API hurtig start

moonshot/kimi-k2.7-code

Se dokumentation
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Kimi K2.7 Code

Se hvad fællesskabet mener om Kimi K2.7 Code

Kimi 2.7 rangerer som nr. 2 efter Fable 5 og før GPT-5 xhigh... Kimi 2.7 er utrolig god.
Przemek Chojecki
twitter
Kimi K2.7 Code har netop gjort Kimi K2.6 smerteligt forældet... den gav den mest realistiske gengivelse af vandbølger!
GMI Cloud
twitter
Det er #1 open-weight model på SWE-bench (78,2%) og Terminal-Bench 2.1.
Vals AI
twitter
Kimi-K2.7-Code er nu udgivet og open-sourced! Forbedret kodning og agent-ydeevne i forhold til K2.6.
Kimi.ai
twitter
Den håndterede 50 juridiske PDF'er på én gang uden at få sved på panden.
ThePromptEngineer
youtube
Prisen er nede fra $20/måned til $1,5/måned med API'en. Fin UX.
LocalLLaMA-User
reddit

Videoer om Kimi K2.7 Code

Se vejledninger, anmeldelser og diskussioner om Kimi K2.7 Code

Den begyndte at tænke meget mere og meget længere.

2.7 leverede bedre resultater, hurtigere, men en smule dyrere målt på det samlede antal tokens brugt.

Den dykkede dybere ned i tænkningen i længere projektimplementeringer, indtil den faktisk lykkedes.

Den spytter ikke bare kode ud, den planlægger først arkitekturen i sine thinking tokens.

Logikken i Python-scriptet var fejlfri sammenlignet med den tidligere 2.6-version.

Den har forbedret token-effektiviteten i forhold til Kimi K2.6, hvilket reducerer brugen af thinking tokens med cirka 30%.

Reasoning-processen er meget mere direkte, mens modellens høje succesrate bevares.

Forskellen mellem de to er ikke vanvittig, når man tænker på, at denne model er 12,5 gange billigere end Claude Fable.

Denne model er 12,5 gange billigere end Claude Fable til de nuværende API-priser.

Præstationen på SWE-bench Verified er i topklassen for en open-weight udgivelse.

Det 256k context window er utrolig stabilt til generering af projekter med mange filer.

Den håndterede C++ logikken uden behov for dokumentation af eksterne biblioteker.

Reasoning-processen er nu meget mere lineær uden redundante loops.

Den byggede hele projektstrukturen på 15 minutter, inklusive backend-komponenterne.

Det er den bedste open-weight model til kodningsopgaver, der er tilgængelig på markedet lige nu.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til Kimi K2.7 Code

Eksperttips til at hjælpe dig med at få mest muligt ud af Kimi K2.7 Code og opnå bedre resultater.

Bevar Thinking Mode

Aktiver altid preserve_thinking i dine API-kald for at sikre, at modellen bruger sin optimerede reasoning chain til logik.

Multimodal Prompting

Vedlæg screenshots af aktuelle fejl eller UI-mockups sammen med tekstinstruktioner for at forbedre succesraten for kodegenerering.

Administrer context budget

Placer præstationskritiske instruktioner i starten eller slutningen af dit prompt for at opnå den mest pålidelige udførelse af instruktioner.

CLI Integration

Brug den officielle Kimi Code CLI til lokal udvikling for at udnytte modellens native evne til at interagere med lokale miljøer.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Ofte stillede spørgsmål om Kimi K2.7 Code

Find svar på almindelige spørgsmål om Kimi K2.7 Code