moonshot

Kimi K2.7 Code

Kimi K2.7 Code je 1T parametarski MoE model iz Moonshot AI-a. Sadrži 262k context window i 30% efikasniji reasoning za softversko inženjerstvo.

Coding FlagshipOpen WeightsMoE ArchitectureMultimodal AIReasoning Model
moonshot logomoonshotKimi12. lipnja 2026.
Kontekst
262Ktokena
Maks. izlaz
262Ktokena
Ulazna cijena
$0.95/ 1M
Izlazna cijena
$4.00/ 1M
Modalitet:TextImageVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
65.8%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Kimi K2.7 Code je postigao 65.8% na ovom benchmarku.
HLE
38.2%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Kimi K2.7 Code je postigao 38.2% na ovom benchmarku.
MMLU
87.2%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Kimi K2.7 Code je postigao 87.2% na ovom benchmarku.
MMLU Pro
71.4%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Kimi K2.7 Code je postigao 71.4% na ovom benchmarku.
SimpleQA
52.4%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Kimi K2.7 Code je postigao 52.4% na ovom benchmarku.
IFEval
88.5%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Kimi K2.7 Code je postigao 88.5% na ovom benchmarku.
AIME 2025
91.5%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Kimi K2.7 Code je postigao 91.5% na ovom benchmarku.
MATH
81.3%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Kimi K2.7 Code je postigao 81.3% na ovom benchmarku.
GSM8k
97.2%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Kimi K2.7 Code je postigao 97.2% na ovom benchmarku.
MGSM
92.4%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Kimi K2.7 Code je postigao 92.4% na ovom benchmarku.
MathVista
65.5%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Kimi K2.7 Code je postigao 65.5% na ovom benchmarku.
SWE-Bench
78.2%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Kimi K2.7 Code je postigao 78.2% na ovom benchmarku.
HumanEval
94.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Kimi K2.7 Code je postigao 94.2% na ovom benchmarku.
LiveCodeBench
68.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Kimi K2.7 Code je postigao 68.5% na ovom benchmarku.
MMMU
72.4%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Kimi K2.7 Code je postigao 72.4% na ovom benchmarku.
MMMU Pro
48.2%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Kimi K2.7 Code je postigao 48.2% na ovom benchmarku.
ChartQA
84.2%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Kimi K2.7 Code je postigao 84.2% na ovom benchmarku.
DocVQA
90.1%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Kimi K2.7 Code je postigao 90.1% na ovom benchmarku.
Terminal-Bench
67%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Kimi K2.7 Code je postigao 67% na ovom benchmarku.
ARC-AGI
12.5%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Kimi K2.7 Code je postigao 12.5% na ovom benchmarku.

O modelu Kimi K2.7 Code

Saznajte o mogućnostima, značajkama i načinima korištenja modela Kimi K2.7 Code.

Mixture of Experts s bilijun parametara

Kimi K2.7 Code je najnovija iteracija Moonshot AI-evog Mixture of Experts (MoE) modela s bilijun parametara. Optimiziran je za softversko inženjerstvo i agentic automatizaciju. Model aktivira 32 milijarde parametara po koraku inference-a, što balansira visoku inteligenciju s operativnom brzinom. Uvodi profinjeni mehanizam reasoning-a koji koristi 30 posto manje tokena za razmišljanje u usporedbi s prethodnim verzijama. Tehničko rješavanje problema je brže i isplativije za multi-turn razgovore.

Nativna multimodalnost i vizualni kontekst

Ovaj model je nativno multimodalan i obrađuje tekstualne, slikovne i video unose. Njegov context window od 262.144 tokena obrađuje velike codebase-ove i složene stack trace-ove. Objavljivanjem modela kao open weights, Moonshot AI pruža alternativu vlasničkim frontier modelima za developere koji grade autonomne AI agente. Održava dosljednost kroz koderske zadatke dugog dometa i prevodi vizualne dizajne u funkcionalni kod bez potrebe za posrednim tekstualnim opisima.

Kimi K2.7 Code

Slučajevi korištenja za Kimi K2.7 Code

Otkrijte različite načine korištenja modela Kimi K2.7 Code za postizanje izvrsnih rezultata.

Autonomno agentic kodiranje

Pokretanje agenata s više koraka koji navigiraju složenim strukturama datoteka i izvršavaju refaktoriranje više datoteka putem pristupa terminalu.

Vizualno-u-kod prijevod

Pretvaranje složenih UI dizajna ili arhitektonskih dijagrama izravno u funkcionalni front-end ili sistemski kod.

Debugiranje dugog dometa

Analiza cjelokupne povijesti projekta i stack trace-ova unutar 262k context window-a radi identifikacije arhitektonskih bugova.

Sinteza 3D scene

Generiranje visokovjernih interaktivnih 3D okruženja koristeći Three.js ili C++ iz opisa na prirodnom jeziku.

Video-temeljena kontrola kvalitete

Analiza snimljenih sesija zaslona ili video demoa radi identifikacije vizualnih bugova i nedosljednih UI prijelaza.

Modernizacija naslijeđenih sustava

Automatizacija migracije zastarjelih codebase-ova na moderne frameworke uz održavanje dosljednog chain-of-thought-a.

Prednosti

Ograničenja

Vrhunski coding benchmark-ovi: Postiže 78,2 posto na SWE-bench Verified i 94,2 posto na HumanEval, nadmašujući većinu open-weights modela.
Nedosljedno formatiranje C++ koda: Može zahtijevati više pokušaja za ponovno pisanje velikih C++ datoteka bez unošenja manjih sintaksnih ili formatiranja pogrešaka.
Efikasnost reasoning-a: Smanjuje režijske troškove thinking-tokena za 30 posto u usporedbi s prethodnim generacijama, ubrzavajući složene cikluse.
Context window u odnosu na konkurenciju: Iako je 262k velik, zaostaje za context window-ima od milijun tokena koje nudi Google Gemini 2.0.
Nativna podrška za video: Jedan od rijetkih modela sposobnih za obradu izravnog video unosa za UI testiranje i vizualno debugiranje.
Stabilnost headless preglednika: Autonomni QA cjevovodi koji koriste headless Chrome mogu povremeno zastati tijekom dugih koraka provjere.
Omjer cijene i performansi: Pruža performanse na razini GPT-5.5 u zadacima kodiranja uz nisku cijenu od 0,95 USD po milijunu ulaznih tokena.
Preciznost 3D fizike: Može imati problema s realističnom gravitacijom ili složenim trenjem u generiranim fizikalnim simulacijama, što zahtijeva ručno podešavanje.

API brzi početak

moonshot/kimi-k2.7-code

Pogledaj dokumentaciju
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Kimi K2.7 Code

Pogledajte što zajednica misli o modelu Kimi K2.7 Code

Kimi 2.7 rangiran je na 2. mjestu nakon Fable 5 i prije GPT-5 xhigh... Kimi 2.7 je nevjerojatno dobar.
Przemek Chojecki
twitter
Kimi K2.7 Code je Kimi K2.6 učinio bolno zastarjelim... dao je najrealističniji prikaz valova na vodi!
GMI Cloud
twitter
To je broj 1 open-weight model na SWE-bench (78,2%) i Terminal-Bench 2.1.
Vals AI
twitter
Kimi-K2.7-Code je sada objavljen i open-source! Poboljšane performanse kodiranja i agenata u odnosu na K2.6.
Kimi.ai
twitter
Obradio je 50 pravnih PDF-ova odjednom bez ikakvog napora.
ThePromptEngineer
youtube
Cijena je pala s 20 USD/mjesečno na 1,5 USD/mjesečno uz API. Pristojan UX.
LocalLLaMA-User
reddit

Videozapisi o modelu Kimi K2.7 Code

Gledajte tutorijale, recenzije i diskusije o modelu Kimi K2.7 Code

Počeo je razmišljati puno više i puno duže.

2.7 je pružio bolje rezultate, brže, ali malo skuplje u smislu ukupno korištenih tokena.

Ušao je u dublje razmišljanje o implementaciji dužeg projekta sve dok zapravo nije uspio.

Ne izbacuje samo kod, prvo planira arhitekturu u svojim thinking tokenima.

Logika u Python skripti bila je besprijekorna u usporedbi s prethodnom verzijom 2.6.

Poboljšao je efikasnost tokena u odnosu na Kimi K2.6, smanjujući upotrebu thinking tokena za otprilike 30%.

Proces reasoning-a je puno izravniji uz zadržavanje visoke stope uspješnosti modela.

Razlika između njih nije ogromna kada uzmete u obzir da je ovaj model 12,5 puta jeftiniji od Claude Fable-a.

Ovaj model je 12,5 puta jeftiniji od Claude Fable-a prema trenutnim cijenama API-ja.

Performanse na SWE-bench Verified su vrhunske za open-weight izdanje.

Context window od 256k je nevjerojatno stabilan za generiranje projekata s više datoteka.

Riješio je C++ logiku bez potrebe za dokumentacijom vanjskih biblioteka.

Proces reasoning-a je sada puno linearniji bez redundantnih petlji.

Izgradio je cijelu strukturu projekta u 15 minuta, uključujući backend komponente.

To je najbolji open-weight model za zadatke kodiranja koji je trenutno dostupan na tržištu.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Kimi K2.7 Code

Stručni savjeti za maksimalno iskorištavanje Kimi K2.7 Code.

Očuvanje načina razmišljanja (Preserve Thinking)

Uvijek omogućite preserve_thinking u svojim API pozivima kako biste osigurali da model koristi svoj optimizirani reasoning chain za logiku.

Multimodalni prompting

Priložite snimke zaslona trenutnih bugova ili UI maketa uz tekstualne upute kako biste poboljšali uspješnost generiranja koda.

Upravljanje proračunom context window-a

Postavite kritične upute za performanse na početak ili kraj prompt-a za najpouzdanije praćenje instrukcija.

CLI integracija

Koristite službeni Kimi Code CLI za lokalni razvoj kako biste iskoristili izvornu sposobnost modela za interakciju s lokalnim okruženjima.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Često Postavljana Pitanja o Kimi K2.7 Code

Pronađite odgovore na česta pitanja o Kimi K2.7 Code