moonshot

Kimi k2.6

Kimi k2.6 je Moonshot AI 1T-parameter MoE model koji sadrži 256K context window, izvorni video input i vrhunske performanse u autonomnom agentic kodiranju.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20. travnja 2026.
Kontekst
256Ktokena
Maks. izlaz
33Ktokena
Ulazna cijena
$0.95/ 1M
Izlazna cijena
$4.00/ 1M
Modalitet:TextImageVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
90.5%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Kimi k2.6 je postigao 90.5% na ovom benchmarku.
HLE
54%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Kimi k2.6 je postigao 54% na ovom benchmarku.
MMLU
86.4%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Kimi k2.6 je postigao 86.4% na ovom benchmarku.
MMLU Pro
84.6%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Kimi k2.6 je postigao 84.6% na ovom benchmarku.
SimpleQA
43%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Kimi k2.6 je postigao 43% na ovom benchmarku.
IFEval
89.8%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Kimi k2.6 je postigao 89.8% na ovom benchmarku.
AIME 2025
97.3%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Kimi k2.6 je postigao 97.3% na ovom benchmarku.
MATH
98.2%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Kimi k2.6 je postigao 98.2% na ovom benchmarku.
GSM8k
97.3%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Kimi k2.6 je postigao 97.3% na ovom benchmarku.
MGSM
91.5%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Kimi k2.6 je postigao 91.5% na ovom benchmarku.
MathVista
67.1%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Kimi k2.6 je postigao 67.1% na ovom benchmarku.
SWE-Bench
80.2%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Kimi k2.6 je postigao 80.2% na ovom benchmarku.
HumanEval
92%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Kimi k2.6 je postigao 92% na ovom benchmarku.
LiveCodeBench
83.1%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Kimi k2.6 je postigao 83.1% na ovom benchmarku.
MMMU
77.3%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Kimi k2.6 je postigao 77.3% na ovom benchmarku.
MMMU Pro
75.6%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Kimi k2.6 je postigao 75.6% na ovom benchmarku.
ChartQA
87.4%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Kimi k2.6 je postigao 87.4% na ovom benchmarku.
DocVQA
94.9%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Kimi k2.6 je postigao 94.9% na ovom benchmarku.
Terminal-Bench
60.2%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Kimi k2.6 je postigao 60.2% na ovom benchmarku.
ARC-AGI
68.8%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Kimi k2.6 je postigao 68.8% na ovom benchmarku.

O modelu Kimi k2.6

Saznajte o mogućnostima, značajkama i načinima korištenja modela Kimi k2.6.

Arhitektonski dizajn i razmjer

Kimi k2.6 je frontier multimodalni Mixture-of-Experts (MoE) model koji doseže razmjer od trilijun parametara. Koristi 32 milijarde aktivnih parametara po tokenu, uravnotežujući računalnu učinkovitost s kognitivnim performansama visoke razine. Arhitektura podržava internu chain-of-thought reasoning strukturu, gdje model generira skrivene korake zaključivanja prije davanja konačnog odgovora. Ovaj dizajn mu omogućuje rješavanje složenih zadataka u više koraka koji obično zaustavljaju standardne LLM modele.

Agentic inteligencija i koordinacija

Model je posebno optimiziran za autonomni softverski inženjering i dugoročne zadatke. Može upravljati Agent Swarms strukturama do 300 paralelnih sub-agenata koji se koordiniraju radi refaktoriranja velikih baza koda ili upravljanja složenim DevOps cjevovodima. Koristeći izvorni poziv alata i vizualno razumijevanje, Kimi k2.6 djeluje kao autonomni agent sposoban za rješavanje problema u više datoteka na GitHubu i stvaranje web sučelja bogatih pokretom na temelju vizualnih referenci.

Multimodalne mogućnosti

Izvorna podrška za video i slikovne inpute razlikuje Kimi k2.6 od mnogih open-weight kolega. Izravno obrađuje video datoteke za analizu scena, reprodukciju bugova i strukturirano izvlačenje podataka. Model služi kao vizualni arhitekt, generirajući 3D shadere i složene animacije koristeći biblioteke poput Three.js i GSAP na temelju vizualnih opisa ili prenesenih maketa.

Kimi k2.6

Slučajevi korištenja za Kimi k2.6

Otkrijte različite načine korištenja modela Kimi k2.6 za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Rješavanje složenih GitHub problema koordiniranjem do 300 paralelnih sub-agenata tijekom 12-satnih sesija.

Generiranje sučelja bogatih pokretom

Stvaranje modernih web sučelja s WebGL i GSAP shaderima na temelju jednostavnih tekstualnih ili slikovnih promptova.

Napredna video analiza

Analiza snimaka za vizualnu reprodukciju bugova, opis scena ili strukturirano izvlačenje podataka.

Agentic istraživanje tržišta

Izvršavanje web pretraga u više koraka i pozivanje alata za sintezu izvještaja o analizi konkurencije iz stotina izvora.

Optimizacija naslijeđenog koda

Identificiranje uskih grla u performansama starijih baza koda analizom CPU flame grafova i podataka o alokaciji.

Znanstveno rješavanje problema

Odgovaranje na znanstvena i matematička pitanja na fakultetskoj razini koristeći Pythonom potpomognut reasoning i provjeru alata.

Prednosti

Ograničenja

Vrhunsko agentic kodiranje: Postiže rezultat od 80,2% na SWE-Bench Verified, što ga svrstava među najsposobnije modele za autonomni inženjering.
Visoki zahtjevi za lokalnim VRAM-om: Pokretanje punog modela lokalno zahtijeva 600 GB VRAM-a, što ograničava self-hosting na specijalizirane radne stanice visoke klase.
Masivna koordinacija: Upravlja s 300 paralelnih sub-agenata, što mu omogućuje rješavanje refaktorskih zadataka na razini poduzeća u jednom prolazu.
Regionalni API latency: Infrastruktura je optimizirana za Aziju, što može dovesti do većeg vremena odziva za korisnike u zapadnim regijama.
Izvorna multimodalna svestranost: Podržava izvorni video i slikovni input, omogućujući napredne vizualno-jezične agent radne procese za UI/UX zadatke.
Praznine u prisjećanju kod dugog konteksta: Model se može boriti s potpunim prisjećanjem na samim rubovima svog buffera od 256 000 tokena.
Agresivna cjenovna prednost: S 0,95 $ po milijun input tokena, značajno je jeftiniji od vlasničkih konkurenata poput Claude 3.7 ili GPT-4o.
Ograničena komercijalna licenca: Izdanje s otvorenim težinama koristi modificiranu licencu koja zahtijeva posebnu usklađenost za implementaciju u velikim poduzećima.

API brzi početak

moonshotai/kimi-k2.6

Pogledaj dokumentaciju
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Kimi k2.6

Pogledajte što zajednica misli o modelu Kimi k2.6

Upoznajte Kimi K2.6: Napredak u open-source kodiranju. Jedan prompt, 100+ datoteka. 4000+ poziva alata tijekom 12 sati kontinuiranog izvršavanja.
@Kimi_Moonshot
twitter
Kimi 2.6 POBJEĐUJE Opus 4.7 i NAJBOLJI je open-source model na svijetu. Jako dobar model za 10x manju cijenu.
@bindureddy
twitter
Delta cijene je dio koji nitko ne uračunava. Kimi K2.6 je 5x jeftiniji od Sonnet 4.6. Benchmark jaz je službeno preokrenut.
@aakashgupta
twitter
Isprobao sam ga na bugu koji sam imao. Riješio ga je uspješno za malo više od 1 $. Bio je to težak bug s kojim se Sonnet mučio.
@uworldhits1391
youtube
Kimi K2.6 je transformativan, iako ima prostora za poboljšanje prisjećanja kod ultra-dugih zadataka. Ipak, 300 paralelnih agenata je ludo.
@Radiant-Act4707
reddit
Serija Kimi K2 označava trenutak kada open-source laboratoriji konačno pariraju i nadmašuju zatvorene gigante.
@zxytim
twitter

Videozapisi o modelu Kimi k2.6

Gledajte tutorijale, recenzije i diskusije o modelu Kimi k2.6

Kimi K2.6 neće uništiti Claude, ali HOĆE uništiti premium cijene zatvorenih laboratorija.

Sposobnost agent swarm-a, 300 agenata paralelno, nešto je što još nismo vidjeli u open sourceu.

HLE rezultat od 54,0 je najviši koji smo vidjeli za model otvorenih težina.

Jedan prompt može dovesti do 12 sati kontinuiranog izvršavanja, što je nova granica za agente.

Rukuje višestupanjskim pozivanjem alata sa stabilnošću koja parira najboljim vlasničkim modelima.

Vision model podržava izvorni video input, što je rijetka značajka čak i 2026. godine.

Rukuje višestupanjskim pozivanjem alata sa stabilnim thinking mode-om koji parira OpenAI-ovoj o-seriji.

Za frontend razvoj, generacije bogate pokretom su znatno bolje od K2.5.

Context window od 256K omogućuje raščlanjivanje cijelih setova dokumentacije odjednom.

To je jedan od prvih modela koji pokazuje pravu autonomiju u terminalnim okruženjima.

Uparivanje K2.6 s Kimi Code CLI-jem omogućuje 12+ sati autonomnih sesija kodiranja.

Autonomno je refaktorirao 8 godina star financijski engine i ostvario 185% dobitka u throughput-u.

Ovo je model s trilijun parametara, ali aktivnih parametara ima samo 32B, što ga čini brzim.

Uštede za developere koji prelaze s Claudea na Kimi su astronomske.

Riješio je bug u složenoj Rust biblioteci koji je bio otvoren tri mjeseca.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Kimi k2.6

Stručni savjeti za maksimalno iskorištavanje Kimi k2.6.

Omogućite korištenje alata za Reasoning

Benchmarkovi pokazuju da HLE rezultat skače s 23,9 na 54,0 kada modelu omogućite pristup vanjskom pretraživanju i računskim alatima.

Pratite rubove kontekstualnog međuspremnika

Prisjećanje (recall) je najpreciznije unutar prvih 200 000 tokena od 256 000 tokena koliko iznosi cijeli buffer.

Štedljivo koristite Thinking Mode

Onemogućite thinking parametar za jednostavne chat zadatke kako biste smanjili latency i ukupnu potrošnju tokena.

Standardizirajte pomoću XML tagova

Model preciznije prati upute kada su kontekst i zadaci omotani u XML tagove.

Iskoristite izvorni video upload

Koristite metode uploada datoteka umjesto base64 kodiranja za videozapise veće od 100 MB kako biste izbjegli ograničenja veličine zahtjeva.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o Kimi k2.6

Pronađite odgovore na česta pitanja o Kimi k2.6