moonshot

Kimi k2.6

Kimi k2.6 je Moonshot AI model sa 1T parametara i MoE arhitekturom, koji nudi 256K context window, nativni video input i vrhunske performanse u autonomnom...

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20. april 2026.
Контекст
256Kтокена
Макс. излаз
33Kтокена
Улазна цена
$0.95/ 1M
Излазна цена
$4.00/ 1M
Модалитет:TextImageVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
90.5%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Kimi k2.6 је постигао 90.5% на овом бенчмарку.
HLE
54%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Kimi k2.6 је постигао 54% на овом бенчмарку.
MMLU
86.4%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Kimi k2.6 је постигао 86.4% на овом бенчмарку.
MMLU Pro
84.6%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Kimi k2.6 је постигао 84.6% на овом бенчмарку.
SimpleQA
43%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Kimi k2.6 је постигао 43% на овом бенчмарку.
IFEval
89.8%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Kimi k2.6 је постигао 89.8% на овом бенчмарку.
AIME 2025
97.3%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Kimi k2.6 је постигао 97.3% на овом бенчмарку.
MATH
98.2%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Kimi k2.6 је постигао 98.2% на овом бенчмарку.
GSM8k
97.3%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Kimi k2.6 је постигао 97.3% на овом бенчмарку.
MGSM
91.5%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Kimi k2.6 је постигао 91.5% на овом бенчмарку.
MathVista
67.1%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Kimi k2.6 је постигао 67.1% на овом бенчмарку.
SWE-Bench
80.2%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Kimi k2.6 је постигао 80.2% на овом бенчмарку.
HumanEval
92%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Kimi k2.6 је постигао 92% на овом бенчмарку.
LiveCodeBench
83.1%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Kimi k2.6 је постигао 83.1% на овом бенчмарку.
MMMU
77.3%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Kimi k2.6 је постигао 77.3% на овом бенчмарку.
MMMU Pro
75.6%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Kimi k2.6 је постигао 75.6% на овом бенчмарку.
ChartQA
87.4%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Kimi k2.6 је постигао 87.4% на овом бенчмарку.
DocVQA
94.9%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Kimi k2.6 је постигао 94.9% на овом бенчмарку.
Terminal-Bench
60.2%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Kimi k2.6 је постигао 60.2% на овом бенчмарку.
ARC-AGI
68.8%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Kimi k2.6 је постигао 68.8% на овом бенчмарку.

О моделу Kimi k2.6

Сазнајте о могућностима, функцијама и начинима коришћења модела Kimi k2.6.

Arhitektonski dizajn i skala

Kimi k2.6 je frontier multimodal Mixture-of-Experts (MoE) model sa skalom od bilion parametara. Koristi 32 milijarde aktivnih parametara po tokenu, balansirajući računarsku efikasnost sa kognitivnim performansama visokog nivoa. Arhitektura podržava interni chain-of-thought reasoning, gde model generiše skrivene korake razmišljanja pre davanja finalnog odgovora. Ovaj dizajn mu omogućava da rešava kompleksne probleme u više koraka koji obično zaustavljaju standardne LLM modele.

Agentic inteligencija i koordinacija

Model je posebno optimizovan za autonomni softverski inženjering i dugoročne zadatke. Može da upravlja Agent Swarms sistemima sa do 300 paralelnih sub-agents, koji se koordinišu radi refaktoringa velikih baza koda ili upravljanja kompleksnim DevOps cevovodima. Korišćenjem nativnog pozivanja alata i vizuelnog razumevanja, Kimi k2.6 funkcioniše kao autonomni agent sposoban za rešavanje problema kroz više fajlova na GitHub-u i kreiranje web interfejsa bogatih pokretima na osnovu vizuelnih referenci.

Multimodalne mogućnosti

Nativna podrška za video i image input-e izdvaja Kimi k2.6 od mnogih open-weight konkurenata. Obrađuje video fajlove direktno radi analize scena, reprodukcije bug-ova i strukturiranog izvlačenja podataka. Model služi kao vizuelni arhitekta, generišući 3D šejdere i kompleksne animacije koristeći biblioteke kao što su Three.js i GSAP na osnovu vizuelnih opisa ili otpremljenih maketa.

Kimi k2.6

Случајеви употребе за Kimi k2.6

Откријте различите начине коришћења модела Kimi k2.6 за постизање одличних резултата.

Autonomni softverski inženjering

Rešavanje kompleksnih GitHub problema koordinacijom do 300 paralelnih sub-agents tokom sesija od 12 sati.

Generisanje frontend-a bogatog pokretima

Kreiranje modernih web interfejsa sa WebGL i GSAP šejderima na osnovu jednostavnih tekstualnih ili slikovnih prompt-ova.

Duboka video analiza

Analiza snimaka radi reprodukcije visual bug-ova, opisa scena ili strukturiranog izvlačenja podataka.

Agentic istraživanje tržišta

Izvršavanje web pretraga u više koraka i pozivanje alata radi sinteze izveštaja o analizi konkurencije iz stotina izvora.

Optimizacija legacy koda

Identifikovanje uskih grla u performansama starih baza koda analizom CPU flame grafova i podataka o alokaciji.

Rešavanje naučnih problema

Odgovaranje na naučna i matematička pitanja naprednog nivoa uz pomoć Python-a za reasoning i verifikaciju alatom.

Предности

Ограничења

Superiorno Agentic programiranje: Postiže 80,2% na SWE-Bench Verified testu, svrstavajući ga među najsposobnije modele za autonomni inženjering.
Visoki zahtevi za lokalni VRAM: Pokretanje punog modela lokalno zahteva 600GB VRAM-a, što ograničava self-hosting na specijalizovane high-end radne stanice.
Masivna skala koordinacije: Upravlja sa 300 paralelnih sub-agents, omogućavajući rešavanje refaktoringa na nivou preduzeća u jednom prolazu.
Regionalni API latency: Infrastruktura je optimizovana za Aziju, što može dovesti do dužeg vremena odziva za korisnike u zapadnim regionima.
Nativna multimodalna svestranost: Podržava nativne video i image input-e, omogućavajući napredne visual-language agent radne procese za UI/UX zadatke.
Padovi u recall-u unutar dugačkog konteksta: Model može imati poteškoće sa savršenim recall-om na samim ivicama svog bafera od 256.000 tokens.
Agresivna cenovna prednost: Sa cenom od 0,95 USD po milion input tokens, značajno je jeftiniji od vlasničkih konkurenata kao što su Claude 3.7 ili GPT-4o.
Ograničena komercijalna licenca: Izdanje sa otvorenim težinama koristi modifikovanu licencu koja zahteva posebnu usklađenost za primenu u velikim preduzećima.

АПИ брзи старт

moonshotai/kimi-k2.6

Погледај документацију
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Kimi k2.6

Погледајте шта заједница мисли о моделу Kimi k2.6

Upoznajte Kimi K2.6: Unapređenje open-source programiranja. Jedan prompt, 100+ fajlova. 4000+ poziva alata tokom 12 sati kontinuiranog izvršavanja.
@Kimi_Moonshot
twitter
Kimi 2.6 POBEĐUJE Opus 4.7 i NAJBOLJI je open-source model na svetu. Veoma dobar model po 10 puta nižoj ceni.
@bindureddy
twitter
Razlika u ceni je ono što niko ne uračunava. Kimi K2.6 je 5 puta jeftiniji od Sonnet 4.6. Jaz u benchmark rezultatima je zvanično invertovan.
@aakashgupta
twitter
Testirao sam ga na bagu koji sam imao. Rešio ga je uspešno za nešto malo više od 1 dolara. Bio je to težak bag sa kojim se Sonnet mučio.
@uworldhits1391
youtube
Kimi K2.6 je transformativan, mada ima prostora za poboljšanja u recall-u kod ultra-dugačkih zadataka. Ipak, 300 paralelnih agenata je ludilo.
@Radiant-Act4707
reddit
Serija Kimi K2 označava trenutak kada open-source frontier labs konačno pariraju i prevazilaze gigante zatvorenog koda.
@zxytim
twitter

Видео снимци о моделу Kimi k2.6

Гледајте туторијале, рецензије и дискусије о моделу Kimi k2.6

Kimi K2.6 neće uništiti Claude, ali HOĆE uništiti premijum cene zatvorenih laboratorija.

Sposobnost agent swarm-a, 300 agenata paralelno, je nešto što još nismo videli u open-source svetu.

HLE skor od 54,0 je najviši koji smo videli za model sa otvorenim težinama.

Jedan prompt može dovesti do 12 sati kontinuiranog izvršavanja, što je nova granica za agente.

Rukuje pozivanjem alata u više koraka sa stabilnošću koja odgovara najboljim vlasničkim modelima.

Vision model podržava nativni video input, što je retka funkcija čak i u 2026. godini.

Rukuje pozivanjem alata u više koraka sa stabilnim thinking mode-om koji parira OpenAI o-seriji.

Za frontend razvoj, generacije bogate pokretima su značajno bolje od K2.5.

Context window od 256K omogućava parsiranje celokupne dokumentacije odjednom.

To je jedan od prvih modela koji pokazuje pravu autonomiju u terminalnim okruženjima.

Uparivanje K2.6 sa Kimi Code CLI omogućava 12+ sati autonomnih sesija programiranja.

Autonomno je refaktorisao 8 godina star finansijski engine i postigao 185% veći throughput.

Ovo je model sa bilion parametara, ali aktivnih parametara ima samo 32B, što ga održava brzim.

Uštede za programere koji prelaze sa Claude-a na Kimi su astronomske.

Rešio je bag u kompleksnoj Rust biblioteci koji je bio otvoren tri meseca.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Kimi k2.6

Stručni saveti za maksimalno iskorišćenje Kimi k2.6.

Omogućite korišćenje alata za Reasoning

Benchmark rezultati pokazuju da HLE skor skače sa 23,9 na 54,0 kada modelu dozvolite pristup eksternim alatima za pretragu i proračune.

Pratite ivice kontekstualnog bafera

Recall je najprecizniji u prvih 200.000 tokens unutar bafera od 256.000 tokens.

Koristite Thinking Mode štedljivo

Isključite thinking parametar za jednostavne chat zadatke kako biste smanjili latency i ukupnu potrošnju tokens.

Standardizujte pomoću XML tagova

Model preciznije prati instrukcije kada su kontekst i zadaci upakovani unutar XML tagova.

Iskoristite nativno otpremanje video snimaka

Koristite metode za otpremanje fajlova umesto base64 kodiranja za video snimke veće od 100MB kako biste izbegli ograničenja veličine zahteva.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Често Постављана Питања о Kimi k2.6

Пронађите одговоре на честа питања о Kimi k2.6