moonshot

Kimi K2.5

Otkrijte Moonshot AI Kimi K2.5, open-source agentic model od 1T parametara sa nativnim multimodalnim sposobnostima, 262K context window-om i SOTA reasoning-om.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27. januar 2026.
Контекст
256Kтокена
Макс. излаз
66Kтокена
Улазна цена
$0.60/ 1M
Излазна цена
$3.00/ 1M
Модалитет:TextImageVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
87.6%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Kimi K2.5 је постигао 87.6% на овом бенчмарку.
HLE
50.2%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Kimi K2.5 је постигао 50.2% на овом бенчмарку.
MMLU
91.5%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Kimi K2.5 је постигао 91.5% на овом бенчмарку.
MMLU Pro
87.1%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Kimi K2.5 је постигао 87.1% на овом бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Kimi K2.5 је постигао 48% на овом бенчмарку.
IFEval
85%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Kimi K2.5 је постигао 85% на овом бенчмарку.
AIME 2025
96.1%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Kimi K2.5 је постигао 96.1% на овом бенчмарку.
MATH
90.1%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Kimi K2.5 је постигао 90.1% на овом бенчмарку.
GSM8k
97.1%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Kimi K2.5 је постигао 97.1% на овом бенчмарку.
MGSM
95%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Kimi K2.5 је постигао 95% на овом бенчмарку.
MathVista
90.1%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Kimi K2.5 је постигао 90.1% на овом бенчмарку.
SWE-Bench
76.8%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Kimi K2.5 је постигао 76.8% на овом бенчмарку.
HumanEval
88%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Kimi K2.5 је постигао 88% на овом бенчмарку.
LiveCodeBench
85%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Kimi K2.5 је постигао 85% на овом бенчмарку.
MMMU
78.5%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Kimi K2.5 је постигао 78.5% на овом бенчмарку.
MMMU Pro
78.5%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Kimi K2.5 је постигао 78.5% на овом бенчмарку.
ChartQA
77.5%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Kimi K2.5 је постигао 77.5% на овом бенчмарку.
DocVQA
88.8%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Kimi K2.5 је постигао 88.8% на овом бенчмарку.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Kimi K2.5 је постигао 50.8% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Kimi K2.5 је постигао 12% на овом бенчмарку.

О моделу Kimi K2.5

Сазнајте о могућностима, функцијама и начинима коришћења модела Kimi K2.5.

Kimi K2.5 je open-source multimodalni model iz Moonshot AI. Koristi arhitekturu Mixture-of-Experts od 1 trilion parametara, gde je 32 milijarde parametara aktivno po token-u. Sistem objedinjuje obradu teksta, slike i videa kroz jedan framework za reasoning umesto korišćenja zasebnih eksternih enkodera za svaku modalnost. Ovakva arhitektura omogućava modelu da obrađuje 256.000 tokens konteksta uz održavanje visoke tačnosti preuzimanja podataka i logičke doslednosti kroz veoma duge sekvence.

Model se ističe svojom Agent Swarm sposobnošću. Ova funkcija omogućava sistemu da koordinira do 100 paralelnih sub-agents za istovremeno izvršavanje složenih istraživačkih ili inženjerskih zadataka. Integracijom MoonViT-3D enkodera od 400M parametara, K2.5 može analizirati nekoliko sati video sadržaja sa temporalnom preciznošću. Posebno je dizajniran za autonomno izvršavanje, nadmašujući mnoge proprietary modele na benchmark-ovima za agente kao što su SWE-Bench i BrowseComp.

Kimi K2.5 pruža namensko Thinking mode za zadatke koji zahtevaju duboku logiku. Kada je omogućen, model generiše interni lanac zaključivanja kako bi se samoispravljao i verifikovao korake pre davanja konačnog odgovora. Ovo ga čini izuzetno efikasnim za matematiku takmičarskog nivoa i softverski razvoj velikih razmera. Njegova token ekonomija je optimizovana za korporativnu upotrebu, nudeći frontier nivo inteligencije po deliću cene konkurentskih closed-source sistema.

Kimi K2.5

Случајеви употребе за Kimi K2.5

Откријте различите начине коришћења модела Kimi K2.5 за постизање одличних резултата.

Autonomni softverski inženjering

Rešavanje složenih GitHub problema i izgradnja arhitektura projekata sa više datoteka koristeći logiku optimizovanu za SWE-Bench.

Vizuelni web razvoj

Kreiranje funkcionalnog frontend koda i UI dizajna direktno iz snimaka ekrana postojećih interakcija na veb lokacijama.

Multi-threaded istraživanje

Korišćenje Agent Swarm-a za pretraživanje i sintetizovanje informacija iz preko 100 izvora u jednom paralelnom workflow-u.

Analiza dugih video zapisa

Ekstrakcija specifičnih događaja i temporalnih podataka iz sati sigurnosnih ili predavačkih snimaka bez potrebe za alatima za ekstrakciju frejmova.

Generisanje matematičkih dokaza

Primena deep thinking moda za rešavanje matematičkih problema na nivou olimpijade sa stopom tačnosti od 96 procenata.

Automatizacija korporativne dokumentacije

Generisanje PDF izveštaja na više stranica i složenih finansijskih tabela iz nestrukturiranih poslovnih izvora podataka.

Предности

Ограничења

Vrhunske agentic performanse: Ostvaruje 76,8 na SWE-Bench Verified benchmark-u, nadmašujući mnoge proprietary frontier modele u zadacima softverskog inženjeringa.
Ekstremni zahtevi za lokalni VRAM: Zahteva 632GB VRAM-a za puni nekvantizovani model, što lokalno pokretanje čini nemogućim za većinu korisnika.
Nenadmašna token ekonomija: Pruža 1T parameter MoE inteligenciju po ceni od 0,60 $ po milionu input tokens, što je oko 10 procenata troškova Claude Opus modela.
Veća reasoning latencija: Thinking mode može uvesti značajna kašnjenja dok model generiše interne lance logike pre nego što odgovori.
Nativno razumevanje videa: Obrađuje složene video datoteke bez eksternih alata za ekstrakciju frejmova, omogućavajući preciznu temporalnu analizu dugih snimaka.
Ponavljanje u formatiranju: Može proizvesti predugačke blokove teksta osim ako se striktno ne insturiše da koristi određene strukture paragrafa.
Paralelna Swarm orkestracija: Jedini open-source model obučen da koordinira do 100 sub-agents za masivne, multi-threaded istraživačke workflow-ove.
Zabrinutost oko rezidencije podataka: Primarna infrastruktura je bazirana u Kini, što može predstavljati probleme sa usklađenošću za određene zapadne kompanije.

АПИ брзи старт

fireworks/kimi-k2p5

Погледај документацију
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Kimi K2.5

Погледајте шта заједница мисли о моделу Kimi K2.5

Kimi K2.5 košta skoro 10 procenata cene Opus modela uz sličan nivo performansi.
Odd_Tumbleweed574
reddit
Ljudi zaboravljaju da je Nvidia izgubila 600 milijardi dolara kada je kineska laboratorija objavila nešto veliko kao open-source. Kimi to ponovo radi sa frontier inteligencijom.
chetaslua
twitter
Koncept Attention Residuals u K2.5 je prva arhitektonska promena godinama unazad koja zapravo rešava problem zaboravljanja kod LLM-ova.
logic_king
hackernews
Workers AI sada pokreće velike modele. Kimi K2.5 je prvi. To je jedan od najboljih open-source modela tamo, veoma dobar i za kodiranje.
dok2001
twitter
Kimi K2.5 je zver za sebe. To je neverovatno pametan RP model, ali može postati neurotičan ako ne koristite zajedničke presete.
dptgreg
reddit
Zamenio sam svoj GPT 4 workflow sa Kimi K2.5 jer je thinking mode transparentniji, a context window lako obrađuje ceo moj repo.
Dev_Max
reddit

Видео снимци о моделу Kimi K2.5

Гледајте туторијале, рецензије и дискусије о моделу Kimi K2.5

Kimi K2.5 pobeđuje GPT 5.2 sa visokim nivoom reasoning-a, apsolutno uništavajući ostale frontier modele.

To je trenutno najjači open-source model za kodiranje sa 76,8 na SWE verified benchmark-u.

Agent swarm predstavlja pomak od single-agent ka multi-agent sistemima koji izvršavaju paralelne workflow-ove kroz do 1500 koordinisanih koraka.

Context window je masivan sa 256k tokens, što je sasvim dovoljno za većinu projekata.

Moonshot zaista pomera granice onoga što open weights modeli mogu početkom 2026. godine.

Zaista je pogodio Apple dizajn estetiku i proizveo web stranicu lepog izgleda sa animacijama samo na osnovu video zapisa.

Swarm funkcija izgleda veoma kul i svakako je zabavna za korišćenje jer dodeljuje ID značke svakom sub-agentu.

K2.5 je mnogo jeftiniji, sa cenom od 60 centi po milionu input tokens i 3 dolara po milionu output tokens.

Nativna video obrada znači da ne morate koristiti skupe eksterne alate za obradu frejmova.

Ovaj model menja pravila igre za developere kojima su potrebni autonomni agenti uz ograničen budžet.

Moonshot je ovo postigao davanjem nagrada svakom sub-agentu u različitim kritičnim fazama kako bi se sprečio serijski kolaps.

Model uči da izabere paralelizaciju samo kada to skraćuje kritični put, što je vrlo pametna inovacija.

Kimi K2.5 je na samoj granici da se pokrene na consumer hardveru koristeći GGUF.

Thinking mode je neverovatno robustan za rešavanje složenih logičkih grešaka u Python-u.

Videti model od 1 triliona parametara objavljen na ovaj način je velika stvar za open-source zajednicu.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Kimi K2.5

Stručni saveti za maksimalno iskorišćenje Kimi K2.5.

Omogućite Thinking Mode

Prosledite parametar thinking u svom API zahtevu kako biste postigli maksimalnu preciznost u matematičkim i koderskim zadacima.

Pokrenite Agent Swarm

Instruirajte model da rasporedi swarm za istraživačke zadatke kako biste forsirali paralelnu orkestraciju među sub-agents.

Optimizujte Temperature

Koristite temperature od 1.0 za thinking mode kako biste dozvolili raznovrsnije reasoning procese, ali smanjite je na 0.6 za standardni chat.

Joint Vision Prompts

Otpremite screenshot-ove grešaka zajedno sa delovima koda kako biste iskoristili prednosti modela sa objedinjenom obukom za tekst i vizuelne podatke.

Context Caching

Koristite context caching za dokumente koji se često ponavljaju kako biste smanjili troškove input-a za do 90 procenata.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Често Постављана Питања о Kimi K2.5

Пронађите одговоре на честа питања о Kimi K2.5