moonshot

Kimi K2.5

Otkrijte Kimi K2.5 iz Moonshot AI-a, open-source agentic model od 1T parametara s nativnim multimodalnim sposobnostima, 262K context windowom i SOTA...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27. siječnja 2026.
Kontekst
256Ktokena
Maks. izlaz
66Ktokena
Ulazna cijena
$0.60/ 1M
Izlazna cijena
$3.00/ 1M
Modalitet:TextImageVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
87.6%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Kimi K2.5 je postigao 87.6% na ovom benchmarku.
HLE
50.2%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Kimi K2.5 je postigao 50.2% na ovom benchmarku.
MMLU
91.5%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Kimi K2.5 je postigao 91.5% na ovom benchmarku.
MMLU Pro
87.1%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Kimi K2.5 je postigao 87.1% na ovom benchmarku.
SimpleQA
48%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Kimi K2.5 je postigao 48% na ovom benchmarku.
IFEval
85%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Kimi K2.5 je postigao 85% na ovom benchmarku.
AIME 2025
96.1%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Kimi K2.5 je postigao 96.1% na ovom benchmarku.
MATH
90.1%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Kimi K2.5 je postigao 90.1% na ovom benchmarku.
GSM8k
97.1%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Kimi K2.5 je postigao 97.1% na ovom benchmarku.
MGSM
95%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Kimi K2.5 je postigao 95% na ovom benchmarku.
MathVista
90.1%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Kimi K2.5 je postigao 90.1% na ovom benchmarku.
SWE-Bench
76.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Kimi K2.5 je postigao 76.8% na ovom benchmarku.
HumanEval
88%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Kimi K2.5 je postigao 88% na ovom benchmarku.
LiveCodeBench
85%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Kimi K2.5 je postigao 85% na ovom benchmarku.
MMMU
78.5%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Kimi K2.5 je postigao 78.5% na ovom benchmarku.
MMMU Pro
78.5%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Kimi K2.5 je postigao 78.5% na ovom benchmarku.
ChartQA
77.5%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Kimi K2.5 je postigao 77.5% na ovom benchmarku.
DocVQA
88.8%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Kimi K2.5 je postigao 88.8% na ovom benchmarku.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Kimi K2.5 je postigao 50.8% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Kimi K2.5 je postigao 12% na ovom benchmarku.

O modelu Kimi K2.5

Saznajte o mogućnostima, značajkama i načinima korištenja modela Kimi K2.5.

Kimi K2.5 je open-source multimodal model tvrtke Moonshot AI. Koristi Mixture-of-Experts arhitekturu od 1 bilijun parametara, gdje su 32 milijarde parametara aktivne po tokenu. Sustav objedinjuje obradu teksta, slike i videa kroz jedan okvir za reasoning, umjesto korištenja zasebnih vanjskih enkodera za svaku modalnost. Ova arhitektura omogućuje modelu rukovanje s 256.000 tokens contexta uz održavanje visoke točnosti pretraživanja i logičke konzistentnosti kroz vrlo duge sekvence.

Model se ističe svojom Agent Swarm sposobnošću. Ova značajka omogućuje sustavu koordinaciju do 100 paralelnih sub-agenata za istovremeno izvršavanje složenih istraživačkih ili inženjerskih zadataka. Integracijom MoonViT-3D enkodera od 400 milijuna parametara, K2.5 može analizirati nekoliko sati video sadržaja s vremenskom preciznošću. Posebno je dizajniran za autonomno izvršavanje, nadmašujući mnoge proprietary modele na agentic benchmarkovima kao što su SWE-Bench i BrowseComp.

Kimi K2.5 nudi namjenski Thinking mode za zadatke koji zahtijevaju duboku logiku. Kada je omogućen, model generira interni lanac zaključivanja kako bi sam ispravio i verificirao korake prije davanja konačnog odgovora. To ga čini vrlo učinkovitim za matematiku natjecateljske razine i softverski razvoj velikih razmjera. Njegova ekonomičnost tokena optimizirana je za implementaciju u tvrtkama, nudeći inteligenciju razine frontier modela uz djelić troška konkurentskih zatvorenih sustava.

Kimi K2.5

Slučajevi korištenja za Kimi K2.5

Otkrijte različite načine korištenja modela Kimi K2.5 za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Rješavanje složenih GitHub problema i izgradnja arhitektura projekata s više datoteka koristeći logiku optimiziranu za SWE-Bench.

Vizualni web razvoj

Izrada funkcionalnog frontend koda i UI dizajna izravno iz snimki zaslona interakcija postojećih web stranica.

Višedretveno istraživanje

Korištenje Agent Swarma za pretraživanje i sintetiziranje informacija iz više od 100 izvora u jednom paralelnom tijeku rada.

Analiza dugih videozapisa

Izdvajanje specifičnih događaja i vremenskih podataka iz sati sigurnosnih ili predavačkih snimki bez alata za izdvajanje frameova.

Generiranje matematičkih dokaza

Primjena deep thinking moda za rješavanje matematičkih problema olimpijske razine s 96-postotnom stopom točnosti.

Automatizacija poslovnih dokumenata

Generiranje izvještaja u PDF-u na više stranica i složenih financijskih tablica iz nestrukturiranih poslovnih izvora podataka.

Prednosti

Ograničenja

Vrhunske agentic performanse: Postiže rezultat 76.8 na SWE-Bench Verified, nadmašujući mnoge proprietary frontier modele u zadacima softverskog inženjeringa.
Ekstremni zahtjevi za lokalnim VRAM-om: Zahtijeva 632GB VRAM-a za puni nekvantizirani model, što lokalnu implementaciju čini nemogućom za većinu korisnika.
Ekonomičnost bez premca: Pruža inteligenciju MoE modela od 1T parametara po cijeni od $0.60 po milijunu input tokensa, što je otprilike 10 posto troška modela Claude Opus.
Veća latencija kod reasoninga: Thinking mode može uvesti značajna kašnjenja dok model generira interne lance logike prije davanja odgovora.
Nativno razumijevanje videa: Obrađuje složene video datoteke bez vanjskog izdvajanja frameova, omogućujući preciznu vremensku analizu dugih snimki.
Ponavljanje u formatiranju: Može proizvesti pretjerano duge tekstualne zidove ako mu se strogo ne zada korištenje specifičnih struktura odlomaka.
Paralelna Swarm orkestracija: Jedini open model obučen za koordinaciju do 100 sub-agenata za masivne, višedretvene istraživačke radne procese.
Zabrinutost oko rezidencije podataka: Primarna infrastruktura nalazi se u Kini, što može predstavljati probleme s usklađenošću za određene zapadne tvrtke.

API brzi početak

fireworks/kimi-k2p5

Pogledaj dokumentaciju
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'Ti si Kimi, agent za zaključivanje.' },
      { role: 'user', content: 'Dizajniraj paralelni istraživački plan za trendove u kvantnom računalstvu.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Kimi K2.5

Pogledajte što zajednica misli o modelu Kimi K2.5

Kimi K2.5 košta gotovo 10 posto onoga što košta Opus uz sličnu razinu performansi.
Odd_Tumbleweed574
reddit
Ljudi zaboravljaju da je Nvidia izgubila 600 milijardi dolara kada je kineski laboratorij objavio nešto veliko kao open-source. Kimi to ponovno čini s frontier inteligencijom.
chetaslua
twitter
Koncept Attention Residuals u K2.5 je prva arhitektonska promjena u godinama koja zapravo rješava problem zaboravljanja kod LLM-a.
logic_king
hackernews
Workers AI sada pokreće velike modele. Kimi K2.5 je prvi. To je jedan od najboljih open-source modela, jako dobar i za programiranje.
dok2001
twitter
Kimi K2.5 je druga zvijer. To je pametan, nevjerojatan RP model, ali može postati neurotičan ako ne koristite presete zajednice.
dptgreg
reddit
Zamijenio sam svoj GPT 4 workflow s Kimi K2.5 jer je thinking mode transparentniji, a context window podnosi cijeli moj repozitorij.
Dev_Max
reddit

Videozapisi o modelu Kimi K2.5

Gledajte tutorijale, recenzije i diskusije o modelu Kimi K2.5

Kimi K2.5 pobjeđuje GPT 5.2 s visokim thinkingom, apsolutno uništavajući ostale Frontier modele.

To je najjači open-source model za programiranje do danas sa 76.8 na SWE verified.

Agent swarm je pomak s jednog agenta na više agenata koji izvršavaju paralelne radne procese kroz do 1500 koordiniranih koraka.

Context window je masivan s 256k tokens, što je sasvim dovoljno za većinu projekata.

Moonshot zaista pomiče granice onoga što open weights mogu učiniti početkom 2026.

Stvarno je pogodio cjelokupnu Apple dizajnersku estetiku i proizveo lijepu web stranicu s animacijama samo iz videozapisa.

Značajka Swarm izgleda vrlo cool i definitivno je zabavna za korištenje jer dodjeljuje ID značke svakom sub-agentu.

K2.5 je puno jeftiniji, sa 60 centi po milijunu input tokensa i 3 dolara po milijunu output tokensa.

Nativna obrada videa znači da ne morate koristiti skupe vanjske alate za obradu frameova.

Ovaj model mijenja pravila igre za programere kojima trebaju autonomni agenti s ograničenim proračunom.

Moonshot je to postigao dajući svakom sub-agentu nagrade u zasebnim fazama kritičnih koraka kako bi spriječio serijski kolaps.

Model uči odabrati paralelizaciju samo kada ona skraćuje taj kritični put, što je vrlo pametna inovacija.

Kimi K2.5 je na samom rubu mogućnosti pokretanja na potrošačkom hardveru koristeći GGUF.

Thinking mode je nevjerojatno robustan za rješavanje složenih logičkih pogrešaka u Pythonu.

Vidjeti ovakav model od 1 bilijun parametara je ogromno za open-source zajednicu.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Kimi K2.5

Stručni savjeti za maksimalno iskorištavanje Kimi K2.5.

Omogućite Thinking Mode

Proslijedite thinking parametar u svom API zahtjevu kako biste postigli maksimalnu točnost u matematičkim i programerskim zadacima.

Aktivirajte Agent Swarm

Instruirajte model da rasporedi swarm za istraživačke zadatke kako biste prisilili paralelnu orkestraciju između sub-agenata.

Optimizirajte temperaturu

Koristite temperaturu 1.0 za thinking mode kako biste omogućili raznoliko reasoning zaključivanje, ali je smanjite na 0.6 za standardni chat.

Zajednički vizualni promptovi

Učitajte snimke zaslona s pogreškama uz isječke koda kako biste iskoristili prednosti modelovog objedinjenog treninga teksta i vizije.

Context Caching

Koristite context caching za ponavljajuće dugačke dokumente kako biste smanjili troškove inputa za do 90 posto.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Često Postavljana Pitanja o Kimi K2.5

Pronađite odgovore na česta pitanja o Kimi K2.5