moonshot

Kimi K2.5

Objevte Kimi K2.5 od Moonshot AI, open-source agentic model s 1 bilionem parametrů, nativní multimodální schopností, 262K context window a SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27. ledna 2026
Kontext
256Ktokenu
Max vystup
66Ktokenu
Cena vstupu
$0.60/ 1M
Cena vystupu
$3.00/ 1M
Modalita:TextImageVideo
Schopnosti:VideniNastrojeStreamingUvazovani
Benchmarky
GPQA
87.6%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. Kimi K2.5 ziskal 87.6% v tomto benchmarku.
HLE
50.2%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. Kimi K2.5 ziskal 50.2% v tomto benchmarku.
MMLU
91.5%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. Kimi K2.5 ziskal 91.5% v tomto benchmarku.
MMLU Pro
87.1%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. Kimi K2.5 ziskal 87.1% v tomto benchmarku.
SimpleQA
48%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. Kimi K2.5 ziskal 48% v tomto benchmarku.
IFEval
85%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. Kimi K2.5 ziskal 85% v tomto benchmarku.
AIME 2025
96.1%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. Kimi K2.5 ziskal 96.1% v tomto benchmarku.
MATH
90.1%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. Kimi K2.5 ziskal 90.1% v tomto benchmarku.
GSM8k
97.1%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. Kimi K2.5 ziskal 97.1% v tomto benchmarku.
MGSM
95%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. Kimi K2.5 ziskal 95% v tomto benchmarku.
MathVista
90.1%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. Kimi K2.5 ziskal 90.1% v tomto benchmarku.
SWE-Bench
76.8%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. Kimi K2.5 ziskal 76.8% v tomto benchmarku.
HumanEval
88%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. Kimi K2.5 ziskal 88% v tomto benchmarku.
LiveCodeBench
85%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. Kimi K2.5 ziskal 85% v tomto benchmarku.
MMMU
78.5%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. Kimi K2.5 ziskal 78.5% v tomto benchmarku.
MMMU Pro
78.5%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. Kimi K2.5 ziskal 78.5% v tomto benchmarku.
ChartQA
77.5%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. Kimi K2.5 ziskal 77.5% v tomto benchmarku.
DocVQA
88.8%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. Kimi K2.5 ziskal 88.8% v tomto benchmarku.
Terminal-Bench
50.8%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. Kimi K2.5 ziskal 50.8% v tomto benchmarku.
ARC-AGI
12%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. Kimi K2.5 ziskal 12% v tomto benchmarku.

O Kimi K2.5

Zjistete o schopnostech Kimi K2.5, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Kimi K2.5 je open-source multimodální model od společnosti Moonshot AI. Využívá architekturu Mixture-of-Experts s 1 bilionem parametrů, kde je aktivních 32 miliard parametrů na token. Systém sjednocuje zpracování textu, obrazu a videa v rámci jediného reasoning frameworku, místo aby pro každou modalitu používal oddělené externí kodéry. Tato architektura umožňuje modelu pracovat s 256 000 tokens kontextu při zachování vysoké přesnosti vyhledávání a logické konzistence napříč velmi dlouhými sekvencemi.

Model vyniká svou schopností Agent Swarm. Tato funkce systému umožňuje koordinovat až 100 paralelních sub-agentů pro provádění komplexních výzkumných nebo inženýrských úkolů současně. Díky integraci 400M parametrového kodéru MoonViT-3D dokáže K2.5 analyzovat několik hodin video obsahu s vysokou časovou přesností. Je speciálně navržen pro autonomní výkon a na agentic benchmarcích jako SWE-Bench a BrowseComp překonává mnoho proprietárních modelů.

Kimi K2.5 poskytuje dedikovaný režim Thinking pro úkoly vyžadující hlubokou logiku. Pokud je aktivován, model generuje vnitřní řetězec reasoning, aby před vyprodukováním finální odpovědi provedl autokorekci a ověření kroků. Díky tomu je vysoce efektivní pro soutěžní matematiku a softwarový vývoj velkého rozsahu. Ekonomika tokenů je optimalizována pro podnikové nasazení a nabízí inteligenci na úrovni frontier modelů za zlomek ceny konkurenčních closed-source systémů.

Kimi K2.5

Pripady pouziti pro Kimi K2.5

Objevte ruzne zpusoby, jak muzete pouzit Kimi K2.5 pro dosazeni skvelych vysledku.

Autonomní softwarové inženýrství

Řešení komplexních problémů na GitHubu a vytváření architektur projektů s více soubory pomocí logiky optimalizované pro SWE-Bench.

Vizuální webový vývoj

Vytváření funkčního frontend kódu a návrhů UI přímo ze záznamů obrazovky existujících interakcí na webu.

Vícevláknový výzkum

Využití Agent Swarm k procházení a syntéze informací z více než 100 zdrojů v jediném paralelním pracovním postupu.

Analýza dlouhých videí

Extrakce konkrétních událostí a časových dat z hodin bezpečnostních nebo přednáškových záznamů bez nutnosti nástrojů pro extrakci snímků.

Generování matematických důkazů

Aplikace režimu deep thinking pro řešení matematických úloh na úrovni olympiád s 96procentní úspěšností.

Automatizace firemní dokumentace

Generování vícestránkových PDF reportů a komplexních finančních tabulek z nestrukturovaných obchodních datových zdrojů.

Silne stranky

Omezeni

Špičkový agentic výkon: Dosahuje skóre 76,8 v benchmarku SWE-Bench Verified, čímž v softwarových úkolech překonává mnoho proprietárních frontier modelů.
Extrémní nároky na lokální VRAM: Vyžaduje 632 GB VRAM pro plný nekvantizovaný model, což znemožňuje lokální nasazení pro většinu spotřebitelů.
Bezkonkurenční ekonomika tokenů: Poskytuje inteligenci 1T MoE za 0,60 $ za milion vstupních tokenů, což je zhruba 10 procent ceny modelu Claude Opus.
Vyšší latence reasoning: Režim thinking může způsobit znatelné prodlevy, zatímco model před odpovědí generuje vnitřní logické řetězce.
Nativní porozumění videu: Zpracovává komplexní video soubory bez externí extrakce snímků, což umožňuje precizní časovou analýzu dlouhých záznamů.
Opakování ve formátování: Může produkovat příliš dlouhé bloky textu, pokud není přísně instruován k použití specifických struktur odstavců.
Paralelní orchestrace roje: Jediný open model trénovaný ke koordinaci až 100 sub-agentů pro masivní, vícevláknové výzkumné pracovní postupy.
Obavy ohledně datové suverenity: Primární infrastruktura sídlí v Číně, což může představovat problémy s dodržováním předpisů pro některé západní společnosti.

Rychly start API

fireworks/kimi-k2p5

Zobrazit dokumentaci
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o Kimi K2.5

Podivejte se, co si komunita mysli o Kimi K2.5

Kimi K2.5 stojí téměř 10 procent toho, co stojí Opus při podobné úrovni výkonu.
Odd_Tumbleweed574
reddit
Lidé zapomínají, že Nvidia ztratila 600 miliard dolarů, když čínská laboratoř vydala něco tak významného jako open source. Kimi to s frontier inteligencí dělá znovu.
chetaslua
twitter
Koncept Attention Residuals v K2.5 je první architektonická změna po letech, která skutečně řeší problém zapomínání u LLM.
logic_king
hackernews
Workers AI nyní spouští velké modely. Kimi K2.5 je první. Je to jeden z nejlepších open-source modelů, který existuje, velmi dobrý i na programování.
dok2001
twitter
Kimi K2.5 je jiná liga. Je to chytrý a neuvěřitelný model pro RP, ale může být neurotický, pokud nepoužíváte komunitní presety.
dptgreg
reddit
Nahradil jsem svůj GPT 4 workflow modelem Kimi K2.5, protože režim thinking je transparentnější a context window zvládne celé mé repo.
Dev_Max
reddit

Videa o Kimi K2.5

Sledujte navody, recenze a diskuse o Kimi K2.5

Kimi K2.5 překonává GPT 5.2 s vysokým thinking, naprosto drtí ostatní frontier modely.

Je to nejsilnější open-source model pro programování, jaký tu kdy byl, se skóre 76.8 na SWE verified.

Agent swarm je posun od jednoho agenta k multi-agentnímu systému provádějícímu paralelní pracovní postupy v až 1500 koordinovaných krocích.

Context window je masivní s hodnotou 256k tokens, což bohatě stačí pro většinu projektů.

Moonshot skutečně posouvá hranice toho, co dokážou open weights na začátku roku 2026.

Opravdu trefil celou estetiku designu Apple a vytvořil hezky vypadající web s animacemi přímo z videa.

Funkce Swarm vypadá velmi cool a je určitě zábavné ji používat, protože každému sub-agentovi přiděluje ID odznak.

K2.5 je mnohem levnější s cenou 60 centů za milion vstupních a 3 dolary za milion výstupních tokenů.

Nativní zpracování videa znamená, že nemusíte používat drahé externí nástroje pro zpracování snímků.

Tento model mění pravidla hry pro vývojáře, kteří potřebují autonomní agenty s omezeným rozpočtem.

Moonshot toho dosáhl tím, že každému sub-agentovi udělil odměny v oddělených kritických fázích, aby zabránil selhání řetězce.

Model se učí volit paralelismus pouze tehdy, když zkracuje kritickou cestu, což je velmi chytrá inovace.

Kimi K2.5 je těsně na hraně toho, co lze spustit na spotřebitelském hardwaru pomocí GGUF.

Režim thinking je neuvěřitelně robustní pro řešení komplexních logických chyb v Pythonu.

Vydat takový 1 bilion parametrový model je pro open-source komunitu obrovská věc.

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionalni tipy pro Kimi K2.5

Expertni tipy, ktere vam pomohou ziskat maximum z Kimi K2.5 a dosahnout lepsich vysledku.

Aktivujte režim Thinking

V API požadavku předejte parametr thinking pro dosažení maximální přesnosti u matematických a programovacích úkolů.

Spusťte Agent Swarm

Instruujte model, aby pro výzkumné úkoly nasadil roj (swarm), čímž vynutíte paralelní orchestraci napříč sub-agenty.

Optimalizujte teplotu

Pro režim thinking použijte teplotu 1.0 pro umožnění různorodého reasoning, pro standardní chat ji snižte na 0.6.

Společné vizuální prompty

Nahrávejte snímky obrazovky s chybami společně s úryvky kódu pro využití sjednoceného tréninku modelu v oblasti textu a vize.

Context Caching

Využívejte context caching pro opakující se dlouhé dokumenty, čímž snížíte náklady na vstup až o 90 procent.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Casto kladene dotazy o Kimi K2.5

Najdete odpovedi na bezne otazky o Kimi K2.5