moonshot

Kimi K2.5

Upptäck Moonshot AI:s Kimi K2.5, en open-source agentic-modell med 1T parametrar, inbyggd multimodal kapacitet, 262K context window och SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27 januari 2026
Kontext
256Ktokens
Max utdata
66Ktokens
Inmatningspris
$0.60/ 1M
Utdatapris
$3.00/ 1M
Modalitet:TextImageVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
87.6%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Kimi K2.5 fick 87.6% pa detta benchmark.
HLE
50.2%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Kimi K2.5 fick 50.2% pa detta benchmark.
MMLU
91.5%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Kimi K2.5 fick 91.5% pa detta benchmark.
MMLU Pro
87.1%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Kimi K2.5 fick 87.1% pa detta benchmark.
SimpleQA
48%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Kimi K2.5 fick 48% pa detta benchmark.
IFEval
85%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Kimi K2.5 fick 85% pa detta benchmark.
AIME 2025
96.1%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Kimi K2.5 fick 96.1% pa detta benchmark.
MATH
90.1%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Kimi K2.5 fick 90.1% pa detta benchmark.
GSM8k
97.1%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Kimi K2.5 fick 97.1% pa detta benchmark.
MGSM
95%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Kimi K2.5 fick 95% pa detta benchmark.
MathVista
90.1%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Kimi K2.5 fick 90.1% pa detta benchmark.
SWE-Bench
76.8%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Kimi K2.5 fick 76.8% pa detta benchmark.
HumanEval
88%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Kimi K2.5 fick 88% pa detta benchmark.
LiveCodeBench
85%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Kimi K2.5 fick 85% pa detta benchmark.
MMMU
78.5%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Kimi K2.5 fick 78.5% pa detta benchmark.
MMMU Pro
78.5%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Kimi K2.5 fick 78.5% pa detta benchmark.
ChartQA
77.5%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Kimi K2.5 fick 77.5% pa detta benchmark.
DocVQA
88.8%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Kimi K2.5 fick 88.8% pa detta benchmark.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Kimi K2.5 fick 50.8% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Kimi K2.5 fick 12% pa detta benchmark.

Om Kimi K2.5

Lar dig om Kimi K2.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Kimi K2.5 är en open-source multimodal modell från Moonshot AI. Den använder en Mixture-of-Experts-arkitektur på 1 biljon parametrar där 32 miljarder parametrar är aktiva per token. Systemet förenar text-, bild- och videobearbetning genom ett enda ramverk för reasoning istället för att använda separata externa encoders för varje modalitet. Denna arkitektur gör det möjligt för modellen att hantera 256 000 tokens av context samtidigt som den behåller hög noggrannhet vid hämtning av data och logisk konsekvens över mycket långa sekvenser.

Modellen utmärker sig genom sin Agent Swarm-kapacitet. Denna funktion gör att systemet kan koordinera upp till 100 parallella sub-agents för att utföra komplex forskning eller ingenjörsuppgifter samtidigt. Genom att integrera en MoonViT-3D encoder på 400 miljoner parametrar kan K2.5 analysera flera timmars videoinnehåll med temporal precision. Den är specifikt utformad för autonom exekvering och överträffar många proprietära modeller i agentic-benchmarks som SWE-Bench och BrowseComp.

Kimi K2.5 tillhandahåller ett dedikerat Thinking mode för uppgifter som kräver djup logik. När det är aktiverat genererar modellen en intern logikkedja för att självkorrigera och verifiera steg innan ett slutgiltigt svar produceras. Detta gör den extremt effektiv för matematik på tävlingsnivå och storskalig mjukvaruutveckling. Dess token-ekonomi är optimerad för företagsdriftsättning och erbjuder frontier-nivå av intelligens till en bråkdel av kostnaden för konkurrerande closed-source-system.

Kimi K2.5

Anvandningsfall for Kimi K2.5

Upptack de olika satten du kan anvanda Kimi K2.5 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Lösa komplexa GitHub-issues och bygga arkitektur för projekt med flera filer med hjälp av SWE-Bench-optimerad logik.

Visuell webbutveckling

Skapa funktionell frontend-kod och UI-design direkt från skärminspelningar av befintliga webbplatsinteraktioner.

Forskning med flera trådar

Använda Agent Swarm för att söka igenom och sammanställa information från över 100 källor i ett enda parallellt arbetsflöde.

Analys av lång video

Extrahera specifika händelser och tidsdata från timmar av säkerhets- eller föreläsningsmaterial utan verktyg för bildruteextrahering.

Generering av matematiska bevis

Använda deep thinking-läget för att lösa matematiska problem på olympiadnivå med 96 procents noggrannhet.

Dokumentautomatisering för företag

Generera PDF-rapporter på flera sidor och komplexa finansiella kalkylblad från ostrukturerade affärsdatakällor.

Styrkor

Begransningar

Överlägsen agentic-prestanda: Får 76.8 på SWE-Bench Verified, vilket överträffar många proprietära frontier models inom mjukvaruutveckling.
Extrema krav på lokalt VRAM: Kräver 632 GB VRAM för den fullständiga okvantiserade modellen, vilket gör lokal körning omöjlig för de flesta konsumenter.
Oöverträffad token-ekonomi: Ger 1T parameter MoE-intelligens till 0,60 $ per miljon input tokens, ungefär 10 procent av kostnaden för Claude Opus.
Högre latency vid reasoning: Thinking mode kan introducera märkbara fördröjningar eftersom modellen genererar interna logikkedjor innan den svarar.
Inbyggd videoförståelse: Bearbetar komplexa videofiler utan extern bildruteextrahering, vilket möjliggör exakt tidsanalys av långa inspelningar.
Repetitiv formatering: Kan producera extremt långa textväggar om den inte strikt instrueras att använda specifika styckestrukturer.
Orkestrering med parallella svärmar: Den enda öppna modellen som tränats för att koordinera upp till 100 sub-agents för massiva forskningsflöden med flera trådar.
Oro för datalagring: Den primära infrastrukturen finns i Kina, vilket kan skapa efterlevnadsproblem för vissa västerländska företag.

API snabbstart

fireworks/kimi-k2p5

Visa dokumentation
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Kimi K2.5

Se vad communityt tycker om Kimi K2.5

Kimi K2.5 kostar nästan 10 procent av vad Opus kostar på en liknande prestandanivå.
Odd_Tumbleweed574
reddit
Folk glömmer att Nvidia förlorade 600 miljarder dollar när ett kinesiskt labb släppte något stort med open source. Kimi gör om det igen med frontier-intelligens.
chetaslua
twitter
Konceptet Attention Residuals i K2.5 är den första arkitektoniska förändringen på flera år som faktiskt löser problemet med att LLM glömmer.
logic_king
hackernews
Workers AI kör stora modeller nu. Kimi K2.5 först. Det är en av de bästa open-source-modellerna där ute, även riktigt bra för kodning.
dok2001
twitter
Kimi K2.5 är ett helt annat djur. Det är en smart och otrolig RP-modell, men den kan bli neurotisk om du inte använder community-förinställningar.
dptgreg
reddit
Jag ersatte mitt GPT 4-arbetsflöde med Kimi K2.5 eftersom thinking mode är mer transparent och context window klarar hela mitt repo.
Dev_Max
reddit

Videor om Kimi K2.5

Se handledningar, recensioner och diskussioner om Kimi K2.5

Kimmy K2.5 slår GPT 5.2 med sitt avancerade tänkande och fullkomligt krossar andra frontier models.

Det är den starkaste open-source-modellen för kodning hittills med 76.8 på SWE verified.

Agent swarm är ett skifte från en enskild agent till flera agenter som exekverar parallella arbetsflöden över upp till 1500 koordinerade steg.

Context window är massiv på 256k tokens, vilket räcker gott för de flesta projekt.

Moonshot flyttar verkligen fram gränserna för vad open weights kan prestera under tidiga 2026.

Den lyckades verkligen träffa Apples designestetik och skapade en snygg webbplats med animationer utifrån en video.

Swarm-funktionen ser väldigt cool ut och den är definitivt rolig att använda eftersom den ger ID-brickor till varje sub-agent.

K2.5 är mycket billigare med 60 cent per miljon input tokens och 3 dollar per miljon output tokens.

Den inbyggda videobearbetningen innebär att du slipper dyra externa verktyg för att bearbeta bildrutor.

Den här modellen förändrar spelreglerna för utvecklare som behöver autonoma agenter till en låg kostnad.

Moonshot uppnådde detta genom att ge varje sub-agent belöningar vid olika kritiska steg för att förhindra seriell kollaps.

Modellen lär sig att välja parallellism bara när det förkortar den kritiska vägen, vilket är en mycket smart innovation.

Kimi K2.5 ligger precis på gränsen för vad som går att köra på konsumenthårdvara med GGUF.

Thinking mode är otroligt robust för att lösa komplexa logiska fel i Python.

Att se en modell med 1 biljon parametrar släppas på detta sätt är stort för open-source-communityt.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Kimi K2.5

Experttips for att hjalpa dig fa ut det mesta av Kimi K2.5 och uppna battre resultat.

Aktivera Thinking Mode

Skicka med parametern thinking i din API-förfrågan för att uppnå maximal noggrannhet i matematik- och kodningsuppgifter.

Starta Agent Swarm

Instruera modellen att driftsätta en svärm för forskningsuppgifter för att tvinga fram parallell orkestrering mellan sub-agents.

Optimera Temperature

Använd en temperature på 1.0 för thinking mode för att tillåta varierad reasoning, men sänk den till 0.6 för vanlig chatt.

Gemensamma vision-prompts

Ladda upp skärmdumpar på felmeddelanden tillsammans med kodavsnitt för att utnyttja modellens enhetliga träning för text och vision.

Context Caching

Använd context caching för långa dokument som återanvänds för att sänka kostnaderna för input med upp till 90 procent.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Vanliga fragor om Kimi K2.5

Hitta svar pa vanliga fragor om Kimi K2.5