Vad kostar det att använda Kimi K2.5?

Input tokens kostar 0,60 $ per miljon och output tokens kostar 3,00 $ per miljon. Denna prismodell gör den till en av de mest prisvärda frontier model-alternativen som finns tillgängliga.

Vad är den maximala context length för Kimi K2.5?

Kimi K2.5 har stöd för ett context window på 256 000 tokens. Detta gör att användare kan bearbeta hela böcker eller stora kodbaser i en enda prompt.

Kan Kimi K2.5 bearbeta videofiler?

Ja, den har en inbyggd MoonViT-3D encoder för att bearbeta långt videoinnehåll. Den kan analysera timmar av material för att hitta händelser, sammanfattningar och visuella detaljer.

Är Kimi K2.5 open-source?

Moonshot AI har släppt modellens vikter under en modifierad MIT-licens. Detta gör det möjligt för utvecklare att köra modellen på sin egen infrastruktur.

Vad är Agent Swarm-funktionen?

Det är ett orkestreringsläge där modellen styr upp till 100 parallella sub-agents. Detta används för uppgifter som kräver forskning med hög konkurrens eller redigering av flera filer samtidigt.

Hur står sig Kimi K2.5 mot Claude 3.7 Sonnet?

Kimi K2.5 erbjuder liknande reasoning-förmågor men inkluderar inbyggt videostöd och betydligt lägre prissättning. Den har även den unika arkitekturen för parallella svärmar.

Vilken hårdvara krävs för att köra Kimi K2.5 lokalt?

Den fullständiga, okvantiserade modellen kräver cirka 632 GB VRAM. De flesta lokala användare behöver använda kvantiserade versioner på hårdvara i high-end-segmentet.

Hur kommer jag åt Thinking mode via API?

Du kan aktivera det genom att lägga till ett thinking-objekt med type satt till enabled i extra_body i ditt API-anrop. Detta förbättrar prestandan vid logiktunga uppgifter.

Kimi K2.5

Upptäck Moonshot AI:s Kimi K2.5, en open-source agentic-modell med 1T parametrar, inbyggd multimodal kapacitet, 262K context window och SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27 januari 2026

Kontext

256Ktokens

Max utdata

66Ktokens

Inmatningspris

$0.60/ 1M

Utdatapris

$3.00/ 1M

Modalitet:TextImageVideo

Kapaciteter:VisionVerktygStreamingResonemang

Benchmarks

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

Visa API-dokumentation

Om Kimi K2.5

Lar dig om Kimi K2.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Kimi K2.5 är en open-source multimodal modell från Moonshot AI. Den använder en Mixture-of-Experts-arkitektur på 1 biljon parametrar där 32 miljarder parametrar är aktiva per token. Systemet förenar text-, bild- och videobearbetning genom ett enda ramverk för reasoning istället för att använda separata externa encoders för varje modalitet. Denna arkitektur gör det möjligt för modellen att hantera 256 000 tokens av context samtidigt som den behåller hög noggrannhet vid hämtning av data och logisk konsekvens över mycket långa sekvenser.

Modellen utmärker sig genom sin Agent Swarm-kapacitet. Denna funktion gör att systemet kan koordinera upp till 100 parallella sub-agents för att utföra komplex forskning eller ingenjörsuppgifter samtidigt. Genom att integrera en MoonViT-3D encoder på 400 miljoner parametrar kan K2.5 analysera flera timmars videoinnehåll med temporal precision. Den är specifikt utformad för autonom exekvering och överträffar många proprietära modeller i agentic-benchmarks som SWE-Bench och BrowseComp.

Kimi K2.5 tillhandahåller ett dedikerat Thinking mode för uppgifter som kräver djup logik. När det är aktiverat genererar modellen en intern logikkedja för att självkorrigera och verifiera steg innan ett slutgiltigt svar produceras. Detta gör den extremt effektiv för matematik på tävlingsnivå och storskalig mjukvaruutveckling. Dess token-ekonomi är optimerad för företagsdriftsättning och erbjuder frontier-nivå av intelligens till en bråkdel av kostnaden för konkurrerande closed-source-system.

Anvandningsfall for Kimi K2.5

Upptack de olika satten du kan anvanda Kimi K2.5 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Lösa komplexa GitHub-issues och bygga arkitektur för projekt med flera filer med hjälp av SWE-Bench-optimerad logik.

Visuell webbutveckling

Skapa funktionell frontend-kod och UI-design direkt från skärminspelningar av befintliga webbplatsinteraktioner.

Forskning med flera trådar

Använda Agent Swarm för att söka igenom och sammanställa information från över 100 källor i ett enda parallellt arbetsflöde.

Analys av lång video

Extrahera specifika händelser och tidsdata från timmar av säkerhets- eller föreläsningsmaterial utan verktyg för bildruteextrahering.

Generering av matematiska bevis

Använda deep thinking-läget för att lösa matematiska problem på olympiadnivå med 96 procents noggrannhet.

Dokumentautomatisering för företag

Generera PDF-rapporter på flera sidor och komplexa finansiella kalkylblad från ostrukturerade affärsdatakällor.

Styrkor

Begransningar

Överlägsen agentic-prestanda: Får 76.8 på SWE-Bench Verified, vilket överträffar många proprietära frontier models inom mjukvaruutveckling.

Extrema krav på lokalt VRAM: Kräver 632 GB VRAM för den fullständiga okvantiserade modellen, vilket gör lokal körning omöjlig för de flesta konsumenter.

Oöverträffad token-ekonomi: Ger 1T parameter MoE-intelligens till 0,60 $ per miljon input tokens, ungefär 10 procent av kostnaden för Claude Opus.

Högre latency vid reasoning: Thinking mode kan introducera märkbara fördröjningar eftersom modellen genererar interna logikkedjor innan den svarar.

Inbyggd videoförståelse: Bearbetar komplexa videofiler utan extern bildruteextrahering, vilket möjliggör exakt tidsanalys av långa inspelningar.

Repetitiv formatering: Kan producera extremt långa textväggar om den inte strikt instrueras att använda specifika styckestrukturer.

Orkestrering med parallella svärmar: Den enda öppna modellen som tränats för att koordinera upp till 100 sub-agents för massiva forskningsflöden med flera trådar.

Oro för datalagring: Den primära infrastrukturen finns i Kina, vilket kan skapa efterlevnadsproblem för vissa västerländska företag.

API snabbstart

fireworks/kimi-k2p5

Visa dokumentation

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Kimi K2.5

Se vad communityt tycker om Kimi K2.5

“Kimi K2.5 kostar nästan 10 procent av vad Opus kostar på en liknande prestandanivå.”

— Odd_Tumbleweed574

“Folk glömmer att Nvidia förlorade 600 miljarder dollar när ett kinesiskt labb släppte något stort med open source. Kimi gör om det igen med frontier-intelligens.”

— chetaslua

twitter

“Konceptet Attention Residuals i K2.5 är den första arkitektoniska förändringen på flera år som faktiskt löser problemet med att LLM glömmer.”

— logic_king

hackernews

“Workers AI kör stora modeller nu. Kimi K2.5 först. Det är en av de bästa open-source-modellerna där ute, även riktigt bra för kodning.”

— dok2001

twitter

“Kimi K2.5 är ett helt annat djur. Det är en smart och otrolig RP-modell, men den kan bli neurotisk om du inte använder community-förinställningar.”

— dptgreg

“Jag ersatte mitt GPT 4-arbetsflöde med Kimi K2.5 eftersom thinking mode är mer transparent och context window klarar hela mitt repo.”

— Dev_Max

Videor om Kimi K2.5

Se handledningar, recensioner och diskussioner om Kimi K2.5

“Kimmy K2.5 slår GPT 5.2 med sitt avancerade tänkande och fullkomligt krossar andra frontier models.”

“Det är den starkaste open-source-modellen för kodning hittills med 76.8 på SWE verified.”

“Agent swarm är ett skifte från en enskild agent till flera agenter som exekverar parallella arbetsflöden över upp till 1500 koordinerade steg.”

“Context window är massiv på 256k tokens, vilket räcker gott för de flesta projekt.”

“Moonshot flyttar verkligen fram gränserna för vad open weights kan prestera under tidiga 2026.”

“Den lyckades verkligen träffa Apples designestetik och skapade en snygg webbplats med animationer utifrån en video.”

“Swarm-funktionen ser väldigt cool ut och den är definitivt rolig att använda eftersom den ger ID-brickor till varje sub-agent.”

“K2.5 är mycket billigare med 60 cent per miljon input tokens och 3 dollar per miljon output tokens.”

“Den inbyggda videobearbetningen innebär att du slipper dyra externa verktyg för att bearbeta bildrutor.”

“Den här modellen förändrar spelreglerna för utvecklare som behöver autonoma agenter till en låg kostnad.”

“Moonshot uppnådde detta genom att ge varje sub-agent belöningar vid olika kritiska steg för att förhindra seriell kollaps.”

“Modellen lär sig att välja parallellism bara när det förkortar den kritiska vägen, vilket är en mycket smart innovation.”

“Kimi K2.5 ligger precis på gränsen för vad som går att köra på konsumenthårdvara med GGUF.”

“Thinking mode är otroligt robust för att lösa komplexa logiska fel i Python.”

“Att se en modell med 1 biljon parametrar släppas på detta sätt är stort för open-source-communityt.”

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter

Webbautomatisering

Smarta arbetsfloden

Kom igang gratis

Proffs-tips for Kimi K2.5

Experttips for att hjalpa dig fa ut det mesta av Kimi K2.5 och uppna battre resultat.

Aktivera Thinking Mode

Skicka med parametern thinking i din API-förfrågan för att uppnå maximal noggrannhet i matematik- och kodningsuppgifter.

Starta Agent Swarm

Instruera modellen att driftsätta en svärm för forskningsuppgifter för att tvinga fram parallell orkestrering mellan sub-agents.

Optimera Temperature

Använd en temperature på 1.0 för thinking mode för att tillåta varierad reasoning, men sänk den till 0.6 för vanlig chatt.

Gemensamma vision-prompts

Ladda upp skärmdumpar på felmeddelanden tillsammans med kodavsnitt för att utnyttja modellens enhetliga träning för text och vision.

Context Caching

Använd context caching för långa dokument som återanvänds för att sänka kostnaderna för input med upp till 90 procent.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

Vanliga fragor om Kimi K2.5

Hitta svar pa vanliga fragor om Kimi K2.5