Kimi K2.5

Upptäck Moonshot AI:s Kimi K2.5, en open-source agentic model med 1T-parameters, inbyggd multimodal-kapacitet, ett 262K context window och SOTA-reasoning.

Agentic AIMultimodalOpen-sourceReasoningMoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
Kontext
262Ktokens
Max utdata
33Ktokens
Inmatningspris
$0.60/ 1M
Utdatapris
$2.50/ 1M
Modalitet:TextImageVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
87.6%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Kimi K2.5 fick 87.6% pa detta benchmark.
HLE
50.2%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Kimi K2.5 fick 50.2% pa detta benchmark.
MMLU
92%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Kimi K2.5 fick 92% pa detta benchmark.
MMLU Pro
87.1%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Kimi K2.5 fick 87.1% pa detta benchmark.
SimpleQA
54%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Kimi K2.5 fick 54% pa detta benchmark.
IFEval
94%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Kimi K2.5 fick 94% pa detta benchmark.
AIME 2025
96.1%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Kimi K2.5 fick 96.1% pa detta benchmark.
MATH
98%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Kimi K2.5 fick 98% pa detta benchmark.
GSM8k
99%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Kimi K2.5 fick 99% pa detta benchmark.
MGSM
96%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Kimi K2.5 fick 96% pa detta benchmark.
MathVista
84.2%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Kimi K2.5 fick 84.2% pa detta benchmark.
SWE-Bench
76.8%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Kimi K2.5 fick 76.8% pa detta benchmark.
HumanEval
99%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Kimi K2.5 fick 99% pa detta benchmark.
LiveCodeBench
85%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Kimi K2.5 fick 85% pa detta benchmark.
MMMU
84%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Kimi K2.5 fick 84% pa detta benchmark.
MMMU Pro
78.5%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Kimi K2.5 fick 78.5% pa detta benchmark.
ChartQA
77.5%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Kimi K2.5 fick 77.5% pa detta benchmark.
DocVQA
88.8%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Kimi K2.5 fick 88.8% pa detta benchmark.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Kimi K2.5 fick 50.8% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Kimi K2.5 fick 12% pa detta benchmark.

Om Kimi K2.5

Lar dig om Kimi K2.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

En ny horisont inom Agentic Intelligence

Kimi K2.5 är en flagship open-source agentic model från Moonshot AI, vilket representerar ett stort språng inom enhetlig multimodal intelligens. Den är byggd på en massiv Mixture-of-Experts (MoE)-arkitektur med 1 biljon parameters och 32 miljarder aktiva parameters, och integrerar nativt text-, bild- och videobearbetning i ett enda reasoning-ramverk. Till skillnad från traditionella LLMs är K2.5 designad specifikt för autonom exekvering, med ett unikt 'Thinking'-läge som gör att den kan självkorrigera och resonera sig igenom komplexa flerstegsproblem utan mänsklig inblandning.

Arkitektoniska genombrott

Modellen introducerar en revolutionerande funktion känd som 'Agent Swarm', vilket gör det möjligt för systemet att dynamiskt koordinera upp till 100 parallella sub-agents för att lösa massiva research- eller engineering-uppgifter. Genom att uppnå toppresultat i benchmarks som SWE-Bench och AIME 2025 överbryggar Kimi K2.5 effektivt gapet mellan open-source-modeller och proprietär frontier AI, och erbjuder elitkapacitet till en bråkdel av driftskostnaden. Dess integration av MoonViT-3D-encodern möjliggör en oöverträffad videoförståelse som täcker flera timmars innehåll med hög tidslig noggrannhet.

Oöverträffad effektivitet

Bortom rå kraft fokuserar K2.5 på hållbar token-ekonomi. Genom att använda aggressiv context caching och en högt optimerad MoE-struktur levererar den prestanda som rivaliserar de dyraste stängda modellerna, samtidigt som den bibehåller en mycket konkurrenskraftig prisnivå på 0,60 $ per miljon input tokens. Detta gör den till en idealisk ryggrad för företag som vill distribuera komplexa autonoma agenter med lång kontext i stor skala.

Kimi K2.5

Anvandningsfall for Kimi K2.5

Upptack de olika satten du kan anvanda Kimi K2.5 for att uppna fantastiska resultat.

Autonom Software Engineering

Lösning av komplexa GitHub-issues och full-stack-kloning av webbplatser från visuella UI-skisser.

Matematiklösning på olympiadninvå

Hantering av avancerade matematiska bevis och tävlingsproblem med över 96 % noggrannhet på AIME 2025.

Reasoning kring långvideo

Analysera och sammanfatta innehåll från videor på upp till två timmar utan förlust av kontext eller tidslig degradering.

Dynamiska research-agenter

Använda 'Agent Swarm' för att genomföra flertrådad webbresearch och syntetisera data från hundratals källor parallellt.

Estetisk frontend-generering

Konvertera handritade UI-wireframes eller screenshots till polerad, funktionell React-kod med uttrycksfull rörelse.

Autonom terminalkontroll

Exekvera komplexa bash-kommandon och systemoperationer för att hantera serverkluster och utvecklingsmiljöer.

Styrkor

Begransningar

Elite Mathematical Reasoning: Med 96,1 % på AIME 2025 presterar den bättre än nästan alla stängda modeller i ren logisk deduktion.
Hårdvaruintensiv: Att köra den fullständiga 1T-modellen lokalt kräver ett AI-kluster i företagsklass med flera H100- eller B200-GPU:er.
Massiv parallellism: 'Agent Swarm'-funktionen tillåter 100+ sub-agents, vilket drastiskt minskar tiden för att slutföra research-uppgifter.
Thinking-latency: Aktivering av deep reasoning-läget ökar tiden till första token avsevärt jämfört med standardbehandling.
Enhetlig Multimodal-arkitektur: Bearbetar nativt 2-timmarsvideor och högupplösta bilder utan behov av separata vision-encoders.
Kunskapsgap på PhD-nivå: Resultatet på 50,2 % i 'Humanity's Last Exam' visar att det finns utrymme för förbättringar inom vetenskaplig expertis på hög nivå.
Aggressiv token-ekonomi: Med 0,60 $/1M input tokens är den ungefär 8–10 gånger billigare än jämförbara frontier models som Claude 4.5.
Regleringsfrågor: Som en kinesisk model kan API-användning och datasuveränitet vara föremål för andra regelverk för västerländska företag.

API snabbstart

fireworks/kimi-k2p5

Visa dokumentation
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Kimi K2.5

Se vad communityt tycker om Kimi K2.5

"Reasoning-kapaciteten på AIME 2025 är helt sjuk för en öppen model."
LogicLover
reddit
"Kimi K2.5 satte precis en ny ribba för förståelse av långvideo. Äntligen en model som inte glömmer början av klippet."
AI_Pioneer
x
"Att använda K2.5 som kodningsagent förändrar allt. Dess SWE-Bench-poäng är inte bara en siffra, man känner kompetensen."
DevGuru
hackernews
"Kina släppte precis Kimi K2.5 och som på beställning är prestandan i nivå med amerikanska frontier AI-modeller."
BasedTorba
x
"Kimi från Kina förstörde precis OpenAIs dröm om en biljonaffär... 8x billigare."
nrqa__
x
"Kimi K2.5 är den första modellen som faktiskt känns som en co-pilot snarare än bara en chattbox."
CodeWizard
reddit

Videor om Kimi K2.5

Se handledningar, recensioner och diskussioner om Kimi K2.5

När jag testade AIME-problemen fick Kimi K2.5 nästan allt rätt, även de som GPT-4o kämpade med.

För kodningsuppgifter är de agentic-funktionerna helt klart där den här modellen glänser jämfört med vanliga LLMs.

Att en modell med en biljon parameters är open-source är saknar motstycke på den nuvarande marknaden.

Här ser man en logisk bearbetning som matchade o1 i mina första matematiktester.

Prissättningen per token är så låg att den i princip dödar argumentet för att använda proprietära stängda modeller för basuppgifter.

Förmågan att bearbeta två timmar långa videor i ett svep utan att tappa kontext är ett enormt genombrott.

Det är inte bara en chat-model; den är designad från grunden för att använda verktyg och terminaler.

När du aktiverar Swarm-läget är parallellismen för webbresearch i princip oöverträffad.

Detta är Moonshot AI som låter världen veta att de har både beräkningskraften och talangen.

Att se den navigera i en live-terminal för att fixa en bugg är framtiden för autonom engineering.

Kimi K2.5:s hopp i BrowseComp-benchmarken tyder på att den kan navigera på webben med en nivå av envishet som vi inte sett tidigare.

Det faktum att den förenar vision- och thinking-lägen i en arkitektur är den verkliga arkitektoniska nyheten här.

Prestandan på MMLU och GSM8k bevisar att datakvaliteten som användes för träning var i toppklass.

Till skillnad från tidigare versioner lider videoförståelsen här inte av tidslig degradering.

Om du är en utvecklare gör OpenAI-kompatibiliteten att bytet till denna model för testning kräver nästan noll ansträngning.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips for Kimi K2.5

Experttips for att hjalpa dig fa ut det mesta av Kimi K2.5 och uppna battre resultat.

Utnyttja Thinking Mode

Använd uttryckligen prompten 'Think step-by-step' för att aktivera dess reasoning-läge för logik-tunga matematik- eller kodningsuppgifter.

Fördel med video-kontext

Använd modellens MoonViT-3D-encoder för att bearbeta extremt långa videor; den är utmärkt på att hitta specifika detaljer i klipp på upp till 2 timmar.

Agent-orkestrering

För stora projekt, använd swarm-funktionen för att låta K2.5 dela upp uppgifter i deluppgifter för snabbare exekvering.

Spara med Cache Hits

Strukturera dina API-anrop för att dra nytta av Moonshots aggressiva context caching för att minska input-kostnaderna med upp till 75 %.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Vanliga fragor om Kimi K2.5

Hitta svar pa vanliga fragor om Kimi K2.5