Hvad koster det at bruge Kimi K2.5?

Input tokens koster $0,60 pr. million, og output tokens koster $3,00 pr. million. Denne prisstruktur gør den til en af de mest prisvenlige frontier model-løsninger på markedet.

Hvad er den maksimale context length for Kimi K2.5?

Kimi K2.5 understøtter en context window på 256.000 tokens. Dette gør det muligt for brugere at behandle hele bøger eller store kodebaser i én prompt.

Kan Kimi K2.5 behandle videofiler?

Ja, den indeholder en indbygget MoonViT-3D encoder til behandling af langt videoindhold. Den kan analysere timers optagelser for begivenheder, resuméer og visuelle detaljer.

Er Kimi K2.5 open-source?

Moonshot AI har frigivet modellens vægte under en modificeret MIT License. Dette giver udviklere mulighed for at hoste modellen på deres egen infrastruktur.

Hvad er Agent Swarm-funktionen?

Det er en orkestreringstilstand, hvor modellen styrer op til 100 parallelle sub-agents. Dette bruges til opgaver, der kræver research med høj samtidighed eller redigering af mange filer.

Hvordan sammenlignes Kimi K2.5 med Claude 3.7 Sonnet?

Kimi K2.5 tilbyder lignende reasoning-kapaciteter, men inkluderer native video-understøttelse og væsentligt lavere priser. Den har også den unikke parallelle swarm-arkitektur.

Hvilken hardware kræves for at køre Kimi K2.5 lokalt?

Den fulde ukvantiserede model kræver cirka 632GB VRAM. De fleste lokale brugere vil have brug for at benytte kvantiserede versioner på high-end consumer hardware.

Hvordan får jeg adgang til Thinking-tilstand via API?

Du kan aktivere det ved at tilføje et thinking-objekt med type sat til enabled i extra_body af dit API-kald. Dette forbedrer ydeevnen ved logiktunge opgaver.

Kimi K2.5

Opdag Moonshot AI's Kimi K2.5, en 1T-parameter open-source agentic model med native multimodale funktioner, 262K context window og SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27. januar 2026

Kontekst

256Ktokens

Maks output

66Ktokens

Input-pris

$0.60/ 1M

Output-pris

$3.00/ 1M

Modalitet:TextImageVideo

Funktioner:VisionVærktøjerStreamingRæsonnering

Benchmarks

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

Se API-dokumentation

Om Kimi K2.5

Lær om Kimi K2.5s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Kimi K2.5 er en open-source multimodal model fra Moonshot AI. Den benytter en 1 billion parameter Mixture-of-Experts arkitektur, hvor 32 milliarder parametre er aktive pr. token. Systemet forener tekst-, billede- og videobehandling gennem en enkelt reasoning-ramme i stedet for at bruge separate eksterne encodere for hver modalitet. Denne arkitektur gør det muligt for modellen at håndtere 256.000 tokens context, mens den opretholder høj præcision i genfinding og logisk konsistens på tværs af meget lange sekvenser.

Modellen udmærker sig ved sin Agent Swarm-kapacitet. Denne funktion gør det muligt for systemet at koordinere op til 100 parallelle sub-agents til at udføre komplekse research- eller ingeniøropgaver simultant. Ved at integrere en 400M parameter MoonViT-3D encoder kan K2.5 analysere flere timers videoindhold med temporal præcision. Den er specifikt designet til autonom eksekvering og overgår mange proprietære modeller på agentic benchmarks som SWE-Bench og BrowseComp.

Kimi K2.5 tilbyder en dedikeret Thinking-tilstand til opgaver, der kræver dyb logik. Når den er aktiveret, genererer modellen en intern reasoning-kæde til at selvrettelse og verificere trin, før den producerer et endeligt svar. Dette gør den yderst effektiv til matematik på konkurrenceniveau og softwareudvikling i stor skala. Dens token-økonomi er optimeret til virksomhedsimplementering og tilbyder intelligens på frontier-niveau til en brøkdel af prisen for konkurrerende closed-source systemer.

Anvendelser for Kimi K2.5

Opdag de forskellige måder, du kan bruge Kimi K2.5 til at opnå gode resultater.

Autonom softwareudvikling

Løsning af komplekse GitHub-issues og opbygning af projektarkitekturer med flere filer ved hjælp af SWE-Bench-optimeret logik.

Visuel webudvikling

Oprettelse af funktionel frontend-kode og UI-designs direkte fra skærmoptagelser af eksisterende webstedsinteraktioner.

Multi-threaded research

Brug af Agent Swarm til at crawle og syntetisere information fra over 100 kilder i en enkelt parallel arbejdsgang.

Lang videoanalyse

Udvinding af specifikke begivenheder og tidsdata fra timers sikkerheds- eller forelæsningsoptagelser uden brug af værktøjer til frame-ekstraktion.

Matematisk bevisgenerering

Brug af deep thinking-tilstanden til at løse matematiske problemer på olympiade-niveau med en præcisionsrate på 96 procent.

Automatisering af virksomhedsdokumenter

Generering af PDF-rapporter på flere sider og komplekse finansielle regneark fra ustrukturerede forretningsdatakilder.

Styrker

Begrænsninger

Elite agentic performance: Opnår 76,8 på SWE-Bench Verified, hvilket overgår mange proprietære frontier models i softwareudviklingsopgaver.

Ekstreme VRAM-behov lokalt: Kræver 632GB VRAM for den fulde ukvantiserede model, hvilket gør lokal implementering umulig for de fleste private brugere.

Uovertruffen token-økonomi: Leverer 1T parameter MoE-intelligens til $0,60 pr. million input tokens, cirka 10 procent af prisen for Claude Opus.

Højere reasoning-latency: Thinking-tilstanden kan introducere betydelige forsinkelser, da modellen genererer interne logikkæder før svar.

Native video-forståelse: Behandler komplekse videofiler uden ekstern frame-ekstraktion, hvilket muliggør præcis temporal analyse af lange optagelser.

Repetitiv formatering: Kan producere ekstremt lange tekstvægge, medmindre den specifikt instrueres i at bruge bestemte afsnitsstrukturer.

Parallel Swarm-orkestrering: Den eneste åbne model trænet til at koordinere op til 100 sub-agents til massive, multi-threaded research-arbejdsgange.

Bekymringer om datalagring: Den primære infrastruktur er baseret i Kina, hvilket kan give overholdelsesudfordringer for visse vestlige virksomheder.

API hurtig start

fireworks/kimi-k2p5

Se dokumentation

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Kimi K2.5

Se hvad fællesskabet mener om Kimi K2.5

“Kimi K2.5 koster næsten 10 procent af, hvad Opus koster ved samme præstationsniveau.”

— Odd_Tumbleweed574

“Folk glemmer, at Nvidia tabte 600 milliarder dollars, da et kinesisk laboratorium open-sourcede noget stort. Kimi gør det igen med frontier intelligence.”

— chetaslua

twitter

“Attention Residuals-konceptet i K2.5 er den første arkitektoniske ændring i årevis, der faktisk løser glemselsproblemet i LLM.”

— logic_king

hackernews

“Workers AI kører store modeller nu. Kimi K2.5 først. Det er en af de bedste open-source modeller derude, meget god til kodning også.”

— dok2001

twitter

“Kimi K2.5 er et andet bæst. Det er en smart utrolig RP-model, men den kan blive neurotisk, hvis du ikke bruger community-presets.”

— dptgreg

“Jeg udskiftede mit GPT 4-workflow med Kimi K2.5, fordi thinking-tilstanden er mere gennemsigtig, og context window håndterer hele mit repo.”

— Dev_Max

Videoer om Kimi K2.5

Se vejledninger, anmeldelser og diskussioner om Kimi K2.5

“Kimmy K2.5 slår GPT 5.2 med high thinking og knuser fuldstændig de andre frontier models.”

“Det er den stærkeste open-source kodningsmodel til dato med 76,8 på SWE verified.”

“Agent swarm er et skift fra single agent til multi-agent, der eksekverer parallelle workflows på tværs af op til 1500 koordinerede trin.”

“Dets context window er massivt på 256k tokens, hvilket er rigeligt til de fleste projekter.”

“Moonshot flytter virkelig grænserne for, hvad open weights kan præstere i starten af 2026.”

“Den ramte virkelig hele Apples designæstetik og producerede et flot website med animationer udelukkende fra en video.”

“Swarm-funktionen ser meget cool ud, og det er sjovt at bruge, da den tildeler ID-badges til hver sub-agent.”

“K2.5 er meget billigere med 60 cents pr. million input tokens og 3 dollars pr. million output tokens.”

“Den indbyggede videobehandling betyder, at du ikke behøver at bruge dyre eksterne værktøjer til at behandle frames.”

“Denne model er en game changer for udviklere, der har brug for autonome agenter på et budget.”

“Moonshot opnåede dette ved at give hver sub-agent belønninger ved separate kritiske trin for at forhindre seriel kollaps.”

“Modellen lærer kun at vælge parallelitet, når det afkorter den kritiske sti, hvilket er en meget smart innovation.”

“Kimi K2.5 er lige på grænsen til at kunne køre på forbrugerhardware ved hjælp af GGUF.”

“Thinking-tilstanden er utrolig robust til at løse komplekse logiske fejl i Python.”

“At se en model med 1 billion parametre frigivet på denne måde er kæmpe for open-source miljøet.”

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter

Webautomatisering

Smarte arbejdsgange

Kom i gang gratis

Pro-tips til Kimi K2.5

Eksperttips til at hjælpe dig med at få mest muligt ud af Kimi K2.5 og opnå bedre resultater.

Aktivér Thinking-tilstand

Send thinking-parameteren i din API-anmodning for at opnå maksimal præcision ved matematik- og kodningsopgaver.

Start Agent Swarm

Instruér modellen i at deploye et swarm til research-opgaver for at tvinge parallel orkestrering på tværs af sub-agents.

Optimér temperaturen

Brug en temperature på 1,0 til thinking-tilstand for at tillade varieret reasoning, men sænk den til 0,6 til almindelig chat.

Joint Vision Prompts

Upload skærmbilleder af fejl sammen med kodebidder for at udnytte modellens forenede text-vision træning.

Context Caching

Benyt context caching til gentagne lange dokumenter for at reducere input-omkostninger med op til 90 procent.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

Ofte stillede spørgsmål om Kimi K2.5

Find svar på almindelige spørgsmål om Kimi K2.5