Quanto costa utilizzare Kimi K2.5?

I token di input costano $0,60 per milione e i token di output costano $3,00 per milione. Questo prezzo lo rende uno dei modelli di classe frontier più convenienti disponibili.

Qual è la lunghezza massima del contesto per Kimi K2.5?

Kimi K2.5 supporta una context window di 256.000 tokens. Ciò consente agli utenti di elaborare interi libri o ampie codebase in un unico prompt.

Kimi K2.5 può elaborare file video?

Sì, è dotato di un encoder nativo MoonViT-3D per l'elaborazione di contenuti video lunghi. Può analizzare ore di filmati per eventi, riepiloghi e dettagli visivi.

Kimi K2.5 è open-source?

Moonshot AI ha rilasciato i pesi del modello con una licenza MIT modificata. Ciò consente agli sviluppatori di ospitare il modello sulla propria infrastruttura.

Cos'è la funzionalità Agent Swarm?

Si tratta di una modalità di orchestrazione in cui il modello gestisce fino a 100 sub-agent in parallelo. Viene utilizzata per attività che richiedono ricerca ad alta concorrenza o modifica multi-file.

Come si confronta Kimi K2.5 con Claude 3.7 Sonnet?

Kimi K2.5 offre capacità di reasoning simili, ma include il supporto video nativo e un prezzo significativamente inferiore. Presenta inoltre l'esclusiva architettura swarm parallela.

Quale hardware è necessario per eseguire Kimi K2.5 localmente?

Il modello completo non quantizzato richiede circa 632GB di VRAM. La maggior parte degli utenti locali dovrà utilizzare versioni quantizzate su hardware consumer di fascia alta.

Come posso accedere alla modalità Thinking tramite API?

È possibile abilitarla aggiungendo un oggetto thinking con tipo impostato su enabled nell'extra_body della chiamata API. Ciò migliora le prestazioni in attività complesse dal punto di vista logico.

Kimi K2.5

Scopri Kimi K2.5 di Moonshot AI, un modello agentic open-source da 1T di parametri con funzionalità multimodali native, context window di 262K e SOTA reasoning.

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27 gennaio 2026

Contesto

256Ktoken

Output max

66Ktoken

Prezzo input

$0.60/ 1M

Prezzo output

$3.00/ 1M

Modalita:TextImageVideo

Capacita:VisioneStrumentiStreamingRagionamento

Benchmark

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

Visualizza documentazione API

Informazioni su Kimi K2.5

Scopri le capacita di Kimi K2.5, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Kimi K2.5 è un modello multimodale open-source di Moonshot AI. Utilizza un'architettura Mixture-of-Experts da 1 trilione di parametri in cui 32 miliardi di parametri sono attivi per token. Il sistema unifica l'elaborazione di testo, immagini e video attraverso un unico framework di reasoning anziché utilizzare encoder esterni separati per ogni modalità. Questa architettura consente al modello di gestire 256.000 token di contesto mantenendo un'elevata precisione di recupero e coerenza logica su sequenze molto lunghe.

Il modello si distingue per la sua capacità Agent Swarm. Questa funzionalità consente al sistema di coordinare fino a 100 sub-agent paralleli per eseguire simultaneamente attività complesse di ricerca o ingegneria. Integrando un encoder MoonViT-3D da 400M di parametri, K2.5 può analizzare diverse ore di contenuti video con precisione temporale. È progettato specificamente per l'esecuzione autonoma, superando molti modelli proprietari su benchmark agentic come SWE-Bench e BrowseComp.

Kimi K2.5 fornisce una modalità Thinking dedicata per le attività che richiedono una logica profonda. Quando abilitata, il modello genera una catena di ragionamento interna per autocorreggersi e verificare i passaggi prima di produrre una risposta finale. Ciò lo rende altamente efficace per la matematica di livello competitivo e lo sviluppo software su larga scala. La sua economia dei token è ottimizzata per il deployment aziendale, offrendo un'intelligenza di livello frontier a una frazione del costo dei sistemi closed-source concorrenti.

Casi d'uso per Kimi K2.5

Scopri i diversi modi in cui puoi usare Kimi K2.5 per ottenere ottimi risultati.

Ingegneria del software autonoma

Risoluzione di problemi complessi su GitHub e creazione di architetture di progetto multi-file utilizzando logiche ottimizzate per SWE-Bench.

Sviluppo web visuale

Creazione di codice frontend funzionale e design UI direttamente da registrazioni dello schermo di interazioni esistenti con siti web.

Ricerca multi-thread

Utilizzo di Agent Swarm per scansionare e sintetizzare informazioni da oltre 100 fonti in un unico workflow parallelo.

Analisi video lunga

Estrazione di eventi specifici e dati temporali da ore di riprese di sicurezza o lezioni senza utilizzare strumenti di estrazione frame.

Generazione di prove matematiche

Applicazione della modalità deep thinking per risolvere problemi di matematica a livello di olimpiadi con un tasso di precisione del 96 percento.

Automazione documentale aziendale

Generazione di report PDF multipagina e fogli di calcolo finanziari complessi partendo da fonti di dati aziendali non strutturati.

Punti di forza

Limitazioni

Prestazioni Agentic d'élite: Ottiene un punteggio di 76.8 su SWE-Bench Verified, superando molti modelli frontier proprietari nelle attività di ingegneria del software.

Esigenze estreme di VRAM locale: Richiede 632GB di VRAM per il modello completo non quantizzato, rendendo il deployment locale impossibile per la maggior parte degli utenti consumer.

Economia dei token senza pari: Fornisce un'intelligenza MoE da 1T di parametri a $0,60 per milione di token di input, circa il 10 percento del costo di Claude Opus.

Maggiore latenza di reasoning: La modalità Thinking può introdurre ritardi significativi mentre il modello genera catene logiche interne prima di rispondere.

Comprensione video nativa: Elabora file video complessi senza estrazione di frame esterna, consentendo un'analisi temporale precisa di registrazioni lunghe.

Ripetizione nella formattazione: Può produrre muri di testo eccessivamente lunghi a meno che non venga istruito rigorosamente a utilizzare strutture di paragrafo specifiche.

Orchestrazione swarm parallela: L'unico modello aperto addestrato a coordinare fino a 100 sub-agent per flussi di lavoro di ricerca massicci e multi-thread.

Preoccupazioni sulla residenza dei dati: L'infrastruttura principale ha sede in Cina, il che potrebbe presentare problemi di conformità per alcune aziende occidentali.

Avvio rapido API

fireworks/kimi-k2p5

Visualizza documentazione

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Kimi K2.5

Guarda cosa pensa la community di Kimi K2.5

“Kimi K2.5 costa quasi il 10 percento di quanto costa Opus a un livello di prestazioni simile.”

— Odd_Tumbleweed574

“La gente dimentica che Nvidia ha perso 600 miliardi di dollari quando un laboratorio cinese ha rilasciato qualcosa di importante in open-source. Kimi sta facendo lo stesso con l'intelligenza frontier.”

— chetaslua

twitter

“Il concetto di Attention Residuals in K2.5 è il primo cambiamento architettonico dopo anni che risolve davvero il problema del dimenticare dell'LLM.”

— logic_king

hackernews

“Workers AI esegue grandi modelli ora. Kimi K2.5 è il primo. È uno dei migliori modelli open-source in circolazione, ottimo anche per il coding.”

— dok2001

twitter

“Kimi K2.5 è una bestia diversa. È un modello RP incredibilmente intelligente, ma può diventare nevrotico se non si utilizzano i preset della community.”

— dptgreg

“Ho sostituito il mio flusso di lavoro GPT 4 con Kimi K2.5 perché la modalità thinking è più trasparente e la context window gestisce l'intero repository.”

— Dev_Max

Video su Kimi K2.5

Guarda tutorial, recensioni e discussioni su Kimi K2.5

“Kimi K2.5 batte GPT 5.2 con un'alta capacità di thinking, distruggendo completamente gli altri modelli frontier.”

“È il modello di coding open-source più forte ad oggi con 76.8 su SWE verified.”

“Agent swarm è un passaggio dal singolo agente agli agenti multipli che eseguono flussi di lavoro paralleli su oltre 1500 passaggi coordinati.”

“La context window è massiccia a 256k tokens, che è sufficiente per la maggior parte dei progetti.”

“Moonshot sta davvero spingendo i confini di ciò che gli open weights possono fare all'inizio del 2026.”

“Ha davvero centrato l'estetica del design Apple e prodotto un sito web dall'aspetto gradevole con animazioni partendo solo da un video.”

“La funzione Swarm sembra molto bella ed è decisamente divertente da usare poiché assegna badge identificativi a ogni sub-agent.”

“K2.5 è molto più economico a 60 centesimi per milione di token di input e 3 dollari per milione di token di output.”

“L'elaborazione video nativa significa che non devi usare costosi strumenti esterni per elaborare i frame.”

“Questo modello cambia le regole del gioco per gli sviluppatori che necessitano di agenti autonomi con un budget limitato.”

“Moonshot ha raggiunto questo obiettivo dando a ciascun sub-agent ricompense in fasi critiche separate per prevenire il collasso seriale.”

“Il modello impara a scegliere il parallelismo solo quando riduce questo percorso critico, un'innovazione molto intelligente.”

“Kimi K2.5 è quasi al limite della possibilità di essere eseguito su hardware consumer utilizzando GGUF.”

“La modalità thinking è incredibilmente robusta per risolvere errori logici complessi in Python.”

“Vedere un modello da 1 trilione di parametri rilasciato in questo modo è enorme per la comunità open-source.”

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI

Automazione web

Workflow intelligenti

Inizia gratis

Consigli Pro per Kimi K2.5

Consigli esperti per aiutarti a ottenere il massimo da Kimi K2.5 e raggiungere risultati migliori.

Abilita la modalità Thinking

Passa il parametro thinking nella tua richiesta API per ottenere la massima precisione in compiti di matematica e programmazione.

Attiva Agent Swarm

Istruisci il modello a distribuire uno swarm per le attività di ricerca per forzare l'orchestrazione parallela tra i sub-agent.

Ottimizza la temperatura

Utilizza una temperatura di 1.0 per la modalità thinking per consentire un reasoning diversificato, ma abbassala a 0.6 per le chat standard.

Prompt visivi congiunti

Carica screenshot di errori insieme a snippet di codice per sfruttare l'addestramento unificato testo-visione del modello.

Context Caching

Utilizza il context caching per documenti lunghi ripetuti per ridurre i costi di input fino al 90 percento.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

Domande frequenti su Kimi K2.5

Trova risposte alle domande comuni su Kimi K2.5