Combien coûte l'utilisation de Kimi K2.5 ?

Les tokens d'entrée coûtent 0,60 $ par million et les tokens de sortie 3,00 $ par million. Cette tarification en fait l'un des modèles de classe frontier les plus abordables du marché.

Quelle est la longueur de contexte maximale pour Kimi K2.5 ?

Kimi K2.5 prend en charge une context window de 256 000 tokens. Cela permet aux utilisateurs de traiter des livres entiers ou de larges bases de code dans un seul prompt.

Kimi K2.5 peut-il traiter des fichiers vidéo ?

Oui, il intègre un encodeur MoonViT-3D natif pour le traitement de contenu vidéo long. Il peut analyser des heures d'images pour identifier des événements, générer des résumés et détecter des détails visuels.

Kimi K2.5 est-il open-source ?

Moonshot AI a publié les poids du modèle sous une licence MIT modifiée. Cela permet aux développeurs d'héberger le modèle sur leur propre infrastructure.

Qu'est-ce que la fonctionnalité Agent Swarm ?

Il s'agit d'un mode d'orchestration où le modèle gère jusqu'à 100 sous-agents en parallèle. Il est utilisé pour les tâches nécessitant une recherche à haute concurrence ou l'édition multi-fichiers.

Comment Kimi K2.5 se compare-t-il à Claude 3.7 Sonnet ?

Kimi K2.5 offre des capacités de reasoning similaires, mais inclut un support vidéo natif et une tarification nettement inférieure. Il dispose également d'une architecture unique de swarm parallèle.

Quel matériel est requis pour exécuter Kimi K2.5 localement ?

Le modèle complet non quantifié nécessite environ 632 Go de VRAM. La plupart des utilisateurs locaux devront utiliser des versions quantifiées sur du matériel grand public haut de gamme.

Comment accéder au mode Thinking via l'API ?

Vous pouvez l'activer en ajoutant un objet « thinking » avec le type défini sur « enabled » dans l'extra_body de votre appel API. Cela améliore les performances sur les tâches nécessitant une logique poussée.

Kimi K2.5

Découvrez Kimi K2.5 de Moonshot AI, un modèle agentique open-source de 1T de paramètres avec des capacités multimodales natives, une context window de 262K et...

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27 janvier 2026

Contexte

256Ktokens

Sortie max.

66Ktokens

Prix entrée

$0.60/ 1M

Prix sortie

$3.00/ 1M

Modalité:TextImageVideo

Capacités:VisionOutilsStreamingRaisonnement

Benchmarks

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

Voir la documentation API

À propos de Kimi K2.5

Découvrez les capacités, fonctionnalités et façons d'utiliser Kimi K2.5.

Kimi K2.5 est un modèle multimodal open-source de Moonshot AI. Il utilise une architecture Mixture-of-Experts de 1 trillion de paramètres où 32 milliards de paramètres sont actifs par token. Le système unifie le traitement du texte, de l'image et de la vidéo à travers un cadre de reasoning unique plutôt que d'utiliser des encodeurs externes séparés pour chaque modalité. Cette architecture permet au modèle de gérer 256 000 tokens de contexte tout en maintenant une haute précision de récupération et une cohérence logique sur de très longues séquences.

Le modèle se distingue par sa capacité Agent Swarm. Cette fonctionnalité permet au système de coordonner jusqu'à 100 sous-agents en parallèle pour exécuter des tâches de recherche ou d'ingénierie complexes simultanément. En intégrant un encodeur MoonViT-3D de 400M de paramètres, K2.5 peut analyser plusieurs heures de contenu vidéo avec une précision temporelle. Il est spécifiquement conçu pour l'exécution autonome, surpassant de nombreux modèles propriétaires sur les benchmarks agentiques comme SWE-Bench et BrowseComp.

Kimi K2.5 propose un mode Thinking dédié aux tâches nécessitant une logique approfondie. Lorsqu'il est activé, le modèle génère une chaîne de reasoning interne pour s'autocorriger et vérifier ses étapes avant de produire une réponse finale. Cela le rend très efficace pour les mathématiques de niveau compétition et le développement logiciel à grande échelle. Son économie de tokens est optimisée pour le déploiement en entreprise, offrant une intelligence de classe frontier à une fraction du coût des systèmes fermés concurrents.

Cas d'utilisation de Kimi K2.5

Découvrez les différentes façons d'utiliser Kimi K2.5 pour obtenir d'excellents résultats.

Ingénierie logicielle autonome

Résolution de problèmes GitHub complexes et création d'architectures de projets multi-fichiers utilisant une logique optimisée pour SWE-Bench.

Développement web visuel

Création de code frontend fonctionnel et de designs UI directement à partir d'enregistrements d'écran d'interactions de sites web existants.

Recherche multi-thread

Utilisation de l'Agent Swarm pour explorer et synthétiser des informations provenant de plus de 100 sources dans un seul flux de travail parallèle.

Analyse de vidéos longues

Extraction d'événements spécifiques et de données temporelles à partir d'heures de séquences de sécurité ou de cours sans outils d'extraction d'images.

Génération de preuves mathématiques

Application du mode de deep thinking pour résoudre des problèmes mathématiques de niveau olympiade avec un taux de précision de 96 pour cent.

Automatisation documentaire en entreprise

Génération de rapports PDF de plusieurs pages et de feuilles de calcul financières complexes à partir de sources de données métier non structurées.

Points forts

Limitations

Performance agentique d'élite: Obtient un score de 76.8 sur SWE-Bench Verified, surpassant de nombreux modèles frontier propriétaires dans les tâches d'ingénierie logicielle.

Besoin extrême en VRAM locale: Nécessite 632 Go de VRAM pour le modèle complet non quantifié, rendant le déploiement local impossible pour la plupart des utilisateurs grand public.

Économie de tokens inégalée: Fournit une intelligence MoE de 1T de paramètres à 0,60 $ par million de tokens d'entrée, soit environ 10 pour cent du coût de Claude Opus.

Latence de reasoning plus élevée: Le mode thinking peut introduire des délais significatifs car le modèle génère des chaînes de logique interne avant de répondre.

Compréhension vidéo native: Traite des fichiers vidéo complexes sans extraction d'images externe, permettant une analyse temporelle précise d'enregistrements longs.

Répétition de formatage: Peut produire des blocs de texte excessivement longs si aucune instruction stricte sur la structure des paragraphes n'est donnée.

Orchestration par swarm parallèle: Le seul modèle ouvert entraîné à coordonner jusqu'à 100 sous-agents pour des workflows de recherche massifs et multi-thread.

Préoccupations liées à la résidence des données: L'infrastructure principale est basée en Chine, ce qui peut poser des problèmes de conformité pour certaines entreprises occidentales.

Démarrage rapide API

fireworks/kimi-k2p5

Voir la documentation

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de Kimi K2.5

Voyez ce que la communauté pense de Kimi K2.5

“Kimi K2.5 coûte presque 10 pour cent du prix d'Opus pour un niveau de performance similaire.”

— Odd_Tumbleweed574

“Les gens oublient que Nvidia a perdu 600 milliards de dollars lorsqu'un laboratoire chinois a rendu open-source une avancée majeure. Kimi réitère cela avec une intelligence frontier.”

— chetaslua

twitter

“Le concept d'Attention Residuals dans K2.5 est le premier changement architectural en des années qui résout réellement le problème d'oubli des LLM.”

— logic_king

hackernews

“Workers AI exécute désormais de gros modèles. Kimi K2.5 en premier. C'est l'un des meilleurs modèles open-source disponibles, très bon pour le code également.”

— dok2001

twitter

“Kimi K2.5 est une bête différente. C'est un modèle RP incroyablement intelligent, mais il peut devenir névrosé si vous n'utilisez pas les presets de la communauté.”

— dptgreg

“J'ai remplacé mon workflow GPT 4 par Kimi K2.5 car le mode thinking est plus transparent et la context window gère tout mon dépôt.”

— Dev_Max

Vidéos sur Kimi K2.5

Regardez des tutoriels, critiques et discussions sur Kimi K2.5

“Kimmy K2.5 bat GPT 5.2 avec son mode thinking élevé, surpassant littéralement les autres modèles frontier.”

“C'est le modèle de code open-source le plus puissant à ce jour avec 76.8 sur SWE-Bench Verified.”

“L'Agent swarm marque une transition du modèle mono-agent vers l'exécution multi-agent de workflows parallèles sur jusqu'à 1500 étapes coordonnées.”

“La context window est massive avec 256k tokens, ce qui est largement suffisant pour la plupart des projets.”

“Moonshot repousse vraiment les limites de ce que les open weights peuvent accomplir début 2026.”

“Il a vraiment capturé l'esthétique du design Apple et a produit un site web attrayant avec des animations juste à partir d'une vidéo.”

“La fonctionnalité Swarm est très impressionnante et amusante à utiliser car elle assigne des badges d'identification à chaque sous-agent.”

“K2.5 est beaucoup moins cher à 60 centimes par million de tokens d'entrée et 3 dollars par million de tokens de sortie.”

“Le traitement vidéo natif signifie que vous n'avez pas besoin d'utiliser des outils externes coûteux pour traiter les images.”

“Ce modèle change la donne pour les développeurs qui ont besoin d'agents autonomes avec un budget limité.”

“Moonshot a réussi cela en donnant à chaque sous-agent des récompenses à des étapes critiques distinctes pour éviter l'effondrement en série.”

“Le modèle apprend à choisir le parallélisme uniquement lorsque cela raccourcit le chemin critique, une innovation très intelligente.”

“Kimi K2.5 est à la limite de pouvoir être exécuté sur du matériel grand public en utilisant GGUF.”

“Le mode thinking est incroyablement robuste pour résoudre des erreurs logiques complexes en Python.”

“Voir un modèle de 1 trillion de paramètres publié ainsi est énorme pour la communauté open-source.”

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA

Automatisation Web

Flux Intelligents

Commencer Gratuitement

Conseils Pro pour Kimi K2.5

Conseils d'experts pour tirer le meilleur parti de Kimi K2.5.

Activer le mode Thinking

Passez le paramètre thinking dans votre requête API pour atteindre une précision maximale sur les tâches mathématiques et de code.

Déclencher l'Agent Swarm

Demandez au modèle de déployer un swarm pour les tâches de recherche afin de forcer l'orchestration parallèle entre les sous-agents.

Optimiser la Temperature

Utilisez une température de 1.0 en mode thinking pour permettre un reasoning diversifié, mais réduisez-la à 0.6 pour une conversation standard.

Prompts de vision combinée

Téléchargez des captures d'écran d'erreurs avec des snippets de code pour tirer parti de l'entraînement texte-vision unifié du modèle.

Context Caching

Utilisez le context caching pour les longs documents répétés afin de réduire les coûts d'entrée jusqu'à 90 pour cent.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

Questions Fréquentes sur Kimi K2.5

Trouvez des réponses aux questions courantes sur Kimi K2.5