Quelle est la tarification de Kimi k2.6 ?

Kimi k2.6 coûte 0,95 $ par million de tokens en entrée et 4,00 $ par million de tokens en sortie. Pour les entrées en cache, le prix descend à 0,16 $ par million de tokens.

Comment accéder à l'API de Kimi k2.6 ?

Accédez à l'API via la plateforme Moonshot AI sur platform.kimi.ai en utilisant un SDK compatible avec OpenAI. L'URL de base est https://api.moonshot.ai/v1.

Kimi k2.6 prend-il en charge les entrées vidéo ?

Oui, il prend en charge l'entrée vidéo native dans des formats tels que MP4, MOV et WEBM pour la description de scènes et l'analyse de mouvement.

Quelle est la taille de la context window ?

Le modèle prend en charge une context window de 256 000 tokens, ce qui équivaut environ à un livre de 300 pages.

Qu'est-ce qu'un modèle Thinking ?

Le mode Thinking permet au modèle de générer un raisonnement interne (chain-of-thought) avant de répondre, ce qui améliore les performances sur les tâches de logique complexe.

Kimi k2.6 est-il open-source ?

Kimi k2.6 est un modèle à open-weights, ce qui signifie que les poids sont disponibles au téléchargement sur des plateformes comme Hugging Face pour un hébergement local.

Que sont les Agent Swarms ?

Les Agent Swarms permettent au modèle de lancer 300 sous-agents en parallèle pour traiter des tâches massives impliquant 100 fichiers ou plus simultanément.

Quelles sont les configurations matérielles requises pour un hébergement local ?

L'exécution locale du modèle complet à 1T de parameters nécessite environ 600 Go de VRAM, bien que des versions quantifiées puissent fonctionner sur des configurations plus modestes.

Kimi k2.6

Kimi k2.6 est le modèle MoE 1T de parameters de Moonshot AI, doté d'une context window de 256K, d'une entrée vidéo native et de performances d'élite en codage...

ReasoningMultimodalCoding AgentOpen WeightsMoE

moonshotKimi20 avril 2026

Contexte

256Ktokens

Sortie max.

33Ktokens

Prix entrée

$0.95/ 1M

Prix sortie

$4.00/ 1M

Modalité:TextImageVideo

Capacités:VisionOutilsStreamingRaisonnement

Benchmarks

GPQA

90.5%

HLE

54%

MMLU

86.4%

MMLU Pro

84.6%

SimpleQA

43%

IFEval

89.8%

AIME 2025

97.3%

MATH

98.2%

GSM8k

97.3%

MGSM

91.5%

MathVista

67.1%

SWE-Bench

80.2%

HumanEval

92%

LiveCodeBench

83.1%

MMMU

77.3%

MMMU Pro

75.6%

ChartQA

87.4%

DocVQA

94.9%

Terminal-Bench

60.2%

ARC-AGI

68.8%

Voir la documentation API

À propos de Kimi k2.6

Découvrez les capacités, fonctionnalités et façons d'utiliser Kimi k2.6.

Conception architecturale et échelle

Kimi k2.6 est un modèle multimodal de type Mixture-of-Experts (MoE) à l'échelle du trillion de parameters. Il utilise 32 milliards de parameters actifs par token, équilibrant efficacité computationnelle et performances cognitives de haut niveau. L'architecture prend en charge le raisonnement interne par chain-of-thought, où le modèle génère des étapes de réflexion masquées avant de produire une réponse finale. Cette conception lui permet de s'attaquer à des problèmes complexes en plusieurs étapes qui bloquent généralement les grands modèles de langage standards.

Intelligence et coordination agentique

Le modèle est spécifiquement optimisé pour l'ingénierie logicielle autonome et les tâches de longue haleine. Il peut gérer des Agent Swarms allant jusqu'à 300 sous-agents parallèles, qui se coordonnent pour refactoriser de vastes bases de code ou gérer des pipelines DevOps complexes. En utilisant l'appel d'outils natif et la compréhension visuelle, Kimi k2.6 opère comme un agent autonome capable de résoudre des problèmes GitHub impliquant plusieurs fichiers et de créer des interfaces web riches en mouvement à partir de références visuelles.

Capacités multimodales

La prise en charge native des entrées vidéo et images distingue Kimi k2.6 de nombreux pairs open-weights. Il traite directement les fichiers vidéo pour effectuer l'analyse de scène, la reproduction de bugs et l'extraction de données structurées. Le modèle sert d'architecte visuel, générant des shaders 3D et des animations complexes en utilisant des bibliothèques comme Three.js et GSAP basées sur des descriptions visuelles ou des maquettes téléchargées.

Cas d'utilisation de Kimi k2.6

Découvrez les différentes façons d'utiliser Kimi k2.6 pour obtenir d'excellents résultats.

Ingénierie logicielle autonome

Résolution de problèmes GitHub complexes en coordonnant jusqu'à 300 sous-agents en parallèle sur des sessions de 12 heures.

Génération d'interfaces front-end animées

Création d'interfaces web modernes avec des shaders WebGL et GSAP à partir de simples prompts textuels ou d'images.

Analyse vidéo approfondie

Analyse d'enregistrements pour reproduire des bugs visuels, décrire des scènes ou extraire des données structurées.

Études de marché par agents

Exécution de recherches web en plusieurs étapes et appels d'outils pour synthétiser des rapports d'analyse concurrentielle à partir de centaines de sources.

Optimisation de code legacy

Identification des goulots d'étranglement dans d'anciennes bases de code en analysant les flame graphs CPU et les données d'allocation.

Résolution de problèmes scientifiques

Réponse à des questions scientifiques et mathématiques de niveau universitaire en utilisant le raisonnement assisté par Python et la vérification par outils.

Points forts

Limitations

Codage agentique supérieur: Atteint un score de 80,2 % sur SWE-Bench Verified, se plaçant parmi les modèles les plus performants pour l'ingénierie autonome.

Exigences élevées en VRAM locale: L'exécution locale nécessite 600 Go de VRAM, limitant l'auto-hébergement à des stations de travail spécialisées haut de gamme.

Échelle de coordination massive: Gère 300 sous-agents parallèles, permettant de traiter des tâches de refactoring d'entreprise en un seul passage.

Latency API régionale: L'infrastructure est optimisée pour l'Asie, ce qui peut entraîner des temps de réponse plus longs pour les utilisateurs dans les régions occidentales.

Polyvalence multimodale native: Prend en charge les entrées vidéo et images natives, permettant des flux de travail d'agents vision-langage avancés pour les tâches UI/UX.

Lacunes de restitution dans les contextes longs: Le modèle peut éprouver des difficultés à maintenir une précision parfaite aux limites extrêmes de sa buffer de 256 000 tokens.

Avantage tarifaire agressif: À 0,95 $ par million de tokens en entrée, il est nettement moins cher que les concurrents propriétaires comme Claude 3.7 ou GPT-4o.

Licence commerciale restreinte: La version open-weights utilise une licence modifiée nécessitant une conformité spécifique pour les déploiements en entreprise à grande échelle.

Démarrage rapide API

moonshotai/kimi-k2.6

Voir la documentation

moonshot SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de Kimi k2.6

Voyez ce que la communauté pense de Kimi k2.6

“Rencontrez Kimi K2.6 : Faire progresser le codage open-source. Un prompt, plus de 100 fichiers. Plus de 4 000 appels d'outils sur 12 heures d'exécution continue.”

— @Kimi_Moonshot

twitter

“Kimi 2.6 BAT Opus 4.7 et est le MEILLEUR modèle open-source au monde. C'est un très bon modèle à un coût 10x moindre.”

— @bindureddy

twitter

“Le delta de prix est ce que personne n'intègre dans ses calculs. Kimi K2.6 est 5x moins cher que Sonnet 4.6. L'écart de benchmark s'est officiellement inversé.”

— @aakashgupta

twitter

“Je l'ai testé face à un bug que j'avais. Il l'a résolu avec succès pour un peu plus de 1 $. C'était un bug difficile avec lequel Sonnet peinait.”

— @uworldhits1391

youtube

“Kimi K2.6 est transformateur, bien qu'il ait une marge d'amélioration pour la restitution sur les tâches ultra-longues. Malgré tout, 300 agents parallèles, c'est fou.”

— @Radiant-Act4707

“La série Kimi K2 marque le moment où les laboratoires open-source rivalisent enfin avec les géants propriétaires et les dépassent.”

— @zxytim

twitter

Vidéos sur Kimi k2.6

Regardez des tutoriels, critiques et discussions sur Kimi k2.6

“Kimi K2.6 ne détruira pas Claude, mais il DÉTRUIRA la tarification premium des laboratoires fermés.”

“La capacité d'essaim d'agents, avec 300 agents en parallèle, est quelque chose que nous n'avons pas encore vu dans l'open-source.”

“Le score HLE de 54,0 est le plus élevé que nous ayons vu pour un modèle à open-weights.”

“Un seul prompt peut conduire à 12 heures d'exécution continue, ce qui représente une nouvelle frontière pour les agents.”

“Il gère l'invocation d'outils en plusieurs étapes avec une stabilité qui égale les meilleurs modèles propriétaires.”

“Le modèle de vision prend en charge l'entrée vidéo native, une fonctionnalité rare même en 2026.”

“Il gère l'invocation d'outils avec un mode thinking stable qui rivalise avec la série o d'OpenAI.”

“Pour le développement front-end, les générations riches en mouvement sont nettement meilleures que sur K2.5.”

“La context window de 256K permet d'analyser des ensembles de documentation entiers en une seule fois.”

“C'est l'un des premiers modèles à montrer une véritable autonomie dans les environnements de terminal.”

“Associer K2.6 au Kimi Code CLI permet des sessions de codage autonome de plus de 12 heures.”

“Il a refactorisé un moteur financier vieux de 8 ans et a obtenu un gain de débit de 185 % de manière autonome.”

“C'est un modèle à 1 trillion de parameters, mais les parameters actifs ne sont que de 32B, le gardant rapide.”

“Les économies de coûts pour les développeurs passant de Claude à Kimi sont astronomiques.”

“Il a résolu un bug dans une bibliothèque Rust complexe qui était ouvert depuis trois mois.”

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA

Automatisation Web

Flux Intelligents

Commencer Gratuitement

Conseils Pro pour Kimi k2.6

Conseils d'experts pour tirer le meilleur parti de Kimi k2.6.

Activer l'utilisation d'outils pour le Reasoning

Les benchmark montrent que le score HLE passe de 23,9 à 54,0 lorsque le modèle a accès à des outils de recherche et de calcul externes.

Surveiller les limites de la context window

La restitution (recall) est plus précise dans les 200 000 premiers tokens du tampon de 256 000 tokens.

Utiliser le mode Thinking avec parcimonie

Désactivez le paramètre thinking pour les tâches de chat simples afin de réduire la latency et la consommation totale de tokens.

Standardiser avec des balises XML

Le modèle suit les instructions avec plus de précision lorsque le contexte et les tâches sont encapsulés dans des balises XML.

Exploiter les téléchargements vidéo natifs

Utilisez les méthodes de téléchargement de fichiers plutôt que l'encodage base64 pour les vidéos de plus de 100 Mo afin d'éviter les limites de taille de requête.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Questions Fréquentes sur Kimi k2.6

Trouvez des réponses aux questions courantes sur Kimi k2.6