moonshot

Kimi K2.7 Code

Kimi K2.7 Code ist ein 1T-parameters-MoE-Modell von Moonshot AI. Es bietet ein 262k context window und 30 % effizienteres reasoning für die Softwareentwicklung.

Coding FlagshipOpen WeightsMoE ArchitekturMultimodal AIReasoning Model
moonshot logomoonshotKimi12. Juni 2026
Kontext
262KToken
Max. Ausgabe
262KToken
Eingabepreis
$0.95/ 1M
Ausgabepreis
$4.00/ 1M
Modalität:TextImageVideo
Fähigkeiten:VisionToolsStreamingLogik
Benchmarks
GPQA
65.8%
GPQA: Wissenschafts-Q&A auf Hochschulniveau. Ein anspruchsvoller Benchmark mit 448 Multiple-Choice-Fragen in Biologie, Physik und Chemie, erstellt von Fachexperten. Doktoranden erreichen nur 65-74% Genauigkeit, während Laien selbst mit unbegrenztem Webzugang nur 34% schaffen (daher 'Google-sicher'). Kimi K2.7 Code erreichte 65.8% bei diesem Benchmark.
HLE
38.2%
HLE: Expertenwissen-Reasoning. Testet die Fähigkeit eines Modells, Expertenwissen in spezialisierten Bereichen zu demonstrieren. Bewertet tiefes Verständnis komplexer Themen, die professionelles Wissen erfordern. Kimi K2.7 Code erreichte 38.2% bei diesem Benchmark.
MMLU
87.2%
MMLU: Massives Multitask-Sprachverständnis. Ein umfassender Benchmark mit 16.000 Multiple-Choice-Fragen zu 57 akademischen Fächern wie Mathematik, Philosophie, Jura und Medizin. Testet breites Wissen und Reasoning-Fähigkeiten. Kimi K2.7 Code erreichte 87.2% bei diesem Benchmark.
MMLU Pro
71.4%
MMLU Pro: MMLU Professional Edition. Eine erweiterte Version von MMLU mit 12.032 Fragen im schwereren 10-Optionen-Format. Umfasst Mathematik, Physik, Chemie, Jura, Ingenieurwesen, Wirtschaft, Gesundheit, Psychologie, Business, Biologie, Philosophie und Informatik. Kimi K2.7 Code erreichte 71.4% bei diesem Benchmark.
SimpleQA
52.4%
SimpleQA: Faktische Genauigkeits-Benchmark. Testet die Fähigkeit eines Modells, akkurate, faktische Antworten auf einfache Fragen zu geben. Misst Zuverlässigkeit und reduziert Halluzinationen bei Wissensabruf. Kimi K2.7 Code erreichte 52.4% bei diesem Benchmark.
IFEval
88.5%
IFEval: Anweisungsbefolgungs-Evaluation. Misst, wie gut ein Modell spezifische Anweisungen und Einschränkungen befolgt. Testet die Fähigkeit, Formatierungsregeln, Längenbegrenzungen und andere explizite Anforderungen einzuhalten. Kimi K2.7 Code erreichte 88.5% bei diesem Benchmark.
AIME 2025
91.5%
AIME 2025: Amerikanische Mathematik-Olympiade. Wettbewerbsmathematik-Aufgaben aus der renommierten AIME-Prüfung für talentierte Oberstufenschüler. Testet fortgeschrittenes mathematisches Problemlösen, das abstraktes Denken erfordert. Kimi K2.7 Code erreichte 91.5% bei diesem Benchmark.
MATH
81.3%
MATH: Mathematisches Problemlösen. Ein umfassender Mathematik-Benchmark für Problemlösung in Algebra, Geometrie, Analysis und anderen mathematischen Bereichen. Erfordert mehrstufiges Reasoning und formales mathematisches Wissen. Kimi K2.7 Code erreichte 81.3% bei diesem Benchmark.
GSM8k
97.2%
GSM8k: Grundschul-Mathematik 8K. 8.500 Mathematik-Textaufgaben auf Grundschulniveau, die mehrstufiges Reasoning erfordern. Testet grundlegende Arithmetik und logisches Denken durch Alltagsszenarien. Kimi K2.7 Code erreichte 97.2% bei diesem Benchmark.
MGSM
92.4%
MGSM: Mehrsprachige Grundschul-Mathematik. Der GSM8k-Benchmark übersetzt in 10 Sprachen inkl. Spanisch, Französisch, Deutsch, Russisch, Chinesisch und Japanisch. Testet mathematisches Reasoning in verschiedenen Sprachen. Kimi K2.7 Code erreichte 92.4% bei diesem Benchmark.
MathVista
65.5%
MathVista: Mathematisches visuelles Reasoning. Testet die Fähigkeit, mathematische Probleme mit visuellen Elementen wie Diagrammen, Graphen, Geometriefiguren und wissenschaftlichen Abbildungen zu lösen. Kimi K2.7 Code erreichte 65.5% bei diesem Benchmark.
SWE-Bench
78.2%
SWE-Bench: Software-Engineering-Benchmark. KI-Modelle versuchen, echte GitHub-Issues in Open-Source-Python-Projekten zu lösen, mit menschlicher Verifizierung. Testet praktische Software-Engineering-Fähigkeiten. Top-Modelle stiegen von 4,4% (2023) auf über 70% (2024). Kimi K2.7 Code erreichte 78.2% bei diesem Benchmark.
HumanEval
94.2%
HumanEval: Python-Programmieraufgaben. 164 handgeschriebene Programmieraufgaben, bei denen Modelle korrekte Python-Funktionsimplementierungen generieren müssen. Jede Lösung wird durch Unit-Tests verifiziert. Top-Modelle erreichen heute 90%+. Kimi K2.7 Code erreichte 94.2% bei diesem Benchmark.
LiveCodeBench
68.5%
LiveCodeBench: Live-Coding-Benchmark. Testet Programmierfähigkeiten mit kontinuierlich aktualisierten, realen Programmieraufgaben. Anders als statische Benchmarks verwendet er frische Aufgaben, um Datenkontamination zu verhindern. Kimi K2.7 Code erreichte 68.5% bei diesem Benchmark.
MMMU
72.4%
MMMU: Multimodales Verständnis. Massive Multi-Disziplin Multimodales Verständnis Benchmark, der Vision-Sprach-Modelle bei Hochschulaufgaben in 30 Fächern testet, die sowohl Bildverständnis als auch Expertenwissen erfordern. Kimi K2.7 Code erreichte 72.4% bei diesem Benchmark.
MMMU Pro
48.2%
MMMU Pro: MMMU Professional Edition. Erweiterte Version von MMMU mit anspruchsvolleren Fragen und strengerer Bewertung. Testet fortgeschrittenes multimodales Reasoning auf professionellem und Expertenniveau. Kimi K2.7 Code erreichte 48.2% bei diesem Benchmark.
ChartQA
84.2%
ChartQA: Diagramm-Fragebeantwortung. Testet die Fähigkeit, Informationen in Diagrammen und Graphen zu verstehen und zu analysieren. Erfordert Datenextraktion, Wertevergleiche und Berechnungen aus visuellen Darstellungen. Kimi K2.7 Code erreichte 84.2% bei diesem Benchmark.
DocVQA
90.1%
DocVQA: Dokument-Visuelle Q&A. Dokument Visual Question Answering Benchmark, der die Fähigkeit testet, Informationen aus Dokumentbildern inkl. Formularen, Berichten und gescanntem Text zu extrahieren und zu analysieren. Kimi K2.7 Code erreichte 90.1% bei diesem Benchmark.
Terminal-Bench
67%
Terminal-Bench: Terminal/CLI-Aufgaben. Testet die Fähigkeit, Kommandozeilen-Operationen auszuführen, Shell-Skripte zu schreiben und in Terminal-Umgebungen zu navigieren. Misst praktische Systemadministrations- und Entwickler-Workflow-Fähigkeiten. Kimi K2.7 Code erreichte 67% bei diesem Benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstraktion & Reasoning. Abstraction and Reasoning Corpus für AGI - testet fluide Intelligenz durch neuartige Mustererkennungs-Puzzles. Jede Aufgabe erfordert das Entdecken der zugrundeliegenden Regel aus Beispielen und misst allgemeine Reasoning-Fähigkeit statt Auswendiglernen. Kimi K2.7 Code erreichte 12.5% bei diesem Benchmark.

Über Kimi K2.7 Code

Erfahren Sie mehr über die Fähigkeiten, Funktionen und Einsatzmöglichkeiten von Kimi K2.7 Code.

Mixture of Experts mit 1 Billion parameters

Kimi K2.7 Code ist die neueste Iteration von Moonshot AIs Mixture of Experts (MoE) Modell mit 1 Billion parameters. Es ist für Softwareentwicklung und agentic Automatisierung optimiert. Das Modell aktiviert 32 Milliarden parameters pro inference-Schritt, was hohe Intelligenz mit operativer Geschwindigkeit in Einklang bringt. Es führt einen verfeinerten reasoning-Mechanismus ein, der im Vergleich zu früheren Versionen 30 Prozent weniger tokens zum Nachdenken benötigt. Technische Problemlösungen sind für mehrstufige Konversationen schneller und kostengünstiger.

Native Multimodalität und visueller Context

Dieses Modell ist nativ multimodal und verarbeitet Text-, Bild- und Video-Inputs. Sein 262.144 tokens großes context window bewältigt große Codebasen und komplexe Stack-Traces. Durch die Veröffentlichung des Modells als open-weights bietet Moonshot AI Entwicklern, die autonome KI-agents erstellen, eine Alternative zu proprietären frontier modellen. Es wahrt Konsistenz bei langfristigen Coding-Aufgaben und übersetzt visuelle Designs in funktionalen Code, ohne dass zwischenzeitliche Textbeschreibungen erforderlich sind.

Kimi K2.7 Code

Anwendungsfälle für Kimi K2.7 Code

Entdecken Sie die verschiedenen Möglichkeiten, Kimi K2.7 Code für großartige Ergebnisse zu nutzen.

Autonome agentic Programmierung

Unterstützung von mehrstufigen agents, die komplexe Dateistrukturen navigieren und Refactorings über mehrere Dateien hinweg per Terminalzugriff ausführen.

Visual-to-Code Übersetzung

Umwandlung komplexer UI-Designs oder Architekturdiagramme direkt in funktionalen Frontend- oder Systemcode.

Langfristiges Debugging

Analyse vollständiger Projekthistorien und Stack-Traces innerhalb des 262k context window, um Architekturfehler zu identifizieren.

3D-Szenensynthese

Generierung hochpräziser interaktiver 3D-Umgebungen mittels Three.js oder C++ aus natürlichsprachlichen Beschreibungen.

Videobasierte Qualitätssicherung

Analyse aufgezeichneter Bildschirmsitzungen oder Videodemos zur Identifizierung visueller Fehler und inkonsistenter UI-Übergänge.

Modernisierung von Altsystemen

Automatisierung der Migration alter Codebasen auf moderne Frameworks durch Beibehaltung einer konsistenten chain-of-thought.

Stärken

Einschränkungen

Erstklassige Coding-Benchmarks: Erreicht 78,2 Prozent bei SWE-bench Verified und 94,2 Prozent bei HumanEval und übertrifft damit die meisten open-weights Modelle.
Inkonsistente C++ Formatierung: Kann mehrere Versuche erfordern, große C++-Dateien neu zu schreiben, ohne kleinere Syntax- oder Formatierungsfehler einzuführen.
Reasoning Effizienz: Reduziert den Overhead durch thinking-tokens um 30 Prozent gegenüber früheren Generationen, was komplexe Zyklen beschleunigt.
Context Window im Vergleich: Obwohl 262k umfangreich ist, liegt es hinter den Ein-Million-token-context-windows von Google Gemini 2.0 zurück.
Native Video-Unterstützung: Eines der wenigen Modelle, das direkten Video-Input für UI-Tests und visuelles Debugging verarbeiten kann.
Stabilität bei Headless-Browsern: Autonome QA-Pipelines, die Headless-Chrome verwenden, können bei langen Verifizierungsschritten gelegentlich hängen bleiben.
Preis-Leistungs-Verhältnis: Liefert GPT-5.5-Leistung bei Coding-Aufgaben zu niedrigen Kosten von 0,95 $ pro Million Input-tokens.
Präzision bei 3D-Physik: Kann bei realistischer Schwerkraft oder komplexer Reibung in generierten physikalischen Simulationen Schwierigkeiten haben, was manuelle Nachjustierungen erfordert.

API-Schnellstart

moonshot/kimi-k2.7-code

Dokumentation anzeigen
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Installieren Sie das SDK und beginnen Sie in wenigen Minuten mit API-Aufrufen.

Was die Leute über Kimi K2.7 Code sagen

Sehen Sie, was die Community über Kimi K2.7 Code denkt

Kimi 2.7 belegte den 2. Platz nach Fable 5 und vor GPT-5 xhigh... Kimi 2.7 ist erstaunlich gut.
Przemek Chojecki
twitter
Kimi K2.7 Code hat Kimi K2.6 gerade schmerzhaft veraltet aussehen lassen... es lieferte die realistischste Darstellung von Wasserwellen!
GMI Cloud
twitter
Es ist das Nr. 1 open-weights-Modell auf SWE-bench (78,2 %) und Terminal-Bench 2.1.
Vals AI
twitter
Kimi-K2.7-Code ist jetzt veröffentlicht und open-sourced! Verbesserte Coding- und agent-Leistung gegenüber K2.6.
Kimi.ai
twitter
Es hat 50 juristische PDFs auf einen Schlag ohne Probleme bewältigt.
ThePromptEngineer
youtube
Der Preis sinkt von 20 $/Monat auf 1,5 $/Monat mit der API. Anständige UX.
LocalLLaMA-User
reddit

Videos über Kimi K2.7 Code

Schauen Sie Tutorials, Rezensionen und Diskussionen über Kimi K2.7 Code

Es hat angefangen, deutlich mehr und deutlich länger nachzudenken.

2.7 lieferte bessere Ergebnisse, war schneller, aber bei den insgesamt genutzten tokens etwas teurer.

Es ist tiefer in die Logik längerer Projektimplementierungen eingestiegen, bis es tatsächlich erfolgreich war.

Es gibt nicht nur Code aus, sondern plant die Architektur zuerst in seinen thinking tokens.

Die Logik im Python-Skript war makellos im Vergleich zur vorherigen 2.6-Version.

Es hat die token-Effizienz gegenüber Kimi K2.6 verbessert und den Verbrauch von thinking-tokens um etwa 30 % gesenkt.

Der reasoning-Prozess ist viel direkter, wobei die hohe Erfolgsrate des Modells beibehalten wurde.

Die Lücke zwischen den beiden Modellen ist nicht riesig, wenn man bedenkt, dass dieses Modell 12,5-mal günstiger ist als Claude Fable.

Dieses Modell ist zu den aktuellen API-Preisen 12,5-mal günstiger als Claude Fable.

Die Leistung bei SWE-bench Verified ist erstklassig für eine open-weights-Veröffentlichung.

Das 256k context window ist unglaublich stabil für die Generierung von Projekten mit mehreren Dateien.

Es hat die C++-Logik ohne externe Bibliotheksdokumentation bewältigt.

Der reasoning-Prozess ist jetzt viel linearer und ohne redundante Schleifen.

Es hat die gesamte Projektstruktur in 15 Minuten erstellt, einschließlich der Backend-Komponenten.

Es ist das derzeit beste open-weights-Modell für Coding-Aufgaben auf dem Markt.

Mehr als nur Prompts

Optimieren Sie Ihren Workflow mit KI-Automatisierung

Automatio kombiniert die Kraft von KI-Agenten, Web-Automatisierung und intelligenten Integrationen, um Ihnen zu helfen, mehr in weniger Zeit zu erreichen.

KI-Agenten
Web-Automatisierung
Intelligente Workflows

Pro-Tipps für Kimi K2.7 Code

Expertentipps, um das Beste aus Kimi K2.7 Code herauszuholen.

Thinking Mode beibehalten

Aktivieren Sie immer preserve_thinking in Ihren API-Aufrufen, um sicherzustellen, dass das Modell seine optimierte reasoning chain für die Logik nutzt.

Multimodales Prompting

Stellen Sie Screenshots von aktuellen Fehlern oder UI-Mockups zusammen mit textbasierten Anweisungen bereit, um die Erfolgsrate bei der Code-Generierung zu erhöhen.

Context Budget verwalten

Platzieren Sie leistungskritische Anweisungen am Anfang oder Ende des prompt, um eine zuverlässigere Befehlsausführung zu gewährleisten.

CLI Integration

Verwenden Sie die offizielle Kimi Code CLI für die lokale Entwicklung, um die native Fähigkeit des Modells zur Interaktion mit lokalen Umgebungen zu nutzen.

Erfahrungsberichte

Was Unsere Nutzer Sagen

Schliessen Sie sich Tausenden zufriedener Nutzer an, die ihren Workflow transformiert haben

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Verwandte AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Häufig gestellte Fragen zu Kimi K2.7 Code

Finden Sie Antworten auf häufige Fragen zu Kimi K2.7 Code