moonshot

Kimi K2.7 Code

Kimi K2.7 Code — это MoE-модель с 1 трлн parameters от Moonshot AI. Она оснащена context window 262k и на 30% более эффективным reasoning для разработки ПО.

Coding FlagshipOpen WeightsMoE ArchitectureMultimodal AIReasoning Model
moonshot logomoonshotKimi12 июня 2026 г.
Контекст
262Kтокенов
Макс. вывод
262Kтокенов
Цена ввода
$0.95/ 1M
Цена вывода
$4.00/ 1M
Модальность:TextImageVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
65.8%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Kimi K2.7 Code набрал 65.8% в этом бенчмарке.
HLE
38.2%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Kimi K2.7 Code набрал 38.2% в этом бенчмарке.
MMLU
87.2%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Kimi K2.7 Code набрал 87.2% в этом бенчмарке.
MMLU Pro
71.4%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Kimi K2.7 Code набрал 71.4% в этом бенчмарке.
SimpleQA
52.4%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Kimi K2.7 Code набрал 52.4% в этом бенчмарке.
IFEval
88.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Kimi K2.7 Code набрал 88.5% в этом бенчмарке.
AIME 2025
91.5%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Kimi K2.7 Code набрал 91.5% в этом бенчмарке.
MATH
81.3%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Kimi K2.7 Code набрал 81.3% в этом бенчмарке.
GSM8k
97.2%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Kimi K2.7 Code набрал 97.2% в этом бенчмарке.
MGSM
92.4%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Kimi K2.7 Code набрал 92.4% в этом бенчмарке.
MathVista
65.5%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Kimi K2.7 Code набрал 65.5% в этом бенчмарке.
SWE-Bench
78.2%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Kimi K2.7 Code набрал 78.2% в этом бенчмарке.
HumanEval
94.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Kimi K2.7 Code набрал 94.2% в этом бенчмарке.
LiveCodeBench
68.5%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Kimi K2.7 Code набрал 68.5% в этом бенчмарке.
MMMU
72.4%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Kimi K2.7 Code набрал 72.4% в этом бенчмарке.
MMMU Pro
48.2%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Kimi K2.7 Code набрал 48.2% в этом бенчмарке.
ChartQA
84.2%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Kimi K2.7 Code набрал 84.2% в этом бенчмарке.
DocVQA
90.1%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Kimi K2.7 Code набрал 90.1% в этом бенчмарке.
Terminal-Bench
67%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Kimi K2.7 Code набрал 67% в этом бенчмарке.
ARC-AGI
12.5%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Kimi K2.7 Code набрал 12.5% в этом бенчмарке.

О модели Kimi K2.7 Code

Узнайте о возможностях, функциях и способах использования Kimi K2.7 Code.

Mixture of Experts с триллионом параметров

Kimi K2.7 Code, это последняя итерация MoE-модели Moonshot AI с триллионом parameters. Она оптимизирована для разработки программного обеспечения и агентной автоматизации. Модель активирует 32 миллиарда parameters на каждый шаг inference, что обеспечивает баланс между высоким уровнем интеллекта и скоростью работы. В ней представлен усовершенствованный механизм reasoning, который использует на 30 процентов меньше tokens для процесса мышления по сравнению с предыдущими версиями. Решение технических задач происходит быстрее и выгоднее при многоходовых диалогах.

Нативная мультимодальность и визуальный контекст

Эта модель является нативно multimodal и обрабатывает текст, изображения и видео. Её context window размером 262 144 tokens позволяет работать с большими кодовыми базами и сложными стеками вызовов. Выпуская модель с открытыми весами, Moonshot AI предоставляет разработчикам альтернативу проприетарным моделям для создания автономных AI-агентов. Она поддерживает консистентность в долгосрочных задачах программирования и преобразует визуальные макеты в функциональный код без необходимости промежуточных текстовых описаний.

Kimi K2.7 Code

Варианты использования Kimi K2.7 Code

Откройте для себя различные способы использования Kimi K2.7 Code для достижения отличных результатов.

Автономное агентное программирование

Создание многошаговых агентов, которые ориентируются в сложных структурах файлов и выполняют рефакторинг нескольких файлов через доступ к терминалу.

Перевод визуальных образов в код

Преобразование сложных UI-дизайнов или архитектурных диаграмм непосредственно в функциональный фронтенд или системный код.

Отладка с длинным горизонтом

Анализ истории всего проекта и стеков вызовов в рамках context window 262k для выявления архитектурных ошибок.

Синтез 3D-сцен

Генерация высококачественных интерактивных 3D-сред с использованием Three.js или C++ на основе описаний на естественном языке.

Контроль качества на основе видео

Анализ записей сессий экрана или видеодемонстраций для выявления визуальных багов и некорректных переходов в UI.

Модернизация устаревшего кода

Автоматизация переноса устаревших кодовых баз на современные фреймворки при сохранении целостной логической цепочки (chain-of-thought).

Преимущества

Ограничения

Высокие показатели в кодинг-бенчмарках: Набирает 78,2% в SWE-bench Verified и 94,2% в HumanEval, превосходя большинство моделей с открытыми весами.
Нестабильное форматирование C++: Иногда требуется несколько попыток для перезаписи крупных C++ файлов без внесения мелких синтаксических ошибок или ошибок форматирования.
Эффективность reasoning: Снижает накладные расходы на tokens для мышления на 30% по сравнению с предыдущими поколениями, ускоряя выполнение сложных задач.
Context window по сравнению с конкурентами: Несмотря на большой размер в 262k, это меньше, чем контекстное окно в один миллион tokens, предлагаемое Google Gemini 2.0.
Нативная поддержка видео: Одна из немногих моделей, способных напрямую обрабатывать видео для тестирования интерфейсов и визуальной отладки.
Стабильность headless-браузера: Автономные QA-конвейеры, использующие headless Chrome, иногда могут зависать во время длительных этапов проверки.
Соотношение цена/производительность: Обеспечивает производительность уровня GPT-5.5 в задачах программирования при низкой стоимости $0,95 за миллион входных tokens.
Точность 3D-физики: Может испытывать трудности с реалистичной гравитацией или сложным трением в сгенерированных физических симуляциях, требуя ручной настройки.

Быстрый старт API

moonshot/kimi-k2.7-code

Посмотреть документацию
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Kimi K2.7 Code

Посмотрите, что думает сообщество о Kimi K2.7 Code

Kimi 2.7 заняла 2-е место после Fable 5 и перед GPT-5 xhigh... Kimi 2.7 невероятно хороша.
Przemek Chojecki
twitter
Kimi K2.7 Code сделала Kimi K2.6 мучительно устаревшей... она выдала самый реалистичный рендеринг водных волн!
GMI Cloud
twitter
Это модель №1 с открытыми весами в SWE-bench (78,2%) и Terminal-Bench 2.1.
Vals AI
twitter
Kimi-K2.7-Code теперь выпущена и доступна с открытыми весами! Улучшена производительность кодинга и агентов по сравнению с K2.6.
Kimi.ai
twitter
Она обработала 50 юридических PDF-файлов за один раз, даже не вспотев.
ThePromptEngineer
youtube
Цена упала с $20/мес до $1,5/мес при использовании API. Достойный UX.
LocalLLaMA-User
reddit

Видео о Kimi K2.7 Code

Смотрите обучающие материалы, обзоры и обсуждения о Kimi K2.7 Code

Она начала думать гораздо больше и дольше.

Версия 2.7 выдала лучшие результаты быстрее, но обходится чуть дороже по общему количеству использованных tokens.

Она глубже вникает в реализацию длинных проектов, пока не добьется успеха.

Она не просто выдает код, а сначала планирует архитектуру с помощью своих tokens мышления.

Логика в Python-скрипте была безупречной по сравнению с предыдущей версией 2.6.

По сравнению с Kimi K2.6 улучшена эффективность использования tokens, расход на мышление сократился примерно на 30%.

Процесс reasoning стал гораздо более прямолинейным, сохранив высокую точность модели.

Разрыв между ними не так велик, если учесть, что эта модель в 12,5 раз дешевле Claude Fable.

Эта модель в 12,5 раз дешевле Claude Fable при текущих ценах на API.

Результаты в SWE-bench Verified топовые для модели с открытыми весами.

Context window на 256k невероятно стабильно работает для генерации многофайловых проектов.

Она справилась с логикой C++ без обращения к документации внешних библиотек.

Процесс мышления стал гораздо более линейным, без лишних циклов.

Она построила всю структуру проекта за 15 минут, включая компоненты бэкенда.

На данный момент это лучшая модель с открытыми весами для задач программирования.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Kimi K2.7 Code

Экспертные советы для максимальной эффективности Kimi K2.7 Code.

Сохранение режима мышления

Всегда активируйте preserve_thinking в ваших API вызовах, чтобы модель использовала свою оптимизированную цепочку reasoning для логических задач.

Multimodal Prompting

Предоставляйте скриншоты ошибок или макеты UI вместе с текстовыми инструкциями, чтобы повысить точность генерации кода.

Управление бюджетом контекста

Размещайте критически важные инструкции в начале или в конце prompt для более надежного выполнения задач.

Интеграция с CLI

Используйте официальный Kimi Code CLI для локальной разработки, чтобы задействовать встроенные возможности модели по взаимодействию с локальной средой.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Часто задаваемые вопросы о Kimi K2.7 Code

Найдите ответы на частые вопросы о Kimi K2.7 Code