moonshot

Kimi K2 Thinking

Kimi K2 Thinking — це модель reasoning з трильйоном parameters від Moonshot AI. Вона перевершує GPT-5 у HLE та підтримує 300 послідовних tool calls автономно...

moonshot logomoonshotKimi K26 листопада 2025 р.
Контекст
256Kтокенів
Макс. вивід
16Kтокенів
Ціна вводу
$0.15/ 1M
Ціна виводу
$0.15/ 1M
Модальність:Text
Можливості:ІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
93%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Kimi K2 Thinking набрав 93% у цьому бенчмарку.
HLE
44.9%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Kimi K2 Thinking набрав 44.9% у цьому бенчмарку.
MMLU
90%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Kimi K2 Thinking набрав 90% у цьому бенчмарку.
MMLU Pro
78%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Kimi K2 Thinking набрав 78% у цьому бенчмарку.
SimpleQA
55%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Kimi K2 Thinking набрав 55% у цьому бенчмарку.
IFEval
92%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Kimi K2 Thinking набрав 92% у цьому бенчмарку.
AIME 2025
99.1%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Kimi K2 Thinking набрав 99.1% у цьому бенчмарку.
MATH
99.1%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Kimi K2 Thinking набрав 99.1% у цьому бенчмарку.
GSM8k
99%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Kimi K2 Thinking набрав 99% у цьому бенчмарку.
MGSM
95%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Kimi K2 Thinking набрав 95% у цьому бенчмарку.
MathVista
75%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Kimi K2 Thinking набрав 75% у цьому бенчмарку.
SWE-Bench
71.3%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Kimi K2 Thinking набрав 71.3% у цьому бенчмарку.
HumanEval
83%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Kimi K2 Thinking набрав 83% у цьому бенчмарку.
LiveCodeBench
83.1%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Kimi K2 Thinking набрав 83.1% у цьому бенчмарку.
MMMU
80%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Kimi K2 Thinking набрав 80% у цьому бенчмарку.
MMMU Pro
60%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Kimi K2 Thinking набрав 60% у цьому бенчмарку.
ChartQA
88%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Kimi K2 Thinking набрав 88% у цьому бенчмарку.
DocVQA
94%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Kimi K2 Thinking набрав 94% у цьому бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Kimi K2 Thinking набрав 55% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Kimi K2 Thinking набрав 12% у цьому бенчмарку.

Про Kimi K2 Thinking

Дізнайтеся про можливості Kimi K2 Thinking, функції та як це може допомогти вам досягти кращих результатів.

Mixture of Experts з трильйоном parameters

Kimi K2 Thinking, це модель для reasoning з трильйоном parameters, яка використовує архітектуру Mixture-of-Experts (MoE). Розроблена Moonshot AI і випущена наприкінці 2025 року, вона активує лише 32 млрд parameters для inference, що збалансовує величезний потенціал знань з обчислювальною ефективністю. Вона спеціально розроблена як агент мислення, який масштабує свої обчислення під час фази inference для вирішення складних логічних завдань. Цей підхід дозволяє моделі аналізувати свій власний reasoning і виправляти помилки перед наданням остаточної відповіді.

Agentic Tool Use та планування

Модель вирізняється здатністю автономно обробляти до 300 послідовних tool calls. У той час як більшість стандартних мовних моделей мають проблеми з довгостроковим плануванням, K2 Thinking розроблена для agentic робочих процесів, таких як автономний вебсерфінг та багатокрокове проектування програмного забезпечення. Вона підтримує точність INT4 через Quantization-Aware Training, що дозволяє моделі підтримувати продуктивність рівня frontier під час роботи на стандартних корпоративних кластерах обладнання.

Фокус на розробниках та дослідженнях

Завдяки context window у 256K tokens, модель створена для глибоких досліджень та складних технічних завдань. Вона долає розрив у продуктивності між системами closed-source та моделями з open-weights. Її здатність вирішувати наукові запитання рівня PhD та олімпіадні математичні задачі робить її підходящим вибором для академічних досліджень, автоматизованих помічників у кодуванні та застосунків із високоточним reasoning, де логічна послідовність є головною вимогою.

Kimi K2 Thinking

Випадки використання для Kimi K2 Thinking

Відкрийте різні способи використання Kimi K2 Thinking для досягнення чудових результатів.

Складне програмне забезпечення

Вирішення реальних проблем на GitHub та проектування кодових баз з багатьма файлами за допомогою ітеративного самокоригування.

Автономні дослідницькі агенти

Виконання сотень послідовних tool calls для збору та синтезу невідомих технічних даних.

Математика олімпіадного рівня

Вирішення складних задач з геометрії та алгебри з глибокою перевіркою за допомогою chain-of-thought.

Наукові запити рівня PhD

Відповіді на експертні запитання з фізики та біології, що потребують багатокрокової логічної дедукції.

Інтерактивне керування комп'ютером

Навігація в середовищах терміналів та хмарній інфраструктурі для автоматизації робочих процесів DevOps.

Логічно насичене творче письмо

Створення довгого контенту, який вимагає суворого дотримання складних правил побудови світу.

Сильні сторони

Обмеження

State-of-the-art Reasoning: Отримує 44,9% у HLE з інструментами, перевершуючи великі closed-source моделі в логіці експертного рівня.
Масивні вимоги до ресурсів: Локальний inference потребує принаймні 245 ГБ VRAM навіть при квантуванні, що обмежує використання високорівневими серверними кластерами.
Виняткова глибина Agentic: Здатна на 300 послідовних tool calls, що забезпечує справді автономні вебдослідження та завдання в браузері.
Притаманна затримка відповіді: Процес глибокого мислення призводить до значного часу очікування, оскільки модель масштабує свої обчислення під час тестування.
Математична точність найвищого рівня: Досягає 94,5% на AIME 2025, підтверджуючи свою надійність для розв'язання математичних задач високої складності.
Відсутність власної Multimodality: Цей варіант не може обробляти зображення або відео безпосередньо, вимагаючи окремої моделі зору для multimodal завдань.
Доступність Open-Weights: Надає інтелект рівня frontier спільноті розробників для локального розгортання та fine-tuning.
Високі витрати на tokens: Внутрішні кроки reasoning споживають велику кількість output tokens, що збільшує витрати API для простих запитів.

Швидкий старт API

moonshot/kimi-k2-thinking

Переглянути документацію
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [{ role: 'user', content: 'Design a system for autonomous code review using 300 tool calls.' }],
  });
  console.log(response.choices[0].message.content);
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Kimi K2 Thinking

Подивіться, що думає спільнота про Kimi K2 Thinking

Kimi K2.5, найкраща open модель для програмування, вони справді зробили неймовірне.
npc_gooner
reddit
Moonshot AI щойно випустили Kimi K2 Thinking. 300 послідовних tool calls? Це майбутнє agentic AI.
@tech_trends
twitter
Kimi випустили Kimi K2 Thinking, open-source модель з трильйоном parameters для reasoning. Це серйозно.
nekofneko
reddit
Той факт, що вона може обробляти 300 tool calls послідовно, відкриває абсолютно нові робочі процеси для агентів.
AI Explained
youtube
Вражаюче бачити, як open-source модель досягає таких показників. Підхід до масштабування обчислень під час тестування явно дає результати.
jsmith23
hackernews
Запуск цієї моделі локально, це виклик, але глибина reasoning не схожа на ніщо інше в просторі відкритих ваг.
LocalLlamaEnthusiast
reddit

Відео про Kimi K2 Thinking

Дивіться навчальні матеріали, огляди та обговорення про Kimi K2 Thinking

Kimi K2 Thinking, найкраща AI модель, яку я коли-небудь використовував.

Це найбільш agentic незалежна модель, коли-небудь створена. Це означає, що вона може працювати годинами самостійно.

Вона здатна думати та рефлексувати на кожному кроці шляху. Тому вона ніколи не губиться.

Швидкість reasoning дивовижно висока, незважаючи на трильйон parameters.

Якщо ви будуєте агентів, це архітектура, на яку варто звернути увагу.

Kimi K2 Thinking... це покращення мислення моделі Kimi K2, яка, чесно кажучи, дуже високо цінується.

Це, звісно, open-source модель... загальним розміром близько 1 трильйона parameters.

Усі результати benchmark наведені з точністю int4.

Вона справляється зі складними математичними задачами з рівнем логіки, що конкурує з провідними закритими лабораторіями.

Процес встановлення локальних ваг досить простий, якщо у вас є достатньо VRAM.

Kimi K2.5, це найновіша open-source модель, розроблена китайською компанією Moonshot AI.

Вона здатна запускати до 100 субагентів та 1500 tool calls і виконувати їх одночасно.

Я б точно рекомендував її, якщо ви хочете зробити справді гарний вебсайт.

Внутрішній chain-of-thought дозволяє їй самостійно виправляти помилки в коді перед наданням остаточної відповіді.

Moonshot зосередилися на довгостроковому плануванні для цього конкретного релізу.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Kimi K2 Thinking

Експертні поради, які допоможуть вам отримати максимум від Kimi K2 Thinking та досягти кращих результатів.

Увімкніть виведення Thinking

Використовуйте прапорець спеціальних tokens у вашому рушії inference, щоб бачити внутрішні кроки reasoning моделі.

Оптимізуйте Temperature

Встановіть sampling temperature на 1.0 та min_p на 0.01 для отримання найбільш послідовного потоку reasoning.

Використовуйте System Prompts

Починайте розмови з офіційним prompt ідентичності Moonshot AI для стабілізації поведінки моделі.

Масштабуйте обчислення під час тестування (Test-Time Compute)

Дозвольте моделі генерувати більше внутрішніх tokens для складніших завдань, щоб підвищити точність.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Часті запитання про Kimi K2 Thinking

Знайдіть відповіді на поширені запитання про Kimi K2 Thinking