moonshot

Kimi K2.5

Відкрийте для себе Kimi K2.5 від Moonshot AI, 1T-parameter open-source agentic модель з нативними multimodal можливостями, context window 262K та SOTA...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27 січня 2026 року
Контекст
256Kтокенів
Макс. вивід
66Kтокенів
Ціна вводу
$0.60/ 1M
Ціна виводу
$3.00/ 1M
Модальність:TextImageVideo
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
87.6%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Kimi K2.5 набрав 87.6% у цьому бенчмарку.
HLE
50.2%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Kimi K2.5 набрав 50.2% у цьому бенчмарку.
MMLU
91.5%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Kimi K2.5 набрав 91.5% у цьому бенчмарку.
MMLU Pro
87.1%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Kimi K2.5 набрав 87.1% у цьому бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Kimi K2.5 набрав 48% у цьому бенчмарку.
IFEval
85%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Kimi K2.5 набрав 85% у цьому бенчмарку.
AIME 2025
96.1%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Kimi K2.5 набрав 96.1% у цьому бенчмарку.
MATH
90.1%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Kimi K2.5 набрав 90.1% у цьому бенчмарку.
GSM8k
97.1%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Kimi K2.5 набрав 97.1% у цьому бенчмарку.
MGSM
95%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Kimi K2.5 набрав 95% у цьому бенчмарку.
MathVista
90.1%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Kimi K2.5 набрав 90.1% у цьому бенчмарку.
SWE-Bench
76.8%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Kimi K2.5 набрав 76.8% у цьому бенчмарку.
HumanEval
88%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Kimi K2.5 набрав 88% у цьому бенчмарку.
LiveCodeBench
85%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Kimi K2.5 набрав 85% у цьому бенчмарку.
MMMU
78.5%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Kimi K2.5 набрав 78.5% у цьому бенчмарку.
MMMU Pro
78.5%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Kimi K2.5 набрав 78.5% у цьому бенчмарку.
ChartQA
77.5%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Kimi K2.5 набрав 77.5% у цьому бенчмарку.
DocVQA
88.8%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Kimi K2.5 набрав 88.8% у цьому бенчмарку.
Terminal-Bench
50.8%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Kimi K2.5 набрав 50.8% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Kimi K2.5 набрав 12% у цьому бенчмарку.

Про Kimi K2.5

Дізнайтеся про можливості Kimi K2.5, функції та як це може допомогти вам досягти кращих результатів.

Kimi K2.5 — це open-source multimodal модель від Moonshot AI. Вона використовує архітектуру Mixture-of-Experts з 1 трильйоном parameters, де 32 мільярди активні для кожного token. Система об'єднує опрацювання тексту, зображень і відео в межах єдиної структури reasoning, а не через окремі зовнішні енкодери для кожної модальності. Така архітектура дозволяє моделі працювати з 256 000 tokens контексту, зберігаючи високу точність пошуку та логічну послідовність у дуже довгих послідовностях.

Модель вирізняється можливістю Agent Swarm. Ця функція дозволяє системі координувати до 100 паралельних sub-agents для одночасного виконання складних дослідницьких або інженерних завдань. Завдяки інтеграції енкодера MoonViT-3D з 400M parameters, K2.5 може аналізувати кілька годин відеоконтенту з високою точністю. Вона спеціально розроблена для автономного виконання завдань, випереджаючи багато пропрієтарних моделей на таких бенчмарках, як SWE-Bench та BrowseComp.

Kimi K2.5 надає спеціалізований режим Thinking для завдань, що потребують глибокої логіки. Коли цей режим активовано, модель генерує внутрішній ланцюжок reasoning для самокорекції та перевірки кроків перед наданням фінальної відповіді. Це робить її надзвичайно ефективною для математики змагального рівня та великомасштабної розробки ПЗ. Економіка tokens моделі оптимізована для корпоративного розгортання, пропонуючи інтелект frontier-рівня за ціною, значно нижчою, ніж у конкурентних закритих систем.

Kimi K2.5

Випадки використання для Kimi K2.5

Відкрийте різні способи використання Kimi K2.5 для досягнення чудових результатів.

Автономна розробка ПЗ

Вирішення складних проблем на GitHub та створення архітектури проєктів з багатьма файлами, використовуючи логіку, оптимізовану під SWE-Bench.

Візуальна веб-розробка

Створення функціонального frontend-коду та дизайну UI безпосередньо із записів екрана взаємодії з наявним сайтом.

Багатопотокові дослідження

Використання Agent Swarm для збору та синтезу інформації з понад 100 джерел в межах одного паралельного робочого процесу.

Аналіз довгого відео

Видобування конкретних подій та часових даних з годин відеозаписів безпеки або лекцій без використання інструментів виділення кадрів.

Генерація математичних доведень

Використання режиму глибокого reasoning для розв'язання математичних задач олімпіадного рівня з точністю 96 відсотків.

Автоматизація корпоративної документації

Створення багатосторінкових звітів у форматі PDF та складних фінансових таблиць на основі неструктурованих бізнес-даних.

Сильні сторони

Обмеження

Висока продуктивність Agentic AI: Оцінка 76.8 на SWE-Bench Verified, що перевершує багато пропрієтарних frontier model у завданнях програмної інженерії.
Екстремальні потреби у VRAM: Потребує 632 ГБ VRAM для повної неквантованої моделі, що робить локальне розгортання неможливим для більшості споживачів.
Неперевершена економіка tokens: Надає інтелект MoE з 1T parameters за $0.60 за мільйон вхідних tokens, що становить приблизно 10 відсотків від вартості Claude Opus.
Висока затримка reasoning: Режим thinking може вносити значні затримки, оскільки модель створює ланцюжки внутрішньої логіки перед тим, як відповісти.
Нативне розуміння відео: Обробляє складні відеофайли без зовнішнього виділення кадрів, дозволяючи виконувати точний часовий аналіз довгих записів.
Повторюваність форматування: Може створювати надмірно довгі масиви тексту, якщо чітко не вказати використання певних структур абзаців.
Паралельна оркестрація swarm: Єдина open-weight модель, навчена координувати до 100 sub-agents для масштабних багатопотокових дослідницьких процесів.
Питання місця зберігання даних: Основна інфраструктура базується в Китаї, що може створювати проблеми з комплаєнсом для деяких західних підприємств.

Швидкий старт API

fireworks/kimi-k2p5

Переглянути документацію
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Kimi K2.5

Подивіться, що думає спільнота про Kimi K2.5

Kimi K2.5 коштує майже в 10 разів менше, ніж Opus, при аналогічному рівні продуктивності.
Odd_Tumbleweed574
reddit
Люди забувають, що Nvidia втратила 600 мільярдів доларів, коли китайська лабораторія зробила великий open-source реліз. Kimi знову робить це з frontier intelligence.
chetaslua
twitter
Концепція Attention Residuals у K2.5 — це перша архітектурна зміна за роки, яка реально вирішує проблему «забудькуватості» LLM.
logic_king
hackernews
Workers AI зараз запускає великі моделі. Kimi K2.5 — перша в списку. Це одна з найкращих open-source моделей, дуже хороша для кодингу.
dok2001
twitter
Kimi K2.5 — це зовсім інший звір. Це розумна, неймовірна модель для рольових ігор, але вона може стати невротичною, якщо не використовувати спільнотні пресети.
dptgreg
reddit
Я замінив свій робочий процес на базі GPT 4 на Kimi K2.5, бо режим thinking більш прозорий, а context window обробляє весь мій репозиторій.
Dev_Max
reddit

Відео про Kimi K2.5

Дивіться навчальні матеріали, огляди та обговорення про Kimi K2.5

Kimi K2.5 обходить GPT 5.2 завдяки високому рівню reasoning, буквально знищуючи інші frontier models.

Це найпотужніша open-source модель для кодування на сьогодні з оцінкою 76.8 на SWE-Bench Verified.

Agent swarm — це перехід від одного agent до multi-agent системи, що виконує паралельні робочі процеси через понад 1500 координованих кроків.

Context window масивний, 256 тис. tokens, чого цілком достатньо для більшості проєктів.

Moonshot справді розширює межі можливостей open-weight моделей на початку 2026 року.

Вона чудово відтворила естетику Apple і створила гарний сайт з анімаціями просто на основі відео.

Функція Swarm виглядає дуже круто, нею цікаво користуватися, оскільки вона присвоює ID-бейджи кожному sub-agent.

K2.5 значно дешевша: 60 центів за мільйон вхідних tokens і 3 долари за мільйон вихідних.

Нативна обробка відео означає, що вам не потрібно використовувати дорогі зовнішні інструменти для обробки кадрів.

Ця модель кардинально змінює правила гри для розробників, яким потрібні автономні агенти з обмеженим бюджетом.

Moonshot досягла цього, надаючи кожному sub-agent винагороди на різних критичних етапах, щоб запобігти колапсу послідовності.

Модель вчиться обирати паралелізм лише тоді, коли він скорочує критичний шлях, що є дуже розумною інновацією.

Kimi K2.5 вже на межі того, щоб працювати на споживчому обладнанні з використанням GGUF.

Режим thinking неймовірно надійний для розв'язання складних логічних помилок у Python.

Поява моделі з 1 трильйоном parameters — це величезна подія для open-source спільноти.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Kimi K2.5

Експертні поради, які допоможуть вам отримати максимум від Kimi K2.5 та досягти кращих результатів.

Увімкніть режим Thinking

Передайте параметр thinking у вашому запиті API, щоб отримати максимальну точність у математичних та програмних завданнях.

Запустіть Agent Swarm

Дайте вказівку моделі розгорнути swarm для дослідницьких завдань, щоб примусово виконувати паралельну оркестрацію між sub-agents.

Оптимізуйте Temperature

Використовуйте temperature 1.0 для режиму thinking, щоб забезпечити різноманітність reasoning, але знижуйте її до 0.6 для звичайного спілкування.

Комбіновані візуальні prompt

Завантажуйте скриншоти помилок разом із фрагментами коду, щоб використати переваги уніфікованого навчання моделі (текст-зір).

Кешування контексту

Використовуйте кешування контексту для довгих документів, що повторюються, щоб зменшити витрати на вхідні дані до 90 відсотків.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Часті запитання про Kimi K2.5

Знайдіть відповіді на поширені запитання про Kimi K2.5