other

MiMo V2.5 Pro

MiMo V2.5 Pro — это open-source MoE модель Xiaomi с 1.02T parameters, context window 1 млн tokens, нативной мультимодальностью и элитной производительностью в...

Open SourceAgentic AIМультимодальностьContext 1MXiaomi
other logootherMiMo27 апреля 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
131Kтокенов
Цена ввода
$1.00/ 1M
Цена вывода
$3.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
54%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). MiMo V2.5 Pro набрал 54% в этом бенчмарке.
HLE
48%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. MiMo V2.5 Pro набрал 48% в этом бенчмарке.
MMLU
86.7%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. MiMo V2.5 Pro набрал 86.7% в этом бенчмарке.
MMLU Pro
84.9%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. MiMo V2.5 Pro набрал 84.9% в этом бенчмарке.
SimpleQA
45%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. MiMo V2.5 Pro набрал 45% в этом бенчмарке.
IFEval
88%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. MiMo V2.5 Pro набрал 88% в этом бенчмарке.
AIME 2025
41%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. MiMo V2.5 Pro набрал 41% в этом бенчмарке.
MATH
75%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. MiMo V2.5 Pro набрал 75% в этом бенчмарке.
GSM8k
95.5%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. MiMo V2.5 Pro набрал 95.5% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. MiMo V2.5 Pro набрал 92% в этом бенчмарке.
MathVista
65%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. MiMo V2.5 Pro набрал 65% в этом бенчмарке.
SWE-Bench
78.9%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. MiMo V2.5 Pro набрал 78.9% в этом бенчмарке.
HumanEval
90%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. MiMo V2.5 Pro набрал 90% в этом бенчмарке.
LiveCodeBench
80.6%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. MiMo V2.5 Pro набрал 80.6% в этом бенчмарке.
MMMU
73%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. MiMo V2.5 Pro набрал 73% в этом бенчмарке.
MMMU Pro
52%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. MiMo V2.5 Pro набрал 52% в этом бенчмарке.
ChartQA
89%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. MiMo V2.5 Pro набрал 89% в этом бенчмарке.
DocVQA
93.5%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. MiMo V2.5 Pro набрал 93.5% в этом бенчмарке.
Terminal-Bench
68.4%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. MiMo V2.5 Pro набрал 68.4% в этом бенчмарке.
ARC-AGI
8%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. MiMo V2.5 Pro набрал 8% в этом бенчмарке.

О модели MiMo V2.5 Pro

Узнайте о возможностях, функциях и способах использования MiMo V2.5 Pro.

MiMo V2.5 Pro, флагманская open-source модель Xiaomi. Она использует архитектуру Mixture-of-Experts с 1.02 триллионами parameters, где 42 миллиарда параметров активны во время inference. Гибридный дизайн attention сочетает Local Sliding Window Attention и Global Attention в соотношении 6:1. Эта конфигурация снижает требования к памяти KV-cache почти в 7 раз по сравнению со стандартными transformer моделями.

Модель работает с context window в 1 миллион tokens и поддерживает нативный мультимодальный ввод, включая текст, изображения, аудио и видео. Она оптимизирована для агентных задач с длинным горизонтом планирования и автономного использования инструментов. Разработчики могут запускать модель локально, используя веса с точностью FP8, что балансирует использование памяти и throughput вывода. Лицензия MIT допускает модификацию и коммерческое развертывание без дополнительных платежей.

MiMo V2.5 Pro

Варианты использования MiMo V2.5 Pro

Откройте для себя различные способы использования MiMo V2.5 Pro для достижения отличных результатов.

Автономная разработка ПО

Решение задач в GitHub и создание системных компонентов, таких как компиляторы, с логикой самокоррекции.

Агентные рабочие процессы с длинным горизонтом планирования

Выполнение планов, требующих когерентности на протяжении более 1 000 вызовов инструментов в программных средах.

Нативный мультимодальный анализ

Прямой reasoning по комбинированным входным данным видео и текста без внешней предобработки или извлечения кадров.

Навигация по крупным кодовым базам

Анализ целых репозиториев проекта в рамках 1M context window для рефакторинга кода или поиска ошибок.

Проектирование аналоговых схем

Оптимизация сложных схем путем взаимодействия с циклами симуляции для соответствия многопараметрическим спецификациям.

Генерация 3D-веб-контента

Создание сложных сред и физических симуляций с использованием Three.js и процедурной генерации ландшафта.

Преимущества

Ограничения

Низкое потребление tokens: Обеспечивает интеллект, соответствующий frontier model, при использовании на 40–60% меньше tokens на траекторию задачи.
Задержка reasoning: Режим «глубокого мышления» может привести к задержкам в несколько минут перед тем, как модель начнет генерировать текст.
Когерентность с длинным горизонтом: Поддерживает точность reasoning на context window до 1 миллиона tokens и в последовательностях из более чем 1 000 вызовов инструментов.
Сложный доступ к платформе: Официальный веб-портал имеет нестабильный процесс входа в систему, который пользователи часто описывают как сложный.
Производительность в разработке ПО: Достигает 78.9% в SWE-bench Verified, что свидетельствует о высокой компетенции в решении задач уровня GitHub.
Паттерны отказа из соображений безопасности: Иногда отказы случаются в самом конце длинных циклов мышления, что тратит вычислительные ресурсы без выдачи результата.
Лицензия MIT: Позволяет коммерческую интеграцию и модификацию весов без ограничений, характерных для других open-source лицензий.
Высокие требования к оборудованию: Локальное размещение модели с 1.02T parameters требует кластеров с несколькими GPU, что делает self-hosting дорогим для небольших команд.

Быстрый старт API

xiaomi/mimo-v2.5-pro

Посмотреть документацию
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Найди логические ошибки в этой кодовой базе на 50 000 строк." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о MiMo V2.5 Pro

Посмотрите, что думает сообщество о MiMo V2.5 Pro

Соотношение скорости к контексту у MiMo-V2.5-Pro непревзойденно для RAG-пайплайнов, которым нужно сканировать целые кодовые базы за один проход.
u/DevBuilder
reddit
Китай только что сравнялся с США в frontier coding AI при затратах tokens на 40–60% ниже. Это не инкрементальные улучшения, это изменение правил игры.
Shruti
twitter
MiMo-V2.5-Pro решила проблемы, на которые у экспертов-людей ушли бы недели. Она собрала полноценный компилятор чуть более чем за 4 часа.
TechCrunchy
twitter
Ценность модели не только в бенчмарках, но и в её способности поддерживать сложные агентные рабочие процессы без сбоев.
XiaomiMiMo Team
hackernews
Скорость вполне достойная для модели на 1T. MoE-маршрутизация здесь берет на себя основную нагрузку.
AIExplorer
reddit
Наконец-то вышла модель с лицензией MIT, которая реально конкурирует с закрытыми гигантами. Локальное развертывание, следующий барьер.
OpenSourceFan
twitter

Видео о MiMo V2.5 Pro

Смотрите обучающие материалы, обзоры и обсуждения о MiMo V2.5 Pro

Я никогда не видел такой детализации в результате... посмотрите на отдельные деревянные панели пола.

Модель очень уверенна и эффективна, когда вы подаете ей конкретные технические сообщения об ошибках.

Она обрабатывает контекст всей кодовой базы без типичной потери информации в середине документа.

Процесс мышления прозрачен, показывая точно, как модель оценивает различные варианты инструментов.

Эта модель превосходит своих предшественников в строгом следовании инструкциям для JSON-вывода.

Она разработана для работы со сложными многошаговыми процессами, поддерживая тысячи вызовов инструментов.

Модель использует на 40–60% меньше tokens, чем GPT-5.4 или Claude Opus 4.6, при схожей производительности.

Xiaomi просто шокировала open-source AI сообщество этим релизом.

Нативная мультимодальность означает, что ей не нужен отдельный vision encoder для видео.

Вы можете фактически создать целый компонент ОС, предоставив правильные хуки окружения.

Mimo вышла, чтобы демпинговать... первый месяц плана для программирования стоит всего шесть долларов.

Бенчмарки отражают лишь часть картины; я хочу, чтобы модели были настоящими строителями и делали всё как надо.

Она гораздо стабильнее раннего релиза V2 при работе с длинными цепочками reasoning.

Ценообразование на их нативном API агрессивно, вероятно, чтобы захватить рынок разработчиков.

Модель немного испытывает трудности с очень высокочастотным аудио, но идеально обрабатывает разговорную речь.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для MiMo V2.5 Pro

Экспертные советы для максимальной эффективности MiMo V2.5 Pro.

Управление задержкой Chain-of-Thought

Добавьте «don't overthink» в ваш prompt, чтобы уменьшить задержку reasoning для простых технических запросов.

Сохранение reasoning_content

Передавайте предыдущий reasoning_content в многоходовых диалогах для поддержания эффективности агента.

Определение возможностей среды

Четко указывайте возможности среды инструментов, так как модель оптимизирована для взаимодействия с ними.

Оптимизация локального развертывания

Используйте веса со смешанной точностью FP8, чтобы сбалансировать потребление RAM и высокий throughput вывода.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

Часто задаваемые вопросы о MiMo V2.5 Pro

Найдите ответы на частые вопросы о MiMo V2.5 Pro