other

MiMo V2.5 Pro

MiMo V2.5 Pro는 1M context window, 네이티브 multimodality, 최상급 agentic 코딩 성능을 갖춘 Xiaomi의 1.02T parameters Open Source MoE 모델입니다.

Open SourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo2026년 4월 27일
컨텍스트
1.0M토큰
최대 출력
131K토큰
입력 가격
$1.00/ 1M
출력 가격
$3.00/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
54%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. MiMo V2.5 Pro이 이 벤치마크에서 54%점을 기록했습니다.
HLE
48%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 48%점을 기록했습니다.
MMLU
86.7%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. MiMo V2.5 Pro이 이 벤치마크에서 86.7%점을 기록했습니다.
MMLU Pro
84.9%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. MiMo V2.5 Pro이 이 벤치마크에서 84.9%점을 기록했습니다.
SimpleQA
45%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 45%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. MiMo V2.5 Pro이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
41%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. MiMo V2.5 Pro이 이 벤치마크에서 41%점을 기록했습니다.
MATH
75%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. MiMo V2.5 Pro이 이 벤치마크에서 75%점을 기록했습니다.
GSM8k
95.5%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. MiMo V2.5 Pro이 이 벤치마크에서 95.5%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. MiMo V2.5 Pro이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
65%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 65%점을 기록했습니다.
SWE-Bench
78.9%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. MiMo V2.5 Pro이 이 벤치마크에서 78.9%점을 기록했습니다.
HumanEval
90%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. MiMo V2.5 Pro이 이 벤치마크에서 90%점을 기록했습니다.
LiveCodeBench
80.6%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 80.6%점을 기록했습니다.
MMMU
73%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. MiMo V2.5 Pro이 이 벤치마크에서 73%점을 기록했습니다.
MMMU Pro
52%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. MiMo V2.5 Pro이 이 벤치마크에서 52%점을 기록했습니다.
ChartQA
89%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 89%점을 기록했습니다.
DocVQA
93.5%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. MiMo V2.5 Pro이 이 벤치마크에서 93.5%점을 기록했습니다.
Terminal-Bench
68.4%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 68.4%점을 기록했습니다.
ARC-AGI
8%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. MiMo V2.5 Pro이 이 벤치마크에서 8%점을 기록했습니다.

MiMo V2.5 Pro 소개

MiMo V2.5 Pro의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

MiMo V2.5 Pro는 Xiaomi의 flagship Open Source 모델입니다. inference 시 420억 개의 parameters가 활성화되는 1.02조 parameters 규모의 Mixture-of-Experts 아키텍처를 사용합니다. 하이브리드 어텐션 설계는 Local Sliding Window Attention과 Global Attention을 6:1 비율로 혼합합니다. 이러한 특정 구성은 표준 transformer 모델에 비해 KV-cache 스토리지 요구 사항을 거의 7배 감소시킵니다.

이 모델은 100만 tokens context window를 처리하며 텍스트, 이미지, 오디오, 비디오를 포함한 네이티브 omnimodal 입력을 지원합니다. 장기 호라이즌 agentic 작업과 자율 도구 사용에 최적화되어 있습니다. 개발자는 메모리 사용량과 출력 throughput 사이의 균형을 맞추는 FP8 정밀도 가중치를 사용하여 모델을 로컬에서 실행할 수 있습니다. 허용적인 MIT 라이선스는 추가 비용 없이 수정 및 상업적 배포를 가능하게 합니다.

MiMo V2.5 Pro

MiMo V2.5 Pro 사용 사례

MiMo V2.5 Pro을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

GitHub 이슈 해결 및 자체 수정 논리를 갖춘 컴파일러와 같은 시스템 구성 요소 구축.

장기 호라이즌 Agent 워크플로우

소프트웨어 환경 내에서 1,000회 이상의 도구 호출 전반에 걸친 일관성을 요구하는 계획 실행.

네이티브 Multimodal 분석

외부 전처리나 프레임 추출 없이 비디오와 텍스트를 결합한 입력 전반에 대해 직접 reasoning.

대규모 코드베이스 탐색

1M tokens context window 내에서 전체 프로젝트 저장소를 로드하여 논리 리팩토링이나 버그 탐색 수행.

아날로그 회로 설계

시뮬레이션 루프와 상호작용하여 다중 메트릭 사양을 충족하도록 복잡한 회로 최적화.

3D 웹 생성

Three.js 및 절차적 지형 생성을 사용하여 정교한 환경과 물리 시뮬레이션 구축.

강점

제한

낮은 Token 소비량: 작업 궤적당 40~60% 더 적은 tokens를 사용하면서도 frontier 모델과 대등한 지능을 제공.
Reasoning Latency: 딥 씽킹 모드에서는 모델이 텍스트 생성을 시작하기 전 수 분의 지연이 발생할 수 있음.
장기 호라이즌 일관성: 100만 tokens의 context window와 1,000회 이상의 도구 호출 시퀀스 전반에 걸쳐 reasoning 정확도 유지.
복잡한 플랫폼 액세스: 공식 웹 포털의 로그인 과정이 불안정하여 사용자들로부터 탐색하기 어렵다는 평가를 자주 받음.
소프트웨어 엔지니어링 성능: SWE-bench Verified에서 78.9% 점수를 기록하여 GitHub 수준의 코드 문제 해결에 탁월한 능력을 입증.
안전 거부 패턴: 긴 씽킹 사이클의 마지막 단계에서 간혹 거부 반응이 나타나 결과 출력 없이 컴퓨팅 자원만 소모함.
허용적인 MIT 라이선스: 다른 open-source 라이선스의 제한적인 조건 없이 상업적 통합 및 가중치 수정 허용.
상당한 하드웨어 요구 사항: 1.02T parameters 모델을 로컬에서 호스팅하려면 다중 GPU 클러스터가 필요하여 소규모 팀에게는 비용 부담이 큼.

API 빠른 시작

xiaomi/mimo-v2.5-pro

문서 보기
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "이 50,000줄짜리 코드베이스에서 논리적 오류를 찾아줘." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

MiMo V2.5 Pro에 대한 사람들의 의견

커뮤니티가 MiMo V2.5 Pro에 대해 어떻게 생각하는지 확인하세요

MiMo-V2.5-Pro의 속도 대 context 비율은 한 번에 전체 코드베이스를 스캔해야 하는 RAG 파이프라인에 있어 타의 추종을 불허합니다.
u/DevBuilder
reddit
중국이 미국 frontier 코딩 AI와 동일한 수준을 40-60% 더 낮은 token 비용으로 달성했습니다. 이건 점진적인 개선이 아니라 판도를 바꾸는 수준입니다.
Shruti
twitter
MiMo-V2.5-Pro는 인간 전문가라면 몇 주가 걸렸을 문제를 해결했습니다. 4시간 만에 완전한 컴파일러를 구축했습니다.
TechCrunchy
twitter
이 모델의 가치는 벤치마크에만 있는 것이 아니라, 복잡한 agent 워크플로우를 중단 없이 유지하는 능력에 있습니다.
XiaomiMiMo Team
hackernews
1T 모델치고 속도가 상당히 괜찮습니다. MoE 라우팅이 여기서 많은 비중을 차지하고 있네요.
AIExplorer
reddit
드디어 closed-source 거대 기업들과 경쟁할 수 있는 MIT 라이선스 모델이 나왔군요. 로컬 배포가 다음 숙제네요.
OpenSourceFan
twitter

MiMo V2.5 Pro에 대한 동영상

MiMo V2.5 Pro에 대한 튜토리얼, 리뷰 및 토론 시청

결과물에서 이런 수준의 디테일은 본 적이 없습니다... 나무 바닥 패널을 개별적으로 보세요.

특정 기술적 오류 메시지를 입력하면 모델이 매우 자신감 있고 효과적으로 대응합니다.

문서 중간에서 정보가 손실되는 현상 없이 전체 코드베이스 맥락을 처리합니다.

씽킹 프로세스가 투명하여 다양한 도구 옵션을 어떻게 평가하는지 정확히 보여줍니다.

이 모델은 JSON 출력을 위한 엄격한 지시 사항 준수 면에서 전작보다 뛰어납니다.

수천 번의 도구 호출을 유지하며 복잡한 다단계 워크플로우를 처리하도록 설계되었습니다.

GPT-5.4나 Claude Opus 4.6과 비슷한 성능을 내면서도 tokens는 40~60% 더 적게 사용합니다.

Xiaomi가 이번 출시로 Open Source AI 업계를 충격에 빠뜨렸습니다.

네이티브 multimodality 덕분에 비디오 처리를 위해 별도의 비전 인코더가 필요하지 않습니다.

적절한 환경 후크를 제공하면 전체 OS 구성 요소를 효과적으로 구축할 수 있습니다.

MiMo는 모두보다 저렴하게 나왔네요... 코딩 플랜의 첫 달은 6달러밖에 안 합니다.

벤치마크는 이야기의 일부일 뿐입니다. 저는 실제 빌더가 되어 제대로 지붕을 올리길 원합니다.

긴 reasoning 체인을 처리할 때 이전 V2 릴리스보다 훨씬 안정적입니다.

네이티브 API 가격 책정이 매우 공격적인데, 이는 개발자 시장을 선점하려는 의도로 보입니다.

매우 높은 주파수의 오디오는 약간 힘들어하지만, 대화형 음성은 완벽하게 처리합니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

MiMo V2.5 Pro 프로 팁

MiMo V2.5 Pro을 최대한 활용하기 위한 전문가 팁.

Chain-of-Thought 지연 시간 관리

단순한 기술적 질의에 대한 reasoning latency를 줄이려면 prompt에 'don't overthink'를 추가하세요.

Reasoning 콘텐츠 보존

agentic 성능을 유지하기 위해 멀티턴 대화 시 이전의 reasoning_content를 다시 전달하세요.

환경 기능 정의

모델이 환경 인지(harness awareness)에 최적화되어 있으므로 도구 환경 기능을 명확하게 지정하세요.

로컬 배포 최적화

메모리 효율성과 높은 출력 throughput 사이의 균형을 맞추기 위해 FP8 혼합 정밀도 가중치를 사용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

MiMo V2.5 Pro에 대한 자주 묻는 질문

MiMo V2.5 Pro에 대한 일반적인 질문에 대한 답변 찾기