other

MiMo V2.5 Pro

MiMo V2.5 Pro er Xiaomis open-source 1,02T parameter MoE-model med et 1M context window, native multimodalitet og elite agentic coding-performance.

Open SourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo27. april 2026
Kontekst
1.0Mtokens
Maks output
131Ktokens
Input-pris
$1.00/ 1M
Output-pris
$3.00/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
54%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). MiMo V2.5 Pro scorede 54% på denne benchmark.
HLE
48%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. MiMo V2.5 Pro scorede 48% på denne benchmark.
MMLU
86.7%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. MiMo V2.5 Pro scorede 86.7% på denne benchmark.
MMLU Pro
84.9%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. MiMo V2.5 Pro scorede 84.9% på denne benchmark.
SimpleQA
45%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. MiMo V2.5 Pro scorede 45% på denne benchmark.
IFEval
88%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. MiMo V2.5 Pro scorede 88% på denne benchmark.
AIME 2025
41%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. MiMo V2.5 Pro scorede 41% på denne benchmark.
MATH
75%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. MiMo V2.5 Pro scorede 75% på denne benchmark.
GSM8k
95.5%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. MiMo V2.5 Pro scorede 95.5% på denne benchmark.
MGSM
92%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. MiMo V2.5 Pro scorede 92% på denne benchmark.
MathVista
65%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. MiMo V2.5 Pro scorede 65% på denne benchmark.
SWE-Bench
78.9%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. MiMo V2.5 Pro scorede 78.9% på denne benchmark.
HumanEval
90%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. MiMo V2.5 Pro scorede 90% på denne benchmark.
LiveCodeBench
80.6%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. MiMo V2.5 Pro scorede 80.6% på denne benchmark.
MMMU
73%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. MiMo V2.5 Pro scorede 73% på denne benchmark.
MMMU Pro
52%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. MiMo V2.5 Pro scorede 52% på denne benchmark.
ChartQA
89%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. MiMo V2.5 Pro scorede 89% på denne benchmark.
DocVQA
93.5%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. MiMo V2.5 Pro scorede 93.5% på denne benchmark.
Terminal-Bench
68.4%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. MiMo V2.5 Pro scorede 68.4% på denne benchmark.
ARC-AGI
8%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. MiMo V2.5 Pro scorede 8% på denne benchmark.

Om MiMo V2.5 Pro

Lær om MiMo V2.5 Pros muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

MiMo V2.5 Pro er Xiaomis flagship open-source model. Den bruger en 1,02 billion-parameter Mixture-of-Experts-arkitektur, hvor 42 milliarder parametre er aktive under inference. Designet med hybrid-attention blander Local Sliding Window Attention og Global Attention i forholdet 6:1. Denne specifikke konfiguration reducerer behovet for KV-cache-lagring med næsten 7x sammenlignet med standard transformer-modeller.

Modellen håndterer et 1 million-token context window, mens den understøtter native omnimodal-input inklusive tekst, billede, lyd og video. Den er optimeret til agentic-opgaver med lang tidshorisont og autonom brug af værktøjer. Udviklere kan køre modellen lokalt ved hjælp af FP8-præcisionsvægte, som balancerer hukommelsesforbrug med output-throughput. Den tilladende MIT-licens giver mulighed for modifikation og kommerciel deployment uden ekstra gebyrer.

MiMo V2.5 Pro

Anvendelser for MiMo V2.5 Pro

Opdag de forskellige måder, du kan bruge MiMo V2.5 Pro til at opnå gode resultater.

Autonom softwareudvikling

Løsning af GitHub-problemer og opbygning af systemkomponenter som compilere med selvrettende logik.

Agent-workflows med lang tidshorisont

Eksekvering af planer, der kræver sammenhæng på tværs af over 1.000 tool calls i softwaremiljøer.

Native multimodal analyse

Direkte ræsonnement på tværs af kombinerede input af video og tekst uden ekstern præprocessering eller frame-ekstraktion.

Navigering i store kodebaser

Indlæsning af hele projektarkiver inden for et 1M token context window for at refaktorere logik eller finde fejl.

Design af analoge kredsløb

Optimering af komplekse kredsløb ved at interagere med simuleringsloops for at opfylde specifikationer med flere metrikker.

3D-webgenerering

Skabelse af sofistikerede miljøer og fysiksimuleringer ved hjælp af Three.js og procedurel terrængenerering.

Styrker

Begrænsninger

Lavt token-forbrug: Leverer intelligens, der matcher frontier models, mens den bruger 40 % til 60 % færre tokens pr. opgavebane.
Reasoning-latency: Deep thinking-tilstanden kan medføre forsinkelser på flere minutter, før modellen begynder at generere tekst.
Langvarig sammenhæng (Long-Horizon Coherence): Bevarer præcisionen i ræsonnement på tværs af context windows på 1 million tokens og sekvenser på over 1.000 tool calls.
Kompleks platformadgang: Den officielle webportal har en ustabil log-in-proces, som brugere ofte beskriver som svær at navigere i.
Softwareudviklingsperformance: Opnår en score på 78,9 % på SWE-bench Verified, hvilket indikerer høj dygtighed til at løse kode-problemer på GitHub-niveau.
Mønstre for sikkerhedsrefusal: Afvisninger kan lejlighedsvis forekomme helt til sidst i lange tænke-cyklusser, hvilket bruger computertid uden at give et output.
Tilladende MIT-licens: Muliggør kommerciel integration og modifikation af vægte uden de restriktive vilkår, der findes i andre open-source-licenser.
Betydelige hardwarekrav: Hosting af 1,02T-parameter-modellen lokalt kræver multi-GPU-klynger, hvilket gør selvhosting dyrt for små teams.

API hurtig start

xiaomi/mimo-v2.5-pro

Se dokumentation
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om MiMo V2.5 Pro

Se hvad fællesskabet mener om MiMo V2.5 Pro

Ratioen mellem hastighed og context på MiMo-V2.5-Pro er uovertruffen til RAG-pipelines, der skal scanne hele kodebaser i én omgang.
u/DevBuilder
reddit
Kina har lige matchet USA's frontier coding-AI til 40-60 % lavere token-omkostninger. Dette er ikke inkrementelt; det ændrer hele spillet.
Shruti
twitter
MiMo-V2.5-Pro løste problemer, som ville tage eksperter uger. Den byggede en komplet compiler på lidt over 4 timer.
TechCrunchy
twitter
Modellens værdi ligger ikke kun i benchmarks, men i dens evne til at opretholde komplekse agent-workflows uden at fejle.
XiaomiMiMo Team
hackernews
Hastigheden er faktisk anstændig for en 1T-model. MoE-routingen gør meget af det tunge arbejde her.
AIExplorer
reddit
Endelig en MIT-licenseret model, der rent faktisk konkurrerer med de closed-source giganter. Lokal deployment er den næste barriere.
OpenSourceFan
twitter

Videoer om MiMo V2.5 Pro

Se vejledninger, anmeldelser og diskussioner om MiMo V2.5 Pro

Jeg har aldrig set det detaljeniveau i et resultat... se de individuelle træpaneler på gulvet.

Modellen er meget selvsikker og effektiv, når man fodrer den med specifikke tekniske fejlmeddelelser.

Den håndterer hele kodebasens context uden det sædvanlige tab midt i dokumentet.

Tænke-processen er transparent og viser præcis, hvordan den evaluerer forskellige værktøjsmuligheder.

Denne model udkonkurrerer sine forgængere i streng instruktionsfølgning for JSON-outputs.

Den er designet til at håndtere komplekse workflows med mange trin og opretholde tusindvis af tool calls.

Den bruger 40 til 60 % færre tokens end modeller som GPT-5.4 eller Claude Opus 4.6 ved lignende performance.

Xiaomi har netop chokeret open-source AI-verdenen med denne udgivelse.

Den native multimodalitet betyder, at den ikke behøver en separat vision encoder til video.

Du kan reelt bygge en hel OS-komponent ved at levere de rigtige miljø-hooks.

Mimo kom ud for at underbyde alle... den første måned af coding-planen koster kun seks dollars.

Benchmarks fortæller kun en del af historien; jeg vil have dem til at være faktiske bygherrer og lægge taget ordentligt.

Den er meget mere stabil end den tidligere V2-udgivelse, når den håndterer lange reasoning-kæder.

Prisen på deres native API er aggressiv, sandsynligvis for at erobre udviklermarkedet.

Den kæmper en smule med lyd med meget høj frekvens, men håndterer samtaler helt perfekt.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til MiMo V2.5 Pro

Eksperttips til at hjælpe dig med at få mest muligt ud af MiMo V2.5 Pro og opnå bedre resultater.

Håndtering af Chain-of-Thought latency

Tilføj 'don't overthink' til din prompt for at reducere reasoning-latency ved simple tekniske spørgsmål.

Bevar reasoning-indhold

Send det forrige reasoning_content tilbage i multi-turn samtaler for at bevare agentic-performance.

Definer miljøets muligheder

Specificer værktøjsmiljøets egenskaber tydeligt, da modellen er optimeret til bevidsthed om rammeværktøjer.

Optimer lokal deployment

Brug FP8 mixed precision-vægte for at balancere hukommelseseffektivitet med høj output-throughput.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

Ofte stillede spørgsmål om MiMo V2.5 Pro

Find svar på almindelige spørgsmål om MiMo V2.5 Pro