minimax

MiniMax M2.5

MiniMax M2.5 er en state-of-the-art MoE model med 1M context window og elite kodningsevner til disruptive priser for autonome agenter.

Agentic AIMoE-arkitekturKodningsspecialistOmkostningseffektiv
minimax logominimaxM-serien12. februar 2026
Kontekst
1.0Mtokens
Maks output
128Ktokens
Input-pris
$0.30/ 1M
Output-pris
$1.20/ 1M
Modalitet:TextImage
Funktioner:VisionVærktøjerStreamingRæsonnering
Benchmarks
GPQA
62%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). MiniMax M2.5 scorede 62% på denne benchmark.
HLE
28%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. MiniMax M2.5 scorede 28% på denne benchmark.
MMLU
85%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. MiniMax M2.5 scorede 85% på denne benchmark.
MMLU Pro
76.5%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. MiniMax M2.5 scorede 76.5% på denne benchmark.
SimpleQA
44%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. MiniMax M2.5 scorede 44% på denne benchmark.
IFEval
87.5%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. MiniMax M2.5 scorede 87.5% på denne benchmark.
AIME 2025
45%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. MiniMax M2.5 scorede 45% på denne benchmark.
MATH
72%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. MiniMax M2.5 scorede 72% på denne benchmark.
GSM8k
95.8%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. MiniMax M2.5 scorede 95.8% på denne benchmark.
MGSM
92.4%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. MiniMax M2.5 scorede 92.4% på denne benchmark.
MathVista
65%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. MiniMax M2.5 scorede 65% på denne benchmark.
SWE-Bench
80.2%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. MiniMax M2.5 scorede 80.2% på denne benchmark.
HumanEval
89.6%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. MiniMax M2.5 scorede 89.6% på denne benchmark.
LiveCodeBench
65%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. MiniMax M2.5 scorede 65% på denne benchmark.
MMMU
68%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. MiniMax M2.5 scorede 68% på denne benchmark.
MMMU Pro
54%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. MiniMax M2.5 scorede 54% på denne benchmark.
ChartQA
88%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. MiniMax M2.5 scorede 88% på denne benchmark.
DocVQA
93.2%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. MiniMax M2.5 scorede 93.2% på denne benchmark.
Terminal-Bench
52%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. MiniMax M2.5 scorede 52% på denne benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. MiniMax M2.5 scorede 12% på denne benchmark.

Om MiniMax M2.5

Lær om MiniMax M2.5s muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Effektiv frontier-arkitektur

MiniMax M2.5 er en højeffektiv frontier model bygget på en 230B Mixture-of-Experts (MoE) arkitektur. Ved kun at aktivere 10 milliarder parameters per forward pass, opnår den inferenshastigheder og prissætningsstrukturer, der er næsten 20 gange mere effektive end hos proprietary giganter. Den er designet specifikt til agentic intelligens, hvor den prioriterer struktureret logik og planlægning i flere trin frem for simple chat-beskeder. Dette spars-design gør det muligt for modellen at bevare høj intelligens uden de massive beregningsmæssige omkostninger fra traditionelle tætte modeller.

Avanceret kodningsintelligens

Modellens mest markante funktion er dens Arkitekt-mindset, som gør det muligt for den at visualisere logiske strukturer og projekthierarkier, før den genererer kode. Dette gør den særligt effektiv til autonom softwareudvikling, hvor den matcher state-of-the-art med en score på 80,2% på SWE-Bench Verified. Med et 1-million-token context window kan den indtage hele codebases, hvilket muliggør dybdegående audits af repositories og kompleks refaktorering af systemer, som tidligere var omkostningstunge.

Enterprise og lokal deployment

MiniMax M2.5 understøtter over 10 programmeringssprog og en indbygget throughput på op til 100 tokens per sekund på sin lightning-variant. Da den er tilgængelig som en open-weight model, kan udviklere deploye den lokalt for fuld databeskyttelse, mens de bevarer adgangen til den samme logiktunge reasoning, som findes i det hostede API. Denne alsidighed gør den til et praktisk valg for både cloud-baserede agent-pipelines og on-premise værktøjer.

MiniMax M2.5

Anvendelser for MiniMax M2.5

Opdag de forskellige måder, du kan bruge MiniMax M2.5 til at opnå gode resultater.

Autonom softwareudvikling

Løsning af virkelige GitHub issues og udførelse af debugging på tværs af filer ved brug af agent-harnesses.

Enterprise agent-pipelines

Drivkraft til always-on baggrundsagenter til research og datasyntese til lave API-omkostninger.

Modernisering af legacy-kode

Refaktorering af massive forældede repositories til moderne frameworks, mens logiske standarder overholdes.

Arkitektoniske kodegennemgange

Analyse af projekthierarkier for at give logisk feedback og forslag til strukturel optimering.

Højvolumen dokumentredigering

Behandling af store office-filer med høj præcision til finansielle og juridiske modeller.

Low-latency developer tools

Drivkraft til IDE-udvidelser og CLI-værktøjer, der kræver svartider under et sekund for assistance.

Styrker

Begrænsninger

State-of-the-art kodningsperformance: Opnår en score på 80,2% på SWE-Bench Verified, hvilket matcher performance fra langt dyrere modeller.
Lavere dybde i reasoning: De sparsomme 10B aktive parameters kan til tider halte bagefter tætte modeller i ekstremt nicheprægede reasoning-opgaver.
Ekstrem omkostningseffektivitet: Prissætningen er cirka 1/20 af store konkurrenter, hvilket gør storskala agent-deployments mulige.
Tekst-centreret fokus: Mangler indbyggede vision- og audio-kapabiliteter sammenlignet med multimodal modeller som GPT-4o.
Høj throughput: HighSpeed-varianten leverer 100 tokens per sekund, hvilket er dobbelt hastighed sammenlignet med traditionelle modeller.
Krav om brand-attribuering: Kommerciel brug af open-weight versionen kræver tydelig attribuering til MiniMax-brandet.
Open-weight tilgængelighed: Udviklere kan køre modellen lokalt for at sikre databeskyttelse og fuldt ejerskab over stacken.
VRAM-krav: At køre den fulde model lokalt kræver high-end hardware, medmindre der anvendes væsentlig kvantisering.

API hurtig start

minimax/minimax-m2.5

Se dokumentation
minimax SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: 'https://api.minimax.io/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'minimax-m2.5',
    messages: [{ role: 'user', content: 'Design a microservices architecture for a fintech app.' }],
    temperature: 0.1,
  });
  console.log(response.choices[0].message.content);
}

main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om MiniMax M2.5

Se hvad fællesskabet mener om MiniMax M2.5

Prissætningen på MiniMax M2.5 er den virkelige nyhed; billig nok til at ændre arkitektur, ikke bare budgetter.
PretendAd7988
twitter
M2.5 rammer state-of-the-art tal, og det er en 10B aktiv parameter model, hvilket betyder, at den er hurtig og billig.
Low-Bread-2346
reddit
Modellen reducerer det tunge løft, som brugere tidligere måtte gøre for at holde processer kørende.
JamMasterJulian
youtube
M2.5 matcher Claude Opus 4.6 throughput til en brøkdel af prisen.
Significant-Tap-7854
reddit
At køre M2.5 lokalt på en Mac Studio er lynhurtigt. De 10B aktive params gør virkelig en forskel.
MacCoder_X
reddit
Det arkitektoniske planlægningstrin fanger logikfejl, før den overhovedet har skrevet en eneste linje kode.
dev_mindset
twitter

Videoer om MiniMax M2.5

Se vejledninger, anmeldelser og diskussioner om MiniMax M2.5

Den er næsten 20 gange billigere end de førende proprietary muligheder.

Dette er en top-tier kodnings- og agent-model, der er meget hurtigere og drastisk billigere.

Performance på SWE-bench verified placerer den virkelig i elitekategorien.

Du får frontier model intelligens med hardwarekrav fra open-source.

MoE-arkitekturen her er tunet perfekt til low-latency kodningsopgaver.

MiniMax serverer modellen til 3% af prisen for Opus 4.6 i output tokens.

Intelligensens pris nærmer sig faktisk elektricitetens pris på dette punkt.

Den håndterer store repo context windows uden den typiske glemsomhed midt i dokumentet.

For developer tools er hastigheden på lightning-varianten en massiv UX-sejr.

Det er første gang, jeg har set en model så billig faktisk løse komplekse logiske bugs.

Det koster kun $1 at køre modellen kontinuerligt i en time ved 100 tokens per sekund.

Den interne tænkning skinner virkelig her, fordi den kan korrigere sig selv med det samme.

Når den testes mod GPT-4o, leverer den konsekvent bedre refaktoreringer på tværs af flere filer.

De agentic kapabiliteter er indbyggede, ikke bare en eftertanke i prompten.

Den er essentielt gratis for små udviklere givet input-prissætningen.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til MiniMax M2.5

Eksperttips til at hjælpe dig med at få mest muligt ud af MiniMax M2.5 og opnå bedre resultater.

Anvend arkitekt-mindsettet

Bed modellen om at generere en projektstruktur, før du anmoder om den faktiske implementeringskode.

Udnyt 1M context window

Indsæt komplet dokumentation eller hele moduler for at sikre global forståelse af dit codebase.

Brug HighSpeed-planen

Vælg M2.5-HighSpeed endpointet for at opnå stabile 100 tokens per sekund til interaktive agenter.

Iterativ forbedring

Bed modellen om at gennemgå sit eget output for logiske brister eller sikkerhedsmæssige sårbarheder.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Ofte stillede spørgsmål om MiniMax M2.5

Find svar på almindelige spørgsmål om MiniMax M2.5