minimax

MiniMax M2.5

MiniMax M2.5 là mô hình MoE state-of-the-art với context window 1M và khả năng lập trình agentic ưu việt cùng mức giá đột phá cho các agent tự hành.

Agentic AIKiến trúc MoEChuyên gia CodingHiệu quả chi phí
minimax logominimaxM-series12 tháng 2, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
128Ktoken
Gia dau vao
$0.30/ 1M
Gia dau ra
$1.20/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
62%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. MiniMax M2.5 dat 62% trong benchmark nay.
HLE
28%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. MiniMax M2.5 dat 28% trong benchmark nay.
MMLU
85%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. MiniMax M2.5 dat 85% trong benchmark nay.
MMLU Pro
76.5%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. MiniMax M2.5 dat 76.5% trong benchmark nay.
SimpleQA
44%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. MiniMax M2.5 dat 44% trong benchmark nay.
IFEval
87.5%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. MiniMax M2.5 dat 87.5% trong benchmark nay.
AIME 2025
45%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. MiniMax M2.5 dat 45% trong benchmark nay.
MATH
72%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. MiniMax M2.5 dat 72% trong benchmark nay.
GSM8k
95.8%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. MiniMax M2.5 dat 95.8% trong benchmark nay.
MGSM
92.4%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. MiniMax M2.5 dat 92.4% trong benchmark nay.
MathVista
65%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. MiniMax M2.5 dat 65% trong benchmark nay.
SWE-Bench
80.2%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. MiniMax M2.5 dat 80.2% trong benchmark nay.
HumanEval
89.6%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. MiniMax M2.5 dat 89.6% trong benchmark nay.
LiveCodeBench
65%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. MiniMax M2.5 dat 65% trong benchmark nay.
MMMU
68%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. MiniMax M2.5 dat 68% trong benchmark nay.
MMMU Pro
54%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. MiniMax M2.5 dat 54% trong benchmark nay.
ChartQA
88%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. MiniMax M2.5 dat 88% trong benchmark nay.
DocVQA
93.2%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. MiniMax M2.5 dat 93.2% trong benchmark nay.
Terminal-Bench
52%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. MiniMax M2.5 dat 52% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. MiniMax M2.5 dat 12% trong benchmark nay.

Ve MiniMax M2.5

Tim hieu ve kha nang cua MiniMax M2.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kiến trúc Frontier hiệu quả

MiniMax M2.5 là một mô hình frontier hiệu suất cao được xây dựng trên kiến trúc 230B Mixture-of-Experts (MoE). Bằng cách chỉ kích hoạt 10 tỷ parameters cho mỗi bước chuyển tiếp, nó đạt được tốc độ inference và cấu trúc giá hiệu quả hơn gần 20 lần so với các gã khổng lồ độc quyền. Nó được thiết kế đặc biệt cho trí tuệ agentic, ưu tiên logic có cấu trúc và lập kế hoạch đa bước hơn là các cuộc trò chuyện đơn giản. Thiết kế sparse này cho phép mô hình duy trì trí tuệ cao mà không cần chi phí tính toán khổng lồ như các mô hình dense truyền thống.

Trí tuệ lập trình nâng cao

Tính năng nổi bật của mô hình là Tư duy Kiến trúc (Architect Mindset), cho phép nó hình dung cấu trúc logic và hệ thống phân cấp dự án trước khi tạo mã. Điều này làm cho nó đặc biệt hiệu quả cho kỹ thuật phần mềm tự hành, nơi nó đạt được điểm số 80.2% trên SWE-Bench Verified, ngang bằng với state-of-the-art. Với context window 1 triệu token, nó có thể tiếp nhận toàn bộ codebase, cho phép kiểm tra repo chuyên sâu và tái cấu trúc hệ thống phức tạp mà trước đây từng rất tốn kém.

Triển khai Enterprise và Cục bộ

MiniMax M2.5 hỗ trợ hơn 10 ngôn ngữ lập trình và throughput gốc lên tới 100 tokens mỗi giây trên biến thể lightning. Vì nó có sẵn dưới dạng open-weight model, các nhà phát triển có thể triển khai cục bộ để đảm bảo quyền riêng tư dữ liệu đầy đủ trong khi vẫn giữ quyền truy cập vào khả năng suy luận logic chuyên sâu như trong API được lưu trữ. Tính linh hoạt này làm cho nó trở thành một lựa chọn thiết thực cho cả pipeline agent dựa trên cloud và các công cụ phát triển on-premise.

MiniMax M2.5

Truong hop su dung cho MiniMax M2.5

Kham pha cac cach khac nhau ban co the su dung MiniMax M2.5 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Giải quyết các vấn đề GitHub thực tế và thực hiện debug trên nhiều tệp bằng cách sử dụng các agent.

Pipeline cho Enterprise Agent

Cung cấp năng lượng cho các agent chạy nền liên tục để nghiên cứu và tổng hợp dữ liệu với chi phí API thấp.

Hiện đại hóa code cũ

Refactor các kho lưu trữ cũ kỹ thuật khổng lồ sang các framework hiện đại trong khi vẫn duy trì các tiêu chuẩn logic.

Code review kiến trúc

Phân tích hệ thống phân cấp dự án để cung cấp phản hồi về logic và gợi ý tối ưu hóa cấu trúc.

Chỉnh sửa tài liệu khối lượng lớn

Xử lý các tệp văn phòng lớn với độ chính xác cao cho mô hình tài chính và pháp lý.

Công cụ lập trình độ trễ thấp

Điều khiển các tiện ích mở rộng IDE và công cụ CLI yêu cầu thời gian phản hồi dưới một giây.

Diem manh

Han che

Hiệu suất Coding đạt chuẩn state-of-the-art: Đạt điểm 80.2% trên SWE-Bench Verified, ngang bằng với hiệu suất của các mô hình đắt tiền hơn nhiều.
Độ sâu suy luận thấp hơn: Với 10B active parameters dạng thưa, mô hình đôi khi có thể thua kém các mô hình dense trong các tác vụ suy luận cực kỳ chuyên biệt.
Hiệu quả chi phí cực cao: Giá chỉ bằng khoảng 1/20 so với các đối thủ lớn, giúp việc triển khai agent quy mô lớn trở nên khả thi.
Tập trung vào văn bản: Thiếu các khả năng vision và audio gốc so với các mô hình multimodal như GPT-4o.
Throughput cao: Biến thể HighSpeed mang lại tốc độ 100 tokens mỗi giây, gấp đôi tốc độ của các mô hình truyền thống.
Yêu cầu ghi rõ nguồn: Việc sử dụng thương mại phiên bản open-weight yêu cầu ghi nguồn nổi bật cho thương hiệu MiniMax.
Khả dụng với Open-Weights: Các nhà phát triển có thể chạy mô hình cục bộ để đảm bảo quyền riêng tư dữ liệu và làm chủ toàn bộ stack.
Yêu cầu về VRAM: Chạy mô hình đầy đủ cục bộ yêu cầu phần cứng cao cấp trừ khi sử dụng quantization đáng kể.

Bat dau nhanh API

minimax/minimax-m2.5

Xem tai lieu
minimax SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: 'https://api.minimax.io/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'minimax-m2.5',
    messages: [{ role: 'user', content: 'Thiết kế kiến trúc microservices cho một ứng dụng fintech.' }],
    temperature: 0.1,
  });
  console.log(response.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve MiniMax M2.5

Xem cong dong nghi gi ve MiniMax M2.5

Giá cả của MiniMax M2.5 mới là câu chuyện thực sự, đủ rẻ để thay đổi kiến trúc, không chỉ là ngân sách.
PretendAd7988
twitter
M2.5 đang đạt các con số state-of-the-art và nó là một mô hình 10B active parameters, nghĩa là nó nhanh và rẻ.
Low-Bread-2346
reddit
Mô hình này giảm bớt công việc nặng nhọc mà người dùng phải làm chỉ để giữ cho mọi thứ vận hành.
JamMasterJulian
youtube
M2.5 đang đạt throughput ngang bằng Claude Opus 4.6 với một phần chi phí nhỏ.
Significant-Tap-7854
reddit
Chạy M2.5 cục bộ trên Mac Studio rất nhanh nhạy. 10B active parameters thực sự tạo ra sự khác biệt.
MacCoder_X
reddit
Bước lập kế hoạch kiến trúc bắt được các lỗi logic trước khi nó viết được một dòng code nào.
dev_mindset
twitter

Video ve MiniMax M2.5

Xem huong dan, danh gia va thao luan ve MiniMax M2.5

Nó rẻ hơn gần 20 lần so với các tùy chọn độc quyền hàng đầu.

Đây là một mô hình coding và agentic hàng đầu, nhanh hơn nhiều và rẻ hơn đáng kể.

Hiệu suất trên SWE-bench verified thực sự đưa nó vào danh mục elite.

Bạn nhận được trí tuệ frontier với yêu cầu phần cứng của mã nguồn mở.

Kiến trúc MoE ở đây được tinh chỉnh hoàn hảo cho các tác vụ coding độ trễ thấp.

MiniMax đang phục vụ mô hình với 3% chi phí của Opus 4.6 trong output tokens.

Chi phí cho trí tuệ thực sự đang tiến gần đến chi phí tiền điện tại thời điểm này.

Nó xử lý các context window repo lớn mà không gặp hiện tượng quên nội dung giữa chừng.

Đối với các công cụ lập trình, tốc độ của biến thể lightning là một chiến thắng lớn về UX.

Đây là lần đầu tiên tôi thấy một mô hình rẻ như vậy thực sự giải quyết được các bug logic phức tạp.

Chỉ tốn $1 để chạy mô hình liên tục trong một giờ ở tốc độ 100 tokens mỗi giây.

Khả năng suy nghĩ bên trong thực sự tỏa sáng ở đây vì nó có thể sửa lỗi ngay lập tức.

Thử nghiệm với GPT-4o, nó liên tục cung cấp các bản refactor đa tệp tốt hơn.

Các khả năng agentic được tích hợp sẵn, không phải là một suy nghĩ bổ sung trong prompt.

Nó gần như miễn phí cho các nhà phát triển nhỏ nếu xét theo các mức giá đầu vào.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho MiniMax M2.5

Meo chuyen gia giup ban tan dung toi da MiniMax M2.5 va dat ket qua tot hon.

Áp dụng tư duy kiến trúc (Architect Mindset)

Yêu cầu mô hình tạo cấu trúc dự án trước khi yêu cầu viết code triển khai thực tế.

Tận dụng context window 1M

Cung cấp tài liệu hoàn chỉnh hoặc toàn bộ các module để đảm bảo mô hình nắm bắt toàn bộ codebase của bạn.

Sử dụng gói HighSpeed

Chọn endpoint M2.5-HighSpeed để đạt tốc độ ổn định 100 tokens mỗi giây cho các agent tương tác.

Tinh chỉnh lặp lại

Yêu cầu mô hình xem xét kết quả đầu ra ban đầu để tìm các lỗ hổng logic hoặc bảo mật.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Cau hoi thuong gap ve MiniMax M2.5

Tim cau tra loi cho cac cau hoi thuong gap ve MiniMax M2.5