other

MiMo V2.5 Pro

MiMo V2.5 Pro là mô hình MoE 1.02T parameters open-source của Xiaomi với context window 1M, hỗ trợ đa phương thức gốc và hiệu suất coding agentic đỉnh cao.

Open SourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo27 tháng 4, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
131Ktoken
Gia dau vao
$1.00/ 1M
Gia dau ra
$3.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
54%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. MiMo V2.5 Pro dat 54% trong benchmark nay.
HLE
48%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. MiMo V2.5 Pro dat 48% trong benchmark nay.
MMLU
86.7%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. MiMo V2.5 Pro dat 86.7% trong benchmark nay.
MMLU Pro
84.9%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. MiMo V2.5 Pro dat 84.9% trong benchmark nay.
SimpleQA
45%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. MiMo V2.5 Pro dat 45% trong benchmark nay.
IFEval
88%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. MiMo V2.5 Pro dat 88% trong benchmark nay.
AIME 2025
41%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. MiMo V2.5 Pro dat 41% trong benchmark nay.
MATH
75%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. MiMo V2.5 Pro dat 75% trong benchmark nay.
GSM8k
95.5%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. MiMo V2.5 Pro dat 95.5% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. MiMo V2.5 Pro dat 92% trong benchmark nay.
MathVista
65%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. MiMo V2.5 Pro dat 65% trong benchmark nay.
SWE-Bench
78.9%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. MiMo V2.5 Pro dat 78.9% trong benchmark nay.
HumanEval
90%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. MiMo V2.5 Pro dat 90% trong benchmark nay.
LiveCodeBench
80.6%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. MiMo V2.5 Pro dat 80.6% trong benchmark nay.
MMMU
73%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. MiMo V2.5 Pro dat 73% trong benchmark nay.
MMMU Pro
52%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. MiMo V2.5 Pro dat 52% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. MiMo V2.5 Pro dat 89% trong benchmark nay.
DocVQA
93.5%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. MiMo V2.5 Pro dat 93.5% trong benchmark nay.
Terminal-Bench
68.4%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. MiMo V2.5 Pro dat 68.4% trong benchmark nay.
ARC-AGI
8%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. MiMo V2.5 Pro dat 8% trong benchmark nay.

Ve MiMo V2.5 Pro

Tim hieu ve kha nang cua MiMo V2.5 Pro, tinh nang va cach no co the giup ban dat ket qua tot hon.

MiMo V2.5 Pro là mô hình flagship open-source của Xiaomi. Nó sử dụng kiến trúc Mixture-of-Experts 1,02 nghìn tỷ parameters, trong đó 42 tỷ parameters hoạt động trong quá trình inference. Thiết kế hybrid-attention pha trộn Local Sliding Window Attention và Global Attention theo tỷ lệ 6:1. Cấu hình cụ thể này giúp giảm yêu cầu lưu trữ KV-cache gần 7 lần so với các mô hình transformer tiêu chuẩn.

Mô hình xử lý context window 1 triệu token trong khi hỗ trợ các đầu vào omnimodal gốc bao gồm văn bản, hình ảnh, âm thanh và video. Nó được tối ưu hóa cho các tác vụ agentic dài hạn và sử dụng công cụ tự hành. Các nhà phát triển có thể chạy mô hình cục bộ bằng trọng số FP8 precision, giúp cân bằng giữa sử dụng bộ nhớ và throughput đầu ra. Giấy phép MIT thông thoáng cho phép sửa đổi và triển khai thương mại mà không tính thêm phí.

MiMo V2.5 Pro

Truong hop su dung cho MiMo V2.5 Pro

Kham pha cac cach khac nhau ban co the su dung MiMo V2.5 Pro de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Giải quyết các vấn đề trên GitHub và xây dựng các thành phần hệ thống như trình biên dịch với logic tự sửa lỗi.

Quy trình làm việc của agent tầm nhìn dài hạn

Thực hiện các kế hoạch đòi hỏi sự mạch lạc qua hơn 1.000 lời gọi công cụ trong môi trường phần mềm.

Phân tích đa phương thức (multimodal) gốc

Reasoning trực tiếp trên các đầu vào kết hợp giữa video và văn bản mà không cần tiền xử lý hoặc trích xuất khung hình bên ngoài.

Điều hướng codebase quy mô lớn

Nạp toàn bộ kho lưu trữ dự án vào trong context window 1M token để tái cấu trúc logic hoặc tìm lỗi.

Thiết kế mạch tương tự

Tối ưu hóa các mạch phức tạp bằng cách tương tác với các vòng lặp mô phỏng để đáp ứng các thông số kỹ thuật đa chỉ số.

Tạo web 3D

Tạo các môi trường tinh vi và mô phỏng vật lý bằng Three.js và tạo địa hình theo thủ tục.

Diem manh

Han che

Mức tiêu thụ token thấp: Mang lại trí tuệ ngang tầm các mô hình frontier trong khi sử dụng ít hơn 40% đến 60% tokens trên mỗi trajectory tác vụ.
Độ trễ (latency) khi reasoning: Chế độ deep thinking có thể dẫn đến sự chậm trễ vài phút trước khi mô hình bắt đầu tạo văn bản.
Sự mạch lạc trong dài hạn: Duy trì độ chính xác của reasoning trên context window lên tới 1 triệu tokens và các chuỗi gồm hơn 1.000 lời gọi công cụ.
Truy cập nền tảng phức tạp: Cổng thông tin web chính thức có quy trình đăng nhập không ổn định mà người dùng thường mô tả là khó điều hướng.
Hiệu suất kỹ thuật phần mềm: Đạt điểm 78,9% trên SWE-bench Verified, cho thấy trình độ cao trong việc giải quyết các vấn đề code cấp độ GitHub.
Các mẫu từ chối an toàn: Đôi khi xảy ra từ chối ở ngay cuối các chu kỳ suy nghĩ dài, điều này tiêu tốn thời gian tính toán mà không cung cấp đầu ra.
Giấy phép MIT thông thoáng: Cho phép tích hợp thương mại và sửa đổi trọng số mà không có các điều khoản hạn chế như các giấy phép open-source khác.
Yêu cầu phần cứng đáng kể: Host mô hình 1.02T parameters cục bộ đòi hỏi các cụm multi-GPU, khiến việc tự host trở nên đắt đỏ đối với các nhóm nhỏ.

Bat dau nhanh API

xiaomi/mimo-v2.5-pro

Xem tai lieu
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve MiMo V2.5 Pro

Xem cong dong nghi gi ve MiMo V2.5 Pro

Tỷ lệ tốc độ trên context của MiMo-V2.5-Pro là vô đối cho các pipeline RAG cần quét toàn bộ codebase trong một lần.
u/DevBuilder
reddit
Trung Quốc vừa bắt kịp AI coding frontier của Mỹ với chi phí token thấp hơn 40-60%. Đây không phải là sự gia tăng dần dần; đây là viết lại cuộc chơi.
Shruti
twitter
MiMo-V2.5-Pro giải quyết được các vấn đề mà các chuyên gia con người phải mất hàng tuần. Nó xây dựng một trình biên dịch hoàn chỉnh chỉ trong hơn 4 giờ.
TechCrunchy
twitter
Giá trị của mô hình không chỉ nằm ở các benchmark, mà ở khả năng duy trì các quy trình agent phức tạp mà không bị lỗi.
XiaomiMiMo Team
hackernews
Tốc độ thực sự khá ổn cho một mô hình 1T. Việc định tuyến MoE đang thực hiện rất nhiều công việc nặng nhọc ở đây.
AIExplorer
reddit
Cuối cùng cũng có một mô hình giấy phép MIT thực sự cạnh tranh với các gã khổng lồ closed-source. Triển khai cục bộ là rào cản tiếp theo.
OpenSourceFan
twitter

Video ve MiMo V2.5 Pro

Xem huong dan, danh gia va thao luan ve MiMo V2.5 Pro

Tôi chưa bao giờ thấy mức độ chi tiết đó trong kết quả... hãy nhìn vào từng tấm sàn gỗ.

Mô hình này rất tự tin và hiệu quả khi bạn cung cấp cho nó các thông báo lỗi kỹ thuật cụ thể.

Nó xử lý toàn bộ ngữ cảnh codebase mà không bị mất dữ liệu ở giữa tài liệu như thường thấy.

Quá trình suy nghĩ rất minh bạch, cho thấy chính xác cách nó đánh giá các tùy chọn công cụ khác nhau.

Mô hình này vượt trội hơn các phiên bản trước trong việc tuân thủ nghiêm ngặt hướng dẫn cho các output JSON.

Nó được thiết kế để xử lý các quy trình làm việc đa bước phức tạp, duy trì hàng ngàn lời gọi công cụ.

Nó sử dụng ít hơn 40 đến 60% tokens so với các mô hình như GPT-5.4 hoặc Claude Opus 4.6 ở hiệu suất tương tự.

Xiaomi vừa gây sốc cho không gian AI open-source với bản phát hành này.

Tính đa phương thức gốc có nghĩa là nó không cần một bộ vision encoder riêng cho video.

Bạn có thể xây dựng hiệu quả cả một thành phần OS bằng cách cung cấp các hook môi trường phù hợp.

Mimo xuất hiện để cạnh tranh với tất cả mọi người... tháng đầu tiên của gói coding chỉ có sáu đô la.

Các benchmark chỉ nói lên một phần câu chuyện; tôi muốn chúng thực sự là những người xây dựng và lợp mái nhà một cách tử tế.

Nó ổn định hơn nhiều so với phiên bản V2 trước đó khi xử lý các chuỗi reasoning dài.

Giá trên API gốc của họ rất mạnh mẽ, có khả năng nhằm chiếm lĩnh thị trường nhà phát triển.

Nó gặp khó khăn một chút với âm thanh tần số rất cao nhưng xử lý lời nói hội thoại hoàn hảo.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho MiMo V2.5 Pro

Meo chuyen gia giup ban tan dung toi da MiMo V2.5 Pro va dat ket qua tot hon.

Quản lý độ trễ (latency) của Chain-of-Thought

Thêm 'don't overthink' (đừng suy nghĩ quá mức) vào prompt của bạn để giảm độ trễ khi reasoning cho các câu hỏi kỹ thuật đơn giản.

Bảo toàn nội dung reasoning

Truyền lại reasoning_content trước đó trong các cuộc hội thoại multi-turn để duy trì hiệu suất của agent.

Xác định khả năng của môi trường

Chỉ định rõ các khả năng của môi trường công cụ vì mô hình được tối ưu hóa để nhận biết harness.

Tối ưu hóa triển khai cục bộ

Sử dụng trọng số FP8 mixed precision để cân bằng giữa hiệu quả bộ nhớ và throughput đầu ra cao.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

Cau hoi thuong gap ve MiMo V2.5 Pro

Tim cau tra loi cho cac cau hoi thuong gap ve MiMo V2.5 Pro