Giá cước của MiMo V2.5 Pro là bao nhiêu?

Giá cước là 1,00 USD cho mỗi 1 triệu input tokens và 3,00 USD cho mỗi 1 triệu output tokens trên nền tảng chính thức. Cấu trúc giá này tiết kiệm hơn đáng kể so với các mô hình closed-source như GPT-5.4 đối với các tác vụ tạo văn bản.

Làm thế nào để truy cập API của MiMo V2.5 Pro?

Quyền truy cập được cung cấp thông qua Xiaomi MiMo API Open Platform với các header tương thích với OpenAI SDK. Nó cũng khả dụng thông qua các bên tổng hợp dịch vụ bên thứ ba như OpenRouter.

Kích thước context window là bao nhiêu?

Mô hình hỗ trợ context window lên tới 1.048.576 tokens. Điều này cho phép người dùng đưa vào toàn bộ thư viện tài liệu hoặc vài giờ nội dung video trong một prompt duy nhất.

Nó so sánh thế nào với các mô hình frontier closed-source?

Nó ngang bằng hoặc vượt trội hơn các mô hình như Claude Opus 4.6 trên SWE-Bench Verified và các tác vụ agentic. Nó đạt được kết quả này trong khi tiêu thụ ít hơn khoảng 40% tokens trên mỗi trajectory.

Nó có hỗ trợ đầu vào đa phương thức (multimodal) gốc không?

Có, đây là một native omnimodal agent chấp nhận các đầu vào dạng văn bản, hình ảnh, âm thanh và video. Nó thực hiện reasoning trực tiếp trên các loại dữ liệu này mà không cần tiền xử lý bên ngoài.

Giấy phép của mô hình là gì?

MiMo V2.5 Pro được phát hành dưới Giấy phép MIT. Điều này cho phép sử dụng thương mại, sửa đổi và phân phối lại mà không bị hạn chế.

Tôi có thể sử dụng function calling không?

Có, nó hỗ trợ function calling đáng tin cậy và được tối ưu hóa cho việc sử dụng công cụ nhiều lượt (multi-turn). Nó duy trì sự mạch lạc trên các chuỗi vượt quá 1.000 lời gọi công cụ trong môi trường phần mềm.

Cần phần cứng gì để host cục bộ?

Việc host cục bộ đòi hỏi phần cứng cấp doanh nghiệp do số lượng 1,02T parameters. Các nhà phát triển nên sử dụng các cụm multi-GPU và trọng số FP8 precision để đạt hiệu quả cao.

MiMo V2.5 Pro

MiMo V2.5 Pro là mô hình MoE 1.02T parameters open-source của Xiaomi với context window 1M, hỗ trợ đa phương thức gốc và hiệu suất coding agentic đỉnh cao.

Open SourceAgentic AIMultimodal1M ContextXiaomi

otherMiMo27 tháng 4, 2026

Ngu canh

1.0Mtoken

Dau ra toi da

131Ktoken

Gia dau vao

$1.00/ 1M

Gia dau ra

$3.00/ 1M

Phuong thuc:TextImageAudioVideo

Kha nang:Thi giacCong cuTruyen truc tiepSuy luan

Diem chuan

GPQA

54%

HLE

48%

MMLU

86.7%

MMLU Pro

84.9%

SimpleQA

45%

IFEval

88%

AIME 2025

41%

MATH

75%

GSM8k

95.5%

MGSM

92%

MathVista

65%

SWE-Bench

78.9%

HumanEval

90%

LiveCodeBench

80.6%

MMMU

73%

MMMU Pro

52%

ChartQA

89%

DocVQA

93.5%

Terminal-Bench

68.4%

ARC-AGI

Xem tai lieu API

Ve MiMo V2.5 Pro

Tim hieu ve kha nang cua MiMo V2.5 Pro, tinh nang va cach no co the giup ban dat ket qua tot hon.

MiMo V2.5 Pro là mô hình flagship open-source của Xiaomi. Nó sử dụng kiến trúc Mixture-of-Experts 1,02 nghìn tỷ parameters, trong đó 42 tỷ parameters hoạt động trong quá trình inference. Thiết kế hybrid-attention pha trộn Local Sliding Window Attention và Global Attention theo tỷ lệ 6:1. Cấu hình cụ thể này giúp giảm yêu cầu lưu trữ KV-cache gần 7 lần so với các mô hình transformer tiêu chuẩn.

Mô hình xử lý context window 1 triệu token trong khi hỗ trợ các đầu vào omnimodal gốc bao gồm văn bản, hình ảnh, âm thanh và video. Nó được tối ưu hóa cho các tác vụ agentic dài hạn và sử dụng công cụ tự hành. Các nhà phát triển có thể chạy mô hình cục bộ bằng trọng số FP8 precision, giúp cân bằng giữa sử dụng bộ nhớ và throughput đầu ra. Giấy phép MIT thông thoáng cho phép sửa đổi và triển khai thương mại mà không tính thêm phí.

Truong hop su dung cho MiMo V2.5 Pro

Kham pha cac cach khac nhau ban co the su dung MiMo V2.5 Pro de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Giải quyết các vấn đề trên GitHub và xây dựng các thành phần hệ thống như trình biên dịch với logic tự sửa lỗi.

Quy trình làm việc của agent tầm nhìn dài hạn

Thực hiện các kế hoạch đòi hỏi sự mạch lạc qua hơn 1.000 lời gọi công cụ trong môi trường phần mềm.

Phân tích đa phương thức (multimodal) gốc

Reasoning trực tiếp trên các đầu vào kết hợp giữa video và văn bản mà không cần tiền xử lý hoặc trích xuất khung hình bên ngoài.

Điều hướng codebase quy mô lớn

Nạp toàn bộ kho lưu trữ dự án vào trong context window 1M token để tái cấu trúc logic hoặc tìm lỗi.

Thiết kế mạch tương tự

Tối ưu hóa các mạch phức tạp bằng cách tương tác với các vòng lặp mô phỏng để đáp ứng các thông số kỹ thuật đa chỉ số.

Tạo web 3D

Tạo các môi trường tinh vi và mô phỏng vật lý bằng Three.js và tạo địa hình theo thủ tục.

Diem manh

Han che

Mức tiêu thụ token thấp: Mang lại trí tuệ ngang tầm các mô hình frontier trong khi sử dụng ít hơn 40% đến 60% tokens trên mỗi trajectory tác vụ.

Độ trễ (latency) khi reasoning: Chế độ deep thinking có thể dẫn đến sự chậm trễ vài phút trước khi mô hình bắt đầu tạo văn bản.

Sự mạch lạc trong dài hạn: Duy trì độ chính xác của reasoning trên context window lên tới 1 triệu tokens và các chuỗi gồm hơn 1.000 lời gọi công cụ.

Truy cập nền tảng phức tạp: Cổng thông tin web chính thức có quy trình đăng nhập không ổn định mà người dùng thường mô tả là khó điều hướng.

Hiệu suất kỹ thuật phần mềm: Đạt điểm 78,9% trên SWE-bench Verified, cho thấy trình độ cao trong việc giải quyết các vấn đề code cấp độ GitHub.

Các mẫu từ chối an toàn: Đôi khi xảy ra từ chối ở ngay cuối các chu kỳ suy nghĩ dài, điều này tiêu tốn thời gian tính toán mà không cung cấp đầu ra.

Giấy phép MIT thông thoáng: Cho phép tích hợp thương mại và sửa đổi trọng số mà không có các điều khoản hạn chế như các giấy phép open-source khác.

Yêu cầu phần cứng đáng kể: Host mô hình 1.02T parameters cục bộ đòi hỏi các cụm multi-GPU, khiến việc tự host trở nên đắt đỏ đối với các nhóm nhỏ.

Bat dau nhanh API

xiaomi/mimo-v2.5-pro

Xem tai lieu

other SDK

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve MiMo V2.5 Pro

Xem cong dong nghi gi ve MiMo V2.5 Pro

“Tỷ lệ tốc độ trên context của MiMo-V2.5-Pro là vô đối cho các pipeline RAG cần quét toàn bộ codebase trong một lần.”

— u/DevBuilder

“Trung Quốc vừa bắt kịp AI coding frontier của Mỹ với chi phí token thấp hơn 40-60%. Đây không phải là sự gia tăng dần dần; đây là viết lại cuộc chơi.”

— Shruti

twitter

“MiMo-V2.5-Pro giải quyết được các vấn đề mà các chuyên gia con người phải mất hàng tuần. Nó xây dựng một trình biên dịch hoàn chỉnh chỉ trong hơn 4 giờ.”

— TechCrunchy

twitter

“Giá trị của mô hình không chỉ nằm ở các benchmark, mà ở khả năng duy trì các quy trình agent phức tạp mà không bị lỗi.”

— XiaomiMiMo Team

hackernews

“Tốc độ thực sự khá ổn cho một mô hình 1T. Việc định tuyến MoE đang thực hiện rất nhiều công việc nặng nhọc ở đây.”

— AIExplorer

“Cuối cùng cũng có một mô hình giấy phép MIT thực sự cạnh tranh với các gã khổng lồ closed-source. Triển khai cục bộ là rào cản tiếp theo.”

— OpenSourceFan

twitter

Video ve MiMo V2.5 Pro

Xem huong dan, danh gia va thao luan ve MiMo V2.5 Pro

“Tôi chưa bao giờ thấy mức độ chi tiết đó trong kết quả... hãy nhìn vào từng tấm sàn gỗ.”

“Mô hình này rất tự tin và hiệu quả khi bạn cung cấp cho nó các thông báo lỗi kỹ thuật cụ thể.”

“Nó xử lý toàn bộ ngữ cảnh codebase mà không bị mất dữ liệu ở giữa tài liệu như thường thấy.”

“Quá trình suy nghĩ rất minh bạch, cho thấy chính xác cách nó đánh giá các tùy chọn công cụ khác nhau.”

“Mô hình này vượt trội hơn các phiên bản trước trong việc tuân thủ nghiêm ngặt hướng dẫn cho các output JSON.”

“Nó được thiết kế để xử lý các quy trình làm việc đa bước phức tạp, duy trì hàng ngàn lời gọi công cụ.”

“Nó sử dụng ít hơn 40 đến 60% tokens so với các mô hình như GPT-5.4 hoặc Claude Opus 4.6 ở hiệu suất tương tự.”

“Xiaomi vừa gây sốc cho không gian AI open-source với bản phát hành này.”

“Tính đa phương thức gốc có nghĩa là nó không cần một bộ vision encoder riêng cho video.”

“Bạn có thể xây dựng hiệu quả cả một thành phần OS bằng cách cung cấp các hook môi trường phù hợp.”

“Mimo xuất hiện để cạnh tranh với tất cả mọi người... tháng đầu tiên của gói coding chỉ có sáu đô la.”

“Các benchmark chỉ nói lên một phần câu chuyện; tôi muốn chúng thực sự là những người xây dựng và lợp mái nhà một cách tử tế.”

“Nó ổn định hơn nhiều so với phiên bản V2 trước đó khi xử lý các chuỗi reasoning dài.”

“Giá trên API gốc của họ rất mạnh mẽ, có khả năng nhằm chiếm lĩnh thị trường nhà phát triển.”

“Nó gặp khó khăn một chút với âm thanh tần số rất cao nhưng xử lý lời nói hội thoại hoàn hảo.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho MiMo V2.5 Pro

Meo chuyen gia giup ban tan dung toi da MiMo V2.5 Pro va dat ket qua tot hon.

Quản lý độ trễ (latency) của Chain-of-Thought

Thêm 'don't overthink' (đừng suy nghĩ quá mức) vào prompt của bạn để giảm độ trễ khi reasoning cho các câu hỏi kỹ thuật đơn giản.

Bảo toàn nội dung reasoning

Truyền lại reasoning_content trước đó trong các cuộc hội thoại multi-turn để duy trì hiệu suất của agent.

Xác định khả năng của môi trường

Chỉ định rõ các khả năng của môi trường công cụ vì mô hình được tối ưu hóa để nhận biết harness.

Tối ưu hóa triển khai cục bộ

Sử dụng trọng số FP8 mixed precision để cân bằng giữa hiệu quả bộ nhớ và throughput đầu ra cao.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context

$0.28/$0.42/1M

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context

$0.15/$1.20/1M

Kimi K2.7 Code

Moonshot

Kimi K2.7 Code is a 1T parameter MoE model from Moonshot AI. It features a 262k context window and 30% more efficient reasoning for software engineering.

262K context

$0.95/$4.00/1M

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context

$0.60/$2.20/1M

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context

$0.12/$0.75/1M

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context

$0.15/$0.60/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Cau hoi thuong gap ve MiMo V2.5 Pro

Tim cau tra loi cho cac cau hoi thuong gap ve MiMo V2.5 Pro