minimax

MiniMax M2.5

MiniMax M2.5 เป็น MoE model ระดับ state-of-the-art ที่มาพร้อม context window ขนาด 1M และความสามารถด้าน agentic coding...

Agentic AIMoE Architectureผู้เชี่ยวชาญด้าน Codingประหยัดต้นทุน
minimax logominimaxMiniMax M-SeriesFebruary 12, 2026
บริบท
1.0Mโทเคน
เอาต์พุตสูงสุด
128Kโทเคน
ราคาอินพุต
$0.30/ 1M
ราคาเอาต์พุต
$1.20/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
62%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% MiniMax M2.5 ได้คะแนน 62% ในเกณฑ์มาตรฐานนี้
HLE
28%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง MiniMax M2.5 ได้คะแนน 28% ในเกณฑ์มาตรฐานนี้
MMLU
85%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา MiniMax M2.5 ได้คะแนน 85% ในเกณฑ์มาตรฐานนี้
MMLU Pro
76.5%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น MiniMax M2.5 ได้คะแนน 76.5% ในเกณฑ์มาตรฐานนี้
SimpleQA
44%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง MiniMax M2.5 ได้คะแนน 44% ในเกณฑ์มาตรฐานนี้
IFEval
87.5%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด MiniMax M2.5 ได้คะแนน 87.5% ในเกณฑ์มาตรฐานนี้
AIME 2025
45%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง MiniMax M2.5 ได้คะแนน 45% ในเกณฑ์มาตรฐานนี้
MATH
72%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส MiniMax M2.5 ได้คะแนน 72% ในเกณฑ์มาตรฐานนี้
GSM8k
95.8%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา MiniMax M2.5 ได้คะแนน 95.8% ในเกณฑ์มาตรฐานนี้
MGSM
92.4%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา MiniMax M2.5 ได้คะแนน 92.4% ในเกณฑ์มาตรฐานนี้
MathVista
65%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ MiniMax M2.5 ได้คะแนน 65% ในเกณฑ์มาตรฐานนี้
SWE-Bench
80.2%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python MiniMax M2.5 ได้คะแนน 80.2% ในเกณฑ์มาตรฐานนี้
HumanEval
89.6%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง MiniMax M2.5 ได้คะแนน 89.6% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
65%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง MiniMax M2.5 ได้คะแนน 65% ในเกณฑ์มาตรฐานนี้
MMMU
68%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย MiniMax M2.5 ได้คะแนน 68% ในเกณฑ์มาตรฐานนี้
MMMU Pro
54%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น MiniMax M2.5 ได้คะแนน 54% ในเกณฑ์มาตรฐานนี้
ChartQA
88%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ MiniMax M2.5 ได้คะแนน 88% ในเกณฑ์มาตรฐานนี้
DocVQA
93.2%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร MiniMax M2.5 ได้คะแนน 93.2% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
52%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line MiniMax M2.5 ได้คะแนน 52% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ MiniMax M2.5 ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ MiniMax M2.5

เรียนรู้เกี่ยวกับความสามารถของ MiniMax M2.5 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

Frontier Intelligence ประสิทธิภาพสูง

MiniMax M2.5 แสดงถึงความก้าวหน้าครั้งสำคัญในด้านประสิทธิภาพของ AI ระดับ frontier model ในฐานะ MoE model มันใช้สถาปัตยกรรมแบบ sparse ที่มีพารามิเตอร์รวม 230 พันล้าน parameters แต่จะเปิดใช้งานเพียง 10 พันล้าน parameters ต่อ token เท่านั้น การออกแบบนี้ช่วยให้สามารถมอบประสิทธิภาพที่ทัดเทียมกับ flagship model ระดับโลก ในขณะที่ยังคงความเร็วที่มากกว่าและประหยัดค่าใช้จ่ายในการดำเนินงานได้มากกว่าอย่างเห็นได้ชัด เปิดตัวในช่วงต้นปี 2026 โดยได้รับการปรับแต่งมาโดยเฉพาะสำหรับงานแบบ "agentic" ที่ AI ต้องวางแผน ปฏิบัติการ และแก้ไขตัวเองผ่านงานหลายขั้นตอน

Architectural Reasoning and Coding

หนึ่งในคุณสมบัติที่โดดเด่นที่สุดของ M2.5 คือ architectural thinking ที่เกิดขึ้นใหม่ ต่างจาก LLM มาตรฐานที่สร้างโค้ดแบบเส้นตรง M2.5 ถูกฝึกฝนมาให้วางโครงสร้างลำดับชั้นของโปรเจกต์และตรรกะก่อนที่จะเริ่มเขียนไฟล์ ความสามารถนี้เมื่อรวมกับ context window ขนาด 1 ล้าน tokens ทำให้เป็นตัวเลือกอันดับต้นๆ สำหรับวิศวกรรมซอฟต์แวร์อัตโนมัติ การรีวิวโค้ดขนาดใหญ่ และการจัดการ repository ที่ซับซ้อน รองรับภาษาโปรแกรมมากกว่า 10 ภาษา และมี throughput แบบ native สูงถึง 100 tokens ต่อวินาที

MiniMax M2.5

กรณีการใช้งานสำหรับ MiniMax M2.5

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ MiniMax M2.5 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

Agentic Software Engineering

การสร้างและทดสอบโปรเจกต์แบบหลายไฟล์โดยอัตโนมัติภายในสภาพแวดล้อม sandbox โดยใช้โหมด Architect

Office Automation ความแม่นยำสูง

การปฏิบัติภารกิจที่ซับซ้อนผ่าน Word, PowerPoint และ Excel รวมถึงการทำ financial modeling ระดับมืออาชีพ

การวิจัยเว็บแบบอัตโนมัติ

การสืบค้นข้อมูลในหน้าเว็บที่มีข้อมูลหนาแน่นเพื่อรวบรวมและสรุปข้อมูลในระดับผู้เชี่ยวชาญ

การสนับสนุนด้านเทคนิคสองภาษา

ให้ความลื่นไหลในระดับเจ้าของภาษาทั้งภาษาจีนและภาษาอังกฤษ สำหรับการทำ debugging ที่ซับซ้อนและการวางแผนสถาปัตยกรรม

การสร้างต้นแบบ 3D Simulation

สร้างสภาพแวดล้อม 3D ที่ใช้งานได้จริงและส่วนประกอบแบบโต้ตอบ เช่น Three.js ได้ในครั้งเดียว

การรีวิวโค้ดระดับองค์กร

ตรวจสอบโค้ดและทดสอบระบบอย่างครอบคลุมในกว่า 10 ภาษาโปรแกรม พร้อมการกำกับดูแลเชิงสถาปัตยกรรม

จุดแข็ง

ข้อจำกัด

ความคุ้มค่าที่เหนือชั้น: ด้วยราคา $0.30/$1.20 ต่อ 1M tokens มอบความฉลาดระดับ elite ในราคาเพียงเศษเสี้ยวของคู่แข่งระดับโลก
ข้อผิดพลาดทางตรรกะในบางครั้ง: โค้ดที่สร้างแบบ 'one-shot' ในตอนแรกอาจมีข้อผิดพลาดในการทำงาน เช่น ความไม่สอดคล้องของตรรกะในอนิเมชั่นที่ซับซ้อน
การวางแผนสถาปัตยกรรม: model แสดงความสามารถที่เป็นเอกลักษณ์ในการวางลำดับชั้นของโปรเจกต์และโครงสร้างตรรกะก่อนที่จะเริ่มสร้างโค้ด
ความหน่วงจากระยะทางภูมิศาสตร์: ผู้ใช้นอกภูมิภาคเอเชียแปซิฟิกอาจพบ latency ที่สูงกว่าหากไม่มีศูนย์กระจายข้อมูล edge ในพื้นที่
ความเร็ว Inference ขั้นสุด: การให้บริการแบบ native ที่ 100 TPS ทำให้เป็นหนึ่งใน frontier model ที่เร็วที่สุดสำหรับ workflow แบบโต้ตอบ
ช่องว่างด้านความรู้รอบตัว: แม้จะมีความถูกต้องทางเทคนิค แต่อาจมีปัญหาในการจัดการข้อมูลวัตถุในโลกจริงที่เฉพาะเจาะจงในการสร้างภาพ 3D
ประสิทธิภาพด้าน Coding ระดับแนวหน้า: ได้รับการปรับแต่งมาโดยเฉพาะสำหรับวิศวกรรมซอฟต์แวร์ในโลกแห่งความเป็นจริง โดยทำคะแนนได้ถึง 80.2% บน SWE-Bench Verified
ความอ่อนไหวต่อคำสั่ง: อาจละเลยข้อจำกัด 'single-script' สำหรับงานที่ซับซ้อน เว้นแต่จะได้รับ prompt อย่างเจาะจงเพื่อหลีกเลี่ยงการสร้างไฟล์ที่กระจัดกระจาย

เริ่มต้นด่วน API

minimax/minimax-m2.5

ดูเอกสาร
minimax SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: "https://api.minimax.chat/v1",
});

async function main() {
  const response = await client.chat.completions.create({
    model: "minimax-m2.5",
    messages: [{ role: "user", content: "Plan like an architect and code a 3D Formula 1 car drifting." }],
  });
  console.log(response.choices[0].message.content);
}

main();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ MiniMax M2.5

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ MiniMax M2.5

"MiniMax M2.5 เป็น model สำหรับ coding และ agentic ระดับท็อปที่เร็วกว่าและถูกกว่ามาก"
WorldofAI
youtube
"ความเร็วของ M2.5 ช่วยให้การทำงานของ agent รวดเร็วขึ้น มันถูกสร้างมาเพื่อเวิร์กโหลดระดับ production ที่ต้องทำงานตลอดเวลา"
MarketingNetMind
reddit
"มันให้ความรู้สึกเหมือนผู้ช่วยที่ขยันขันแข็งมากกว่าบอทที่เชื่องช้า ความเร็วคือจุดเปลี่ยนสำคัญสำหรับระบบของผม"
bruckout
reddit
"นี่ดูเหมือนจะเป็นจุดเปลี่ยนที่แท้จริง... ต้นทุนเพียงหนึ่งในสิบของ flagship model รุ่นอื่นๆ"
Techmeme
facebook
"มันทำคะแนนได้ถึง 80.2% บน SWE Bench Verified นี่คือการเปลี่ยนแปลงครั้งใหญ่สำหรับเศรษฐศาสตร์ของ agent"
jackhnels
x
"โหมดการวางแผนสถาปัตยกรรมทำให้ coding agent อัตโนมัติมีความน่าเชื่อถือเพียงพอสำหรับทีมพัฒนาแล้ว"
logic_pro
hackernews

วิดีโอเกี่ยวกับ MiniMax M2.5

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ MiniMax M2.5

ในที่สุดก็ทำให้แนวคิดเรื่องความฉลาดที่ราคาถูกจนไม่ต้องกังวลกลายเป็นจริงได้

คุณภาพมาเต็มจริงๆ... ใช้งานได้อย่างน่าทึ่งแม้แต่กับอนิเมชั่น frontend ที่ซับซ้อน

model นี้กำลังทำลายสถิติ coding benchmarks กระจุยกระจายในตอนนี้

ความสามารถในการแก้ไขตัวเองระหว่างวงจร agent คือสิ่งที่ทำให้มันต่างจาก M2.1

ผมยังไม่เห็นความคุ้มค่าระดับนี้จากเจ้าไหนเลยในปีนี้

การปรับปรุงที่สำคัญจากรุ่นก่อนๆ คือความสามารถของ M2.5 ในการคิดและวางแผนเหมือนสถาปนิก

สิ่งนี้จะกลายเป็นเครื่องมือ coding แบบ agentic ที่ทรงพลังมาก

สังเกตดูว่ามันแยกโครงสร้างโฟลเดอร์ออกมาก่อนที่จะเขียนส่วนประกอบ React จริงๆ

ความสามารถด้าน reasoning ที่นี่ทำได้เหนือกว่าจำนวน active parameters ของมันมาก

ถ้าคุณกำลังสร้าง dev agent อัตโนมัติ คุณต้องรีบทดสอบ model นี้ทันที

หากคุณต้องการใช้สิ่งนี้กับ workflow ของคุณเอง คุณน่าจะได้ผลลัพธ์การเขียนโค้ดที่ค่อนข้างดี

พวกเขาไม่ได้ล้าหลังแน่นอน... กำลังขยับเข้าใกล้คู่แข่งมากขึ้นในแง่ของประสิทธิภาพโดยรวม

การรองรับ multimodal vision จัดการกับ UI wireframes ที่ซับซ้อนได้ดีกว่า model แบบ closed-source บางตัวเสียอีก

เรากำลังเห็นแนวโน้มที่ความเร็วเริ่มมีความสำคัญพอๆ กับความฉลาดสำหรับ agent

M2.5 แสดงถึงความพร้อมของระบบนิเวศ MiniMax สำหรับนักพัฒนาทั่วโลก

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ MiniMax M2.5

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก MiniMax M2.5 และได้ผลลัพธ์ที่ดีขึ้น

ใช้ประโยชน์จาก Architect Mode

ใช้ prompt สั่ง model อย่างเจาะจงให้ 'วางแผนเหมือนสถาปนิก' เพื่อกระตุ้นการทำ reasoning เชิงลึกและการแยกส่วนโครงสร้างไฟล์

ใช้การตอบกลับแบบวนซ้ำ

สำหรับการสร้างอนิเมชั่น 3D หรือ SVG ที่ซับซ้อน ให้ส่งฟีดแบ็กเกี่ยวกับข้อผิดพลาดในการทำงานเพื่อใช้ประโยชน์จากความสามารถในการแก้ไขตัวเองแบบ agentic ของ model

จัดการ Prompt Caching

ใช้ประโยชน์จาก context window ขนาด 1M โดยการทำ caching ชุดเอกสารขนาดใหญ่ เพื่อลดต้นทุนลงได้สูงสุดถึง 90%

เลือกใช้เวอร์ชัน Lightning

ใช้เวอร์ชัน Lightning สำหรับการเขียนโค้ด UI แบบโต้ตอบเรียลไทม์เพื่อให้ได้ความเร็วในระดับ 100 TPS

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

คำถามที่พบบ่อยเกี่ยวกับ MiniMax M2.5

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ MiniMax M2.5