Kimi K2.5

Khám phá Kimi K2.5 của Moonshot AI, một model agentic open-source với 1T-parameter, tích hợp khả năng multimodal gốc, context window 262K và khả năng reasoning...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
Ngu canh
262Ktoken
Dau ra toi da
33Ktoken
Gia dau vao
$0.60/ 1M
Gia dau ra
$2.50/ 1M
Phuong thuc:TextImageVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
87.6%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Kimi K2.5 dat 87.6% trong benchmark nay.
HLE
50.2%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Kimi K2.5 dat 50.2% trong benchmark nay.
MMLU
92%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Kimi K2.5 dat 92% trong benchmark nay.
MMLU Pro
87.1%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Kimi K2.5 dat 87.1% trong benchmark nay.
SimpleQA
54%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Kimi K2.5 dat 54% trong benchmark nay.
IFEval
94%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Kimi K2.5 dat 94% trong benchmark nay.
AIME 2025
96.1%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Kimi K2.5 dat 96.1% trong benchmark nay.
MATH
98%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Kimi K2.5 dat 98% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Kimi K2.5 dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Kimi K2.5 dat 96% trong benchmark nay.
MathVista
84.2%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Kimi K2.5 dat 84.2% trong benchmark nay.
SWE-Bench
76.8%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Kimi K2.5 dat 76.8% trong benchmark nay.
HumanEval
99%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Kimi K2.5 dat 99% trong benchmark nay.
LiveCodeBench
85%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Kimi K2.5 dat 85% trong benchmark nay.
MMMU
84%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Kimi K2.5 dat 84% trong benchmark nay.
MMMU Pro
78.5%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Kimi K2.5 dat 78.5% trong benchmark nay.
ChartQA
77.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Kimi K2.5 dat 77.5% trong benchmark nay.
DocVQA
88.8%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Kimi K2.5 dat 88.8% trong benchmark nay.
Terminal-Bench
50.8%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Kimi K2.5 dat 50.8% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Kimi K2.5 dat 12% trong benchmark nay.

Ve Kimi K2.5

Tim hieu ve kha nang cua Kimi K2.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một ranh giới mới trong Trí tuệ Agentic

Kimi K2.5 là model agentic flagship open-source từ Moonshot AI, đại diện cho một bước nhảy vọt lớn trong trí tuệ multimodal thống nhất. Được xây dựng trên kiến trúc Mixture-of-Experts (MoE) 1 nghìn tỷ parameters khổng lồ với 32 tỷ parameters hoạt động, nó tích hợp khả năng xử lý văn bản, hình ảnh và video một cách tự nhiên vào một khung reasoning duy nhất. Không giống như các LLM truyền thống, K2.5 được thiết kế đặc biệt cho việc thực thi tự chủ, sở hữu chế độ 'Thinking' độc đáo cho phép nó tự sửa lỗi và suy luận qua các vấn đề đa bước phức tạp mà không cần sự can thiệp của con người.

Những đột phá về kiến trúc

Model giới thiệu một tính năng mang tính cách mạng mang tên 'Agent Swarm', cho phép hệ thống điều phối linh hoạt tới 100 sub-agents song song để giải quyết các tác vụ nghiên cứu hoặc kỹ thuật quy mô lớn. Bằng cách đạt được hiệu suất hàng đầu trên các benchmark như SWE-Bench và AIME 2025, Kimi K2.5 thu hẹp khoảng cách giữa các open-source model và các frontier AI độc quyền, mang lại khả năng ưu việt với chi phí vận hành chỉ bằng một phần nhỏ. Việc tích hợp bộ mã hóa MoonViT-3D cho phép khả năng hiểu video chưa từng có, bao quát nội dung dài vài giờ với độ chính xác về thời gian cao.

Hiệu quả vô song

Bên cạnh sức mạnh thô, K2.5 tập trung vào tính kinh tế bền vững của token. Bằng cách sử dụng cơ chế caching context mạnh mẽ và cấu trúc MoE được tối ưu hóa cao, nó mang lại hiệu suất tương đương với các closed-source model đắt đỏ nhất trong khi vẫn duy trì mức giá cực kỳ cạnh tranh là $0.60 trên mỗi triệu input tokens. Điều này khiến nó trở thành nền tảng lý tưởng cho các doanh nghiệp đang tìm cách triển khai các autonomous agents với context dài và phức tạp ở quy mô lớn.

Kimi K2.5

Truong hop su dung cho Kimi K2.5

Kham pha cac cach khac nhau ban co the su dung Kimi K2.5 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự chủ

Giải quyết các issue phức tạp trên GitHub và thực hiện sao chép website full-stack từ các bản phác thảo giao diện UI.

Giải toán cấp độ Olympic

Xử lý các chứng minh toán học nâng cao và các bài toán cấp độ thi đấu với độ chính xác trên 96% trong kỳ thi AIME 2025.

Reasoning video dài

Phân tích và tóm tắt nội dung từ các video dài tới hai giờ mà không bị mất context hoặc suy giảm chất lượng theo thời gian.

Agent nghiên cứu động

Sử dụng 'Agent Swarm' để thực hiện nghiên cứu web đa luồng và tổng hợp dữ liệu từ hàng trăm nguồn song song.

Tạo Frontend thẩm mỹ

Chuyển đổi các bản phác thảo UI hoặc ảnh chụp màn hình thành mã React hoàn chỉnh, chức năng với các hiệu ứng chuyển động mượt mà.

Điều khiển Terminal tự chủ

Thực thi các lệnh bash phức tạp và các hoạt động cấp hệ thống để quản lý các cụm máy chủ và môi trường phát triển.

Diem manh

Han che

Reasoning toán học đẳng cấp: Đạt 96.1% trong kỳ thi AIME 2025, vượt qua gần như tất cả các closed-source model trong khả năng suy luận logic thuần túy.
Yêu cầu phần cứng cao: Việc chạy model 1T đầy đủ cục bộ đòi hỏi một cụm AI cấp doanh nghiệp với nhiều GPU H100 hoặc B200.
Khả năng song song hóa khổng lồ: Tính năng 'Agent Swarm' cho phép điều phối hơn 100 sub-agents, giúp giảm đáng kể thời gian hoàn thành các tác vụ nghiên cứu.
Latency khi Thinking: Việc kích hoạt chế độ deep reasoning làm tăng đáng kể thời gian phản hồi token đầu tiên so với xử lý tiêu chuẩn.
Kiến trúc Multimodal thống nhất: Xử lý video 2 giờ và hình ảnh độ phân giải cao một cách tự nhiên mà không cần các bộ mã hóa vision riêng biệt.
Khoảng cách kiến thức cấp độ Tiến sĩ: Điểm số 50.2% trong kỳ thi 'Humanity's Last Exam' cho thấy vẫn còn không gian để cải thiện chuyên môn khoa học cấp độ cao.
Kinh tế Token vượt trội: Với mức giá $0.60/1M input tokens, nó rẻ hơn khoảng 8-10 lần so với các frontier model tương đương như Claude 4.5.
Quan ngại về quy định: Là một model của Trung Quốc, việc sử dụng API và chủ quyền dữ liệu có thể phải tuân thủ các khung quy định khác nhau đối với các doanh nghiệp phương Tây.

Bat dau nhanh API

fireworks/kimi-k2p5

Xem tai lieu
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Kimi K2.5

Xem cong dong nghi gi ve Kimi K2.5

"Khả năng reasoning trong kỳ thi AIME 2025 thực sự điên rồ đối với một open model."
LogicLover
reddit
"Kimi K2.5 vừa thiết lập một tiêu chuẩn mới cho khả năng hiểu video dài. Cuối cùng cũng có một model không quên mất phần đầu của clip."
AI_Pioneer
x
"Sử dụng K2.5 như một coding agent là một bước ngoặt lớn. Điểm số SWE-Bench của nó không chỉ là những con số, bạn có thể cảm nhận được năng lực thực sự."
DevGuru
hackernews
"Trung Quốc vừa phát hành Kimi K2.5 và đúng như dự đoán, hiệu suất của nó ngang ngửa với các frontier AI model của Mỹ."
BasedTorba
x
"Kimi từ Trung Quốc vừa phá hủy giấc mơ kinh doanh nghìn tỷ của OpenAI... rẻ hơn gấp 8 lần."
nrqa__
x
"Kimi K2.5 là model đầu tiên thực sự mang lại cảm giác như một co-pilot thay vì chỉ là một hộp thoại chat."
CodeWizard
reddit

Video ve Kimi K2.5

Xem huong dan, danh gia va thao luan ve Kimi K2.5

Khi thử nghiệm các bài toán AIME, Kimi K2.5 đã giải đúng gần như mọi thứ, ngay cả những bài mà GPT-4o gặp khó khăn.

Đối với các tác vụ lập trình, khả năng agentic rõ ràng là nơi model này tỏa sáng so với các LLM tiêu chuẩn.

Bản chất open-source của một model nghìn tỷ parameters như thế này là điều chưa từng có trên thị trường hiện nay.

Bạn đang thấy khả năng xử lý logic ở đây có thể cạnh tranh với o1 trong các bài kiểm tra toán ban đầu của tôi.

Giá token thấp đến mức nó thực sự dập tắt mọi lý do sử dụng các closed-source model cho các tác vụ cơ bản.

Khả năng xử lý video dài hai giờ trong một lần mà không làm mất context là một bước đột phá lớn.

Đây không chỉ là một chat model; nó được thiết kế từ đầu để sử dụng các công cụ và terminal.

Khi bạn kích hoạt chế độ Swarm, khả năng song song hóa để nghiên cứu web cơ bản là không có đối thủ.

Đây là cách Moonshot AI thông báo với thế giới rằng họ có cả năng lực tính toán lẫn tài năng.

Nhìn cách nó điều hướng terminal trực tiếp để sửa lỗi là tương lai của kỹ thuật phần mềm tự chủ.

Bước nhảy vọt của Kimi K2.5 trong benchmark BrowseComp cho thấy nó có thể điều hướng web với mức độ bền bỉ mà chúng ta chưa từng thấy.

Việc hợp nhất các chế độ vision và thinking vào một kiến trúc duy nhất mới chính là câu chuyện thực sự về mặt kiến trúc ở đây.

Hiệu suất trên MMLU và GSM8k chứng minh rằng chất lượng dữ liệu được sử dụng để training là hàng đầu.

Không giống như các phiên bản trước, khả năng hiểu video ở đây không bị suy giảm theo thời gian.

Nếu bạn là lập trình viên, khả năng tương thích với OpenAI giúp việc chuyển sang model này để thử nghiệm gần như không tốn công sức.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho Kimi K2.5

Meo chuyen gia giup ban tan dung toi da Kimi K2.5 va dat ket qua tot hon.

Tận dụng Chế độ Thinking

Hãy prompt model một cách rõ ràng với yêu cầu 'Think step-by-step' để kích hoạt chế độ reasoning cho các tác vụ toán học hoặc lập trình nặng về logic.

Lợi thế Context Video

Sử dụng bộ mã hóa MoonViT-3D của model để xử lý các video cực dài; nó đặc biệt xuất sắc trong việc tìm kiếm các chi tiết cụ thể trong các clip dài 2 giờ.

Điều phối Agent

Đối với các dự án lớn, hãy tận dụng khả năng swarm để K2.5 chia nhỏ các tác vụ thành các sub-tasks nhằm thực thi nhanh hơn.

Tiết kiệm nhờ Cache Hit

Cấu trúc các lệnh gọi API của bạn để tận dụng tính năng caching context mạnh mẽ của Moonshot, giúp giảm chi phí đầu vào lên đến 75%.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Cau hoi thuong gap ve Kimi K2.5

Tim cau tra loi cho cac cau hoi thuong gap ve Kimi K2.5