moonshot

Kimi K2.5

Khám phá Kimi K2.5 của Moonshot AI, một mô hình agentic open-source 1T tham số với khả năng multimodal gốc, context window 262K và khả năng reasoning...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27 tháng 1, 2026
Ngu canh
256Ktoken
Dau ra toi da
66Ktoken
Gia dau vao
$0.60/ 1M
Gia dau ra
$3.00/ 1M
Phuong thuc:TextImageVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
87.6%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Kimi K2.5 dat 87.6% trong benchmark nay.
HLE
50.2%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Kimi K2.5 dat 50.2% trong benchmark nay.
MMLU
91.5%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Kimi K2.5 dat 91.5% trong benchmark nay.
MMLU Pro
87.1%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Kimi K2.5 dat 87.1% trong benchmark nay.
SimpleQA
48%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Kimi K2.5 dat 48% trong benchmark nay.
IFEval
85%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Kimi K2.5 dat 85% trong benchmark nay.
AIME 2025
96.1%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Kimi K2.5 dat 96.1% trong benchmark nay.
MATH
90.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Kimi K2.5 dat 90.1% trong benchmark nay.
GSM8k
97.1%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Kimi K2.5 dat 97.1% trong benchmark nay.
MGSM
95%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Kimi K2.5 dat 95% trong benchmark nay.
MathVista
90.1%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Kimi K2.5 dat 90.1% trong benchmark nay.
SWE-Bench
76.8%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Kimi K2.5 dat 76.8% trong benchmark nay.
HumanEval
88%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Kimi K2.5 dat 88% trong benchmark nay.
LiveCodeBench
85%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Kimi K2.5 dat 85% trong benchmark nay.
MMMU
78.5%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Kimi K2.5 dat 78.5% trong benchmark nay.
MMMU Pro
78.5%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Kimi K2.5 dat 78.5% trong benchmark nay.
ChartQA
77.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Kimi K2.5 dat 77.5% trong benchmark nay.
DocVQA
88.8%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Kimi K2.5 dat 88.8% trong benchmark nay.
Terminal-Bench
50.8%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Kimi K2.5 dat 50.8% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Kimi K2.5 dat 12% trong benchmark nay.

Ve Kimi K2.5

Tim hieu ve kha nang cua Kimi K2.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kimi K2.5 là mô hình multimodal open-source từ Moonshot AI. Nó sử dụng kiến trúc Mixture-of-Experts 1 nghìn tỷ tham số với 32 tỷ tham số hoạt động cho mỗi token. Hệ thống hợp nhất xử lý văn bản, hình ảnh và video thông qua một framework reasoning duy nhất thay vì sử dụng các bộ mã hóa bên ngoài riêng biệt cho từng modality. Kiến trúc này cho phép mô hình xử lý 256.000 tokens context trong khi vẫn duy trì độ chính xác truy xuất cao và tính nhất quán logic xuyên suốt các chuỗi rất dài.

Mô hình nổi bật nhờ khả năng Agent Swarm. Tính năng này cho phép hệ thống phối hợp tới 100 sub-agents song song để thực thi các tác vụ nghiên cứu hoặc kỹ thuật phức tạp cùng lúc. Bằng cách tích hợp bộ mã hóa MoonViT-3D 400M tham số, K2.5 có thể phân tích vài giờ nội dung video với độ chính xác theo thời gian. Nó được thiết kế đặc biệt cho việc thực thi tự hành, vượt trội so với nhiều mô hình độc quyền trên các benchmark agentic như SWE-Bench và BrowseComp.

Kimi K2.5 cung cấp Thinking mode chuyên dụng cho các tác vụ đòi hỏi logic sâu. Khi được kích hoạt, mô hình tạo ra một chuỗi lý luận nội bộ để tự sửa lỗi và xác minh các bước trước khi đưa ra câu trả lời cuối cùng. Điều này làm cho nó cực kỳ hiệu quả đối với toán học cấp độ thi đấu và phát triển phần mềm quy mô lớn. Kinh tế token của nó được tối ưu hóa cho triển khai doanh nghiệp, mang đến trí tuệ cấp độ frontier với chi phí chỉ bằng một phần nhỏ so với các hệ thống closed-source cạnh tranh.

Kimi K2.5

Truong hop su dung cho Kimi K2.5

Kham pha cac cach khac nhau ban co the su dung Kimi K2.5 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Giải quyết các issue phức tạp trên GitHub và xây dựng kiến trúc dự án đa tệp bằng logic đã được tối ưu hóa theo SWE-Bench.

Phát triển Web trực quan

Tạo mã frontend và thiết kế UI có chức năng trực tiếp từ video quay màn hình các tương tác website hiện có.

Nghiên cứu đa luồng

Sử dụng Agent Swarm để thu thập và tổng hợp thông tin từ hơn 100 nguồn trong một quy trình làm việc song song duy nhất.

Phân tích Video dài

Trích xuất các sự kiện cụ thể và dữ liệu thời gian từ hàng giờ video an ninh hoặc bài giảng mà không cần công cụ trích xuất khung hình.

Tạo chứng minh toán học

Áp dụng deep thinking mode để giải các bài toán cấp độ Olympic với tỷ lệ chính xác 96 phần trăm.

Tự động hóa tài liệu doanh nghiệp

Tạo báo cáo PDF nhiều trang và bảng tính tài chính phức tạp từ các nguồn dữ liệu kinh doanh phi cấu trúc.

Diem manh

Han che

Hiệu suất Agentic đỉnh cao: Đạt 76.8 điểm trên SWE-Bench Verified, vượt qua nhiều frontier model độc quyền trong các tác vụ kỹ thuật phần mềm.
Yêu cầu VRAM cục bộ cực lớn: Yêu cầu 632GB VRAM cho mô hình unquantized đầy đủ, khiến hầu hết người dùng cá nhân không thể triển khai cục bộ.
Kinh tế token vượt trội: Cung cấp trí tuệ MoE 1T tham số với giá $0,60 mỗi triệu input tokens, chỉ bằng khoảng 10 phần trăm chi phí của Claude Opus.
Latency của reasoning cao hơn: Thinking mode có thể gây ra độ trễ đáng kể do mô hình tạo các chuỗi logic nội bộ trước khi phản hồi.
Khả năng hiểu Video gốc: Xử lý các tệp video phức tạp mà không cần trích xuất khung hình bên ngoài, cho phép phân tích thời gian chính xác của các bản ghi dài.
Sự lặp lại trong định dạng: Có thể tạo ra các khối văn bản quá dài trừ khi được prompt chặt chẽ để sử dụng cấu trúc đoạn văn cụ thể.
Điều phối Swarm song song: Mô hình mở duy nhất được huấn luyện để phối hợp lên đến 100 sub-agents cho các quy trình nghiên cứu đa luồng quy mô lớn.
Lo ngại về quyền lưu trữ dữ liệu: Cơ sở hạ tầng chính đặt tại Trung Quốc, có thể gây ra các vấn đề tuân thủ đối với một số doanh nghiệp phương Tây.

Bat dau nhanh API

fireworks/kimi-k2p5

Xem tai lieu
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Kimi K2.5

Xem cong dong nghi gi ve Kimi K2.5

Kimi K2.5 chỉ tốn khoảng 10 phần trăm chi phí của Opus ở cùng mức hiệu suất.
Odd_Tumbleweed574
reddit
Mọi người quên rằng Nvidia đã mất 600 tỷ đô la khi một phòng thí nghiệm Trung Quốc open source một thứ quan trọng. Kimi đang làm điều đó một lần nữa với trí tuệ frontier.
chetaslua
twitter
Khái niệm Attention Residuals trong K2.5 là thay đổi kiến trúc đầu tiên trong nhiều năm thực sự sửa được vấn đề 'quên' của LLM.
logic_king
hackernews
Workers AI hiện có thể chạy các mô hình lớn. Kimi K2.5 đứng đầu. Nó là một trong những mô hình open source tốt nhất hiện nay, rất tốt cho lập trình.
dok2001
twitter
Kimi K2.5 là một con quái vật khác biệt. Nó là một mô hình RP thông minh đáng kinh ngạc, nhưng có thể trở nên 'loạn thần' nếu bạn không sử dụng các preset của cộng đồng.
dptgreg
reddit
Tôi đã thay thế quy trình làm việc GPT 4 của mình bằng Kimi K2.5 vì thinking mode minh bạch hơn và context window xử lý được toàn bộ repo của tôi.
Dev_Max
reddit

Video ve Kimi K2.5

Xem huong dan, danh gia va thao luan ve Kimi K2.5

Kimi K2.5 đánh bại GPT 5.2 với chế độ thinking chuyên sâu, thực sự đè bẹp các frontier model khác.

Đây là mô hình lập trình open-source mạnh nhất tính đến thời điểm hiện tại với 76.8 trên SWE verified.

Agent swarm là một sự chuyển dịch từ đơn tác nhân sang đa tác nhân thực thi các quy trình song song trên tối đa 1500 bước phối hợp.

Context window rất lớn với 256k tokens, quá đủ cho hầu hết các dự án.

Moonshot thực sự đang đẩy xa ranh giới của những gì model open weights có thể làm vào đầu năm 2026.

Nó thực sự nắm bắt được toàn bộ thẩm mỹ thiết kế của Apple và tạo ra một trang web đẹp mắt với hiệu ứng chuyển động chỉ từ một video.

Tính năng Swarm trông rất ngầu và chắc chắn là thú vị khi sử dụng vì nó gán huy hiệu ID cho từng sub-agent.

K2.5 rẻ hơn nhiều với giá 60 cent cho mỗi triệu input tokens và 3 đô la cho mỗi triệu output tokens.

Khả năng xử lý video gốc có nghĩa là bạn không phải sử dụng các công cụ bên ngoài đắt đỏ để xử lý từng khung hình.

Mô hình này thay đổi cuộc chơi cho các nhà phát triển cần agent tự hành với ngân sách tiết kiệm.

Moonshot đạt được điều này bằng cách thưởng cho mỗi sub-agent ở các giai đoạn bước ngoặt để ngăn chặn sự sụp đổ chuỗi.

Mô hình học cách chọn tính song song chỉ khi nó rút ngắn con đường quan trọng, đây là sự đổi mới rất thông minh.

Kimi K2.5 vừa chạm ngưỡng có thể chạy được trên phần cứng người dùng thông thường bằng cách sử dụng GGUF.

Thinking mode cực kỳ mạnh mẽ để giải các lỗi logic phức tạp trong Python.

Chứng kiến một mô hình 1 nghìn tỷ tham số được phát hành như thế này là một điều to lớn cho cộng đồng open source.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Kimi K2.5

Meo chuyen gia giup ban tan dung toi da Kimi K2.5 va dat ket qua tot hon.

Kích hoạt Thinking Mode

Truyền tham số thinking trong yêu cầu API của bạn để đạt độ chính xác tối đa cho các tác vụ toán học và lập trình.

Kích hoạt Agent Swarm

Yêu cầu mô hình triển khai swarm cho các tác vụ nghiên cứu để ép buộc điều phối song song giữa các sub-agents.

Tối ưu hóa Temperature

Sử dụng temperature 1.0 cho thinking mode để cho phép reasoning đa dạng, nhưng hạ xuống 0.6 cho chat tiêu chuẩn.

Kết hợp Prompts Hình ảnh và Văn bản

Tải lên ảnh chụp màn hình lỗi kèm theo đoạn mã để tận dụng khả năng huấn luyện tích hợp text-vision của mô hình.

Context Caching

Sử dụng context caching cho các tài liệu dài được truy cập lặp lại để giảm chi phí input lên đến 90 phần trăm.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Cau hoi thuong gap ve Kimi K2.5

Tim cau tra loi cho cac cau hoi thuong gap ve Kimi K2.5