moonshot

Kimi K2 Thinking

Kimi K2 Thinking là model reasoning quy mô nghìn tỷ tham số của Moonshot AI. Model này vượt trội hơn GPT-5 trên benchmark HLE và hỗ trợ thực hiện 300 lượt gọi...

moonshot logomoonshotKimi2025-11-06
Ngu canh
256Ktoken
Dau ra toi da
16Ktoken
Gia dau vao
$0.15/ 1M
Gia dau ra
$0.15/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
93%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Kimi K2 Thinking dat 93% trong benchmark nay.
HLE
44.9%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Kimi K2 Thinking dat 44.9% trong benchmark nay.
MMLU
90%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Kimi K2 Thinking dat 90% trong benchmark nay.
MMLU Pro
78%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Kimi K2 Thinking dat 78% trong benchmark nay.
SimpleQA
55%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Kimi K2 Thinking dat 55% trong benchmark nay.
IFEval
92%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Kimi K2 Thinking dat 92% trong benchmark nay.
AIME 2025
99.1%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Kimi K2 Thinking dat 99.1% trong benchmark nay.
MATH
99.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Kimi K2 Thinking dat 99.1% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Kimi K2 Thinking dat 99% trong benchmark nay.
MGSM
95%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Kimi K2 Thinking dat 95% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Kimi K2 Thinking dat 75% trong benchmark nay.
SWE-Bench
71.3%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Kimi K2 Thinking dat 71.3% trong benchmark nay.
HumanEval
83%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Kimi K2 Thinking dat 83% trong benchmark nay.
LiveCodeBench
83.1%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Kimi K2 Thinking dat 83.1% trong benchmark nay.
MMMU
80%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Kimi K2 Thinking dat 80% trong benchmark nay.
MMMU Pro
60%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Kimi K2 Thinking dat 60% trong benchmark nay.
ChartQA
88%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Kimi K2 Thinking dat 88% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Kimi K2 Thinking dat 94% trong benchmark nay.
Terminal-Bench
55%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Kimi K2 Thinking dat 55% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Kimi K2 Thinking dat 12% trong benchmark nay.

Ve Kimi K2 Thinking

Tim hieu ve kha nang cua Kimi K2 Thinking, tinh nang va cach no co the giup ban dat ket qua tot hon.

Trí tuệ Open Intelligence nghìn tỷ tham số

Kimi K2 Thinking là một model reasoning 1T parameter đột phá từ Moonshot AI, định nghĩa lại ranh giới của trí tuệ open-source. Được phát hành vào tháng 11 năm 2025, nó sử dụng kiến trúc Mixture-of-Experts (MoE) tinh vi với tổng cộng 1T parameters — chỉ kích hoạt 32B khi inference — giúp nó vừa mạnh mẽ đáng kể vừa hiệu quả về mặt tính toán. Không giống như các ngôn ngữ model tiêu chuẩn, K2 Thinking được thiết kế như một "agent tư duy", mở rộng quy mô tính toán trong test-time để thực hiện reasoning logic sâu sắc, lập kế hoạch và sử dụng tool tự chủ.

Sức mạnh Agentic và khả năng mở rộng

Model này đặc biệt nổi tiếng với khả năng agentic, thực hiện thành công tới 300 lượt gọi tool tuần tự mà không cần sự can thiệp của con người. Điều này khiến nó trở thành lựa chọn đáng gờm cho nghiên cứu phức tạp, lập trình thi đấu và các quy trình kỹ thuật đa bước. Bằng cách sử dụng độ chính xác INT4 nguyên bản thông qua Quantization-Aware Training, Moonshot AI đã cho phép model khổng lồ này chạy trên các cụm phần cứng phổ biến trong khi vẫn vượt qua các đối thủ closed-source như GPT-5 và Claude 4.5 trong các benchmark về reasoning và duyệt web quan trọng.

Kiến trúc ưu tiên nhà phát triển

Được thiết kế cho cộng đồng nhà phát triển toàn cầu, Kimi K2-Thinking cung cấp các chỉ số hiệu suất trên chi phí vô đối. Với context window khổng lồ 256K và hỗ trợ xử lý chain-of-thought chuyên sâu, nó thu hẹp khoảng cách giữa các model chuyên dụng local và các cloud API cấp doanh nghiệp. Phương pháp huấn luyện của nó tập trung vào việc lập kế hoạch dài hạn, cho phép model phản hồi, sửa lỗi và tối ưu hóa kết quả đầu ra của chính mình một cách lặp đi lặp lại.

Kimi K2 Thinking

Truong hop su dung cho Kimi K2 Thinking

Kham pha cac cach khac nhau ban co the su dung Kimi K2 Thinking de dat ket qua tuyet voi.

Nghiên cứu tự chủ

Thực hiện các truy vấn web chuyên sâu đòi hỏi hàng trăm lượt gọi tool liên tiếp và xác minh thông tin lặp đi lặp lại.

Giải quyết vấn đề khoa học

Giải quyết các câu hỏi toán học và vật lý cấp độ Tiến sĩ bằng cách thực thi công cụ Python và xử lý chain-of-thought.

Lập trình thi đấu

Giải các thử thách thuật toán có độ khó cao từ các nền tảng như Codeforces và LeetCode với độ chính xác cấp độ Tiến sĩ.

Debug mã nguồn phức tạp

Xác định và khắc phục các lỗi logic trong các codebase đa tệp khổng lồ thông qua các bước reasoning thấu đáo và dài hạn.

Phân tích pháp lý và tuân thủ

Xem xét các tài liệu kỹ thuật hoặc pháp lý dài trong context window 256K để xác định các rủi ro hoặc mâu thuẫn nhỏ.

Tự động hóa Agentic AI

Cung cấp sức mạnh cho các agent tự chủ có thể lập kế hoạch, hành động, phản hồi và tinh chỉnh kết quả đầu ra của chính chúng trong nhiều giờ mà không cần sự can thiệp của con người.

Diem manh

Han che

Độ sâu Agentic: Model open-weights duy nhất có khả năng quản lý 200–300 lượt gọi tool liên tiếp mà không bị suy giảm hiệu suất.
Chỉ nhận đầu vào văn bản: Hiện tại thiếu hỗ trợ thị giác multimodal nguyên bản để xử lý trực tiếp các tệp hình ảnh, video hoặc âm thanh.
Reasoning vượt trội (State-of-the-Art): Vượt trội hơn GPT-5 và Claude 4.5 trên Humanity's Last Exam (HLE) và BrowseComp nhờ tăng cường tính toán trong test-time.
Yêu cầu RAM khổng lồ: Việc triển khai local toàn bộ kiến trúc 1T đòi hỏi hơn 500GB RAM hoặc các cụm Mac phân tán.
Hiệu quả chi phí vô đối: Với mức giá cố định $0.15/1M tokens, model cung cấp trí tuệ frontier model với chi phí chỉ bằng một phần nhỏ so với các API độc quyền.
Độ trễ token đầu tiên: Giai đoạn reasoning nội bộ chuyên sâu dẫn đến thời gian phản hồi token đầu tiên chậm hơn so với các LLM không có cơ chế thinking.
Tối ưu hóa INT4 nguyên bản: Việc quantization nguyên bản thông qua Quantization-Aware Training giúp tăng tốc độ gấp 2 lần cho inference local trên các phần cứng phổ biến.
Reasoning rườm rà: Model có thể tạo ra các chuỗi chain-of-thought dài quá mức ngay cả đối với các truy vấn tương đối đơn giản.

Bat dau nhanh API

moonshot/kimi-k2-thinking

Xem tai lieu
moonshot SDK
import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.ai/v1',
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning AI by Moonshot AI.' },
      { role: 'user', content: 'Solve the Riemann Hypothesis proof verification task.' }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Kimi K2 Thinking

Xem cong dong nghi gi ve Kimi K2 Thinking

"Kimi K2 Thinking là model AI tốt nhất mà tôi từng sử dụng... không có hiện tượng ảo giác và thực hiện hàng trăm lượt gọi tool."
Alex Finn
youtube
"Khoảng cách giữa closed-source và open-source tiếp tục thu hẹp ngay cả khi chi phí tokens giảm mạnh."
Emad Mostaque
x
"Moonshot K2-Thinking đang định nghĩa lại các agent thông minh local với 300 lượt gọi tool."
Brian Roemmele
x
"Cuối cùng cũng có một model thực sự suy nghĩ thấu đáo logic của prompt trước khi trả lời!"
ai_user_2025
reddit
"Trung Quốc đang thực sự thúc đẩy ranh giới open-source open weights với dòng Kimi."
Nathan Lambert
x
"Hiệu suất thực sự gây kinh ngạc đối với các bài toán thi đấu."
MathWizard
hackernews

Video ve Kimi K2 Thinking

Xem huong dan, danh gia va thao luan ve Kimi K2 Thinking

Đây là model độc lập có tính agentic cao nhất từng được tạo ra.

Nó có khả năng tư duy và phản hồi trong từng bước thực hiện. Vì vậy, nó không bao giờ bị lạc hướng.

Nó cực kỳ hiệu quả về chi phí... giá chỉ bằng một nửa so với ChatGPT-5 và khoảng một phần mười so với Sonnet 4.5.

Nó tránh được các bẫy logic phổ biến của các LLM tiêu chuẩn.

Moonshot thực sự đang thay đổi cuộc chơi cho khả năng tiếp cận open-weight.

Nó có thể thực hiện tới 200 đến 300 lượt gọi tool tuần tự mà không cần sự can thiệp của con người.

K2 Thinking đạt số điểm 60.2%, vượt xa mức cơ bản của con người là 29.2% trên BrowseComp.

Trung Quốc thực sự đang thúc đẩy ranh giới của open-source và open weights.

Việc triển khai Mixture-of-Experts ở đây cực kỳ hiệu quả cho 1 nghìn tỷ parameters.

Bạn có được khả năng reasoning cấp độ frontier model với chi phí cực rẻ.

Tôi đang chạy nó ở đây trên một chiếc Mac Studio sử dụng thiết lập kiểm soát giới hạn dây dẫn.

Chúng tôi đang sử dụng hết 500 GB RAM. Tốc độ xử lý đã giảm xuống còn khoảng 6.9 tokens mỗi giây.

Nó thực sự đã viết xong đoạn code này, nhưng nó không dừng lại. Nó bắt đầu tư duy tiếp.

Ngay cả khi quantization, tính mạch lạc logic của model này vẫn thuộc hàng xuất sắc.

Lời thoại nội bộ cho thấy chính xác nơi nó tự sửa lỗi coding của chính mình.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho Kimi K2 Thinking

Meo chuyen gia giup ban tan dung toi da Kimi K2 Thinking va dat ket qua tot hon.

Bật Thinking Tags

Khi chạy local qua các công cụ như llama.cpp, hãy đảm bảo bạn sử dụng flag --special để hiển thị chính xác các <think> tokens nội bộ.

Tối ưu hóa Temperature

Đặt temperature thành 1.0 và min_p thành 0.01 để có kết quả reasoning ổn định và chặt chẽ nhất.

Cụm phần cứng

Triển khai phiên bản INT4 quantized trên một cụm gồm hai máy Mac Studio M3 Ultra với RDMA để có trải nghiệm local 1T không suy giảm chất lượng.

Lập kế hoạch dài hạn

Cấu trúc prompt để yêu cầu rõ ràng một 'kế hoạch từng bước' trước tiên nhằm kích hoạt thế mạnh về tìm kiếm và học tập thích ứng của model.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Cau hoi thuong gap ve Kimi K2 Thinking

Tim cau tra loi cho cac cau hoi thuong gap ve Kimi K2 Thinking