moonshot

Kimi k2.6

Kimi k2.6 là model MoE 1T-parameter của Moonshot AI với context window 256K, input video gốc và hiệu suất vượt trội trong coding agent tự hành.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20 tháng 4, 2026
Ngu canh
256Ktoken
Dau ra toi da
33Ktoken
Gia dau vao
$0.95/ 1M
Gia dau ra
$4.00/ 1M
Phuong thuc:TextImageVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
90.5%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Kimi k2.6 dat 90.5% trong benchmark nay.
HLE
54%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Kimi k2.6 dat 54% trong benchmark nay.
MMLU
86.4%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Kimi k2.6 dat 86.4% trong benchmark nay.
MMLU Pro
84.6%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Kimi k2.6 dat 84.6% trong benchmark nay.
SimpleQA
43%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Kimi k2.6 dat 43% trong benchmark nay.
IFEval
89.8%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Kimi k2.6 dat 89.8% trong benchmark nay.
AIME 2025
97.3%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Kimi k2.6 dat 97.3% trong benchmark nay.
MATH
98.2%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Kimi k2.6 dat 98.2% trong benchmark nay.
GSM8k
97.3%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Kimi k2.6 dat 97.3% trong benchmark nay.
MGSM
91.5%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Kimi k2.6 dat 91.5% trong benchmark nay.
MathVista
67.1%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Kimi k2.6 dat 67.1% trong benchmark nay.
SWE-Bench
80.2%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Kimi k2.6 dat 80.2% trong benchmark nay.
HumanEval
92%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Kimi k2.6 dat 92% trong benchmark nay.
LiveCodeBench
83.1%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Kimi k2.6 dat 83.1% trong benchmark nay.
MMMU
77.3%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Kimi k2.6 dat 77.3% trong benchmark nay.
MMMU Pro
75.6%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Kimi k2.6 dat 75.6% trong benchmark nay.
ChartQA
87.4%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Kimi k2.6 dat 87.4% trong benchmark nay.
DocVQA
94.9%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Kimi k2.6 dat 94.9% trong benchmark nay.
Terminal-Bench
60.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Kimi k2.6 dat 60.2% trong benchmark nay.
ARC-AGI
68.8%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Kimi k2.6 dat 68.8% trong benchmark nay.

Ve Kimi k2.6

Tim hieu ve kha nang cua Kimi k2.6, tinh nang va cach no co the giup ban dat ket qua tot hon.

Thiết kế kiến trúc và quy mô

Kimi k2.6 là model đa phương thức Mixture-of-Experts (MoE) tiên phong với quy mô nghìn tỷ tham số. Nó sử dụng 32 tỷ tham số hoạt động (active parameters) trên mỗi token, cân bằng giữa hiệu quả tính toán và hiệu suất nhận thức cao cấp. Kiến trúc hỗ trợ suy luận chain-of-thought nội bộ, nơi model tạo ra các bước suy luận ẩn trước khi đưa ra phản hồi cuối cùng. Thiết kế này cho phép nó giải quyết các vấn đề phức tạp, đa bước mà thường làm đình trệ các LLM tiêu chuẩn.

Trí tuệ Agent và sự phối hợp

Model được tối ưu hóa đặc biệt cho kỹ thuật phần mềm tự hành và các tác vụ dài hạn. Nó có thể quản lý Agent Swarms với tối đa 300 sub-agents song song, phối hợp để tái cấu trúc các codebase lớn hoặc quản lý các đường ống DevOps phức tạp. Bằng cách sử dụng gọi công cụ gốc và hiểu biết thị giác, Kimi k2.6 hoạt động như một agent tự hành có khả năng giải quyết các GitHub issue đa tệp tin và tạo giao diện web giàu chuyển động từ các tham chiếu hình ảnh.

Khả năng đa phương thức

Hỗ trợ gốc cho input video và hình ảnh giúp Kimi k2.6 khác biệt so với nhiều đối thủ open-weight. Nó xử lý các tệp video trực tiếp để thực hiện phân tích cảnh, tái hiện lỗi và trích xuất dữ liệu có cấu trúc. Model đóng vai trò là một kiến trúc sư thị giác, tạo ra các 3D shaders và hoạt ảnh phức tạp bằng cách sử dụng các thư viện như Three.js và GSAP dựa trên mô tả hình ảnh hoặc mockup được tải lên.

Kimi k2.6

Truong hop su dung cho Kimi k2.6

Kham pha cac cach khac nhau ban co the su dung Kimi k2.6 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Giải quyết các issue phức tạp trên GitHub bằng cách phối hợp tới 300 sub-agents chạy song song trong các phiên kéo dài 12 giờ.

Tạo giao diện Frontend giàu chuyển động

Tạo các giao diện web hiện đại với WebGL và GSAP shaders từ các prompt văn bản hoặc hình ảnh đơn giản.

Phân tích video chuyên sâu

Phân tích các bản ghi để thực hiện tái hiện lỗi (bug reproduction), mô tả cảnh hoặc trích xuất dữ liệu có cấu trúc.

Nghiên cứu thị trường bằng Agent

Thực hiện tìm kiếm web nhiều bước và gọi công cụ (tool calls) để tổng hợp các báo cáo phân tích cạnh tranh từ hàng trăm nguồn.

Tối ưu hóa mã nguồn kế thừa (Legacy Code)

Xác định các nút thắt cổ chai về hiệu suất trong các codebase cũ bằng cách phân tích CPU flame graphs và dữ liệu cấp phát bộ nhớ.

Giải quyết bài toán khoa học

Trả lời các câu hỏi khoa học và toán học trình độ đại học bằng cách sử dụng suy luận hỗ trợ bởi Python và xác minh công cụ.

Diem manh

Han che

Khả năng Coding bằng Agent vượt trội: Đạt điểm số 80.2% trên SWE-Bench Verified, đưa nó vào hàng ngũ những model mạnh mẽ nhất cho kỹ thuật tự hành.
Yêu cầu VRAM cục bộ cao: Chạy full model cục bộ yêu cầu 600GB VRAM, giới hạn việc tự lưu trữ cho các máy trạm chuyên dụng cao cấp.
Quy mô phối hợp khổng lồ: Quản lý 300 sub-agents chạy song song, cho phép xử lý các tác vụ refactoring cấp doanh nghiệp trong một lần chạy duy nhất.
Latency của API theo khu vực: Cơ sở hạ tầng được tối ưu hóa cho khu vực Châu Á, điều này có thể dẫn đến thời gian phản hồi lâu hơn cho người dùng ở các khu vực phương Tây.
Tính linh hoạt đa phương thức gốc: Hỗ trợ input video và hình ảnh gốc, cho phép các quy trình agent ngôn ngữ-hình ảnh tiên tiến cho các tác vụ UI/UX.
Khoảng trống trong khả năng nhớ ở Long Context: Model có thể gặp khó khăn với việc nhớ hoàn hảo ở các cạnh rìa của bộ đệm 256.000-token.
Lợi thế cạnh tranh về giá: Với mức $0.95 cho mỗi triệu input tokens, nó rẻ hơn đáng kể so với các đối thủ đóng mã nguồn như Claude 3.7 hoặc GPT-4o.
Giấy phép thương mại hạn chế: Bản phát hành open-weights sử dụng giấy phép sửa đổi, yêu cầu tuân thủ cụ thể đối với các triển khai doanh nghiệp quy mô lớn.

Bat dau nhanh API

moonshotai/kimi-k2.6

Xem tai lieu
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Kimi k2.6

Xem cong dong nghi gi ve Kimi k2.6

Gặp gỡ Kimi K2.6: Thúc đẩy Coding Open-Source. Một prompt, hơn 100 tệp tin. Hơn 4.000 lần gọi công cụ trong 12 giờ thực thi liên tục.
@Kimi_Moonshot
twitter
Kimi 2.6 ĐÁNH BẠI Opus 4.7 và là model Open Source TỐT NHẤT trên thế giới. Đó là một model rất tốt với chi phí rẻ hơn 10 lần.
@bindureddy
twitter
Chênh lệch giá là điều mà không ai tính đến. Kimi K2.6 rẻ hơn 5 lần so với Sonnet 4.6. Khoảng cách benchmark đã chính thức bị đảo ngược.
@aakashgupta
twitter
Tôi đã thử nó với một lỗi tôi gặp phải. Nó đã giải quyết thành công với chi phí chỉ hơn $1. Đó là một lỗi khó mà Sonnet đã phải vật lộn.
@uworldhits1391
youtube
Kimi K2.6 mang tính chuyển đổi, mặc dù vẫn còn dư địa để cải thiện khả năng recall trong các tác vụ siêu dài. Tuy nhiên, 300 agent song song là điều thật điên rồ.
@Radiant-Act4707
reddit
Dòng Kimi K2 đánh dấu thời điểm mà các phòng thí nghiệm open-source tiên phong cuối cùng đã sánh ngang và vượt qua các gã khổng lồ closed-source.
@zxytim
twitter

Video ve Kimi k2.6

Xem huong dan, danh gia va thao luan ve Kimi k2.6

Kimi K2.6 sẽ không tiêu diệt Claude, nhưng nó SẼ tiêu diệt mức giá cao cấp của các phòng thí nghiệm đóng mã nguồn.

Khả năng swarm agent, 300 agent song song, là điều chúng ta chưa từng thấy trong open source trước đây.

Điểm số HLE 54.0 là mức cao nhất chúng ta từng thấy ở một model open weights.

Một prompt có thể dẫn đến 12 giờ thực thi liên tục, đó là một biên giới mới cho các agent.

Nó xử lý việc gọi công cụ nhiều bước với sự ổn định ngang ngửa các model thương mại tốt nhất.

Model thị giác hỗ trợ input video gốc, một tính năng hiếm ngay cả trong năm 2026.

Nó xử lý việc gọi công cụ nhiều bước với chế độ thinking ổn định, cạnh tranh với dòng o-series của OpenAI.

Đối với phát triển frontend, khả năng tạo chuyển động phong phú tốt hơn đáng kể so với K2.5.

Context window 256K cho phép phân tích toàn bộ tài liệu cùng một lúc.

Đây là một trong những model đầu tiên thể hiện sự tự hành thực sự trong môi trường terminal.

Kết hợp K2.6 với Kimi Code CLI cho phép các phiên coding tự hành kéo dài hơn 12 giờ.

Nó đã tái cấu trúc một bộ máy tài chính 8 năm tuổi và đạt mức tăng throughput 185% một cách tự hành.

Đây là model nghìn tỷ tham số, nhưng tham số hoạt động chỉ là 32B, giúp nó duy trì tốc độ.

Việc tiết kiệm chi phí cho các nhà phát triển khi chuyển từ Claude sang Kimi là cực kỳ lớn.

Nó đã giải quyết được một bug trong thư viện Rust phức tạp vốn tồn đọng suốt ba tháng.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Kimi k2.6

Meo chuyen gia giup ban tan dung toi da Kimi k2.6 va dat ket qua tot hon.

Bật Tool Use cho tác vụ Reasoning

Các benchmark cho thấy điểm số HLE tăng vọt từ 23.9 lên 54.0 khi model được phép sử dụng các công cụ tìm kiếm và tính toán bên ngoài.

Theo dõi giới hạn Context Buffer

Khả năng gợi nhớ (recall) chính xác nhất trong 200.000 tokens đầu tiên của bộ đệm 256.000-token.

Sử dụng Thinking Mode tiết kiệm

Hãy tắt tham số thinking cho các tác vụ trò chuyện đơn giản để giảm latency và tổng lượng tiêu thụ tokens.

Chuẩn hóa bằng thẻ XML

Model thực hiện chỉ dẫn chính xác hơn khi context và tác vụ được bao bọc trong các thẻ XML.

Tận dụng tính năng tải lên video gốc

Sử dụng các phương thức tải lên tệp thay vì mã hóa base64 cho các video trên 100MB để tránh giới hạn kích thước yêu cầu.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Cau hoi thuong gap ve Kimi k2.6

Tim cau tra loi cho cac cau hoi thuong gap ve Kimi k2.6