moonshot

Kimi k2.6

Kimi k2.6 是 Moonshot AI 的 1T 参数 MoE 模型,具备 256K context window、原生视频输入,并在自主 agentic 编码方面表现出精英级水平。

推理 (Reasoning)多模态 (Multimodal)编码 Agent (Coding Agent)开放权重 (Open Weights)MoE
moonshot logomoonshotKimi2026年4月20日
上下文
256Ktokens
最大输出
33Ktokens
输入价格
$0.95/ 1M
输出价格
$4.00/ 1M
模态:TextImageVideo
能力:视觉工具流式传输推理
基准测试
GPQA
90.5%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Kimi k2.6 在此基准测试中得分 90.5%。
HLE
54%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Kimi k2.6 在此基准测试中得分 54%。
MMLU
86.4%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Kimi k2.6 在此基准测试中得分 86.4%。
MMLU Pro
84.6%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Kimi k2.6 在此基准测试中得分 84.6%。
SimpleQA
43%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Kimi k2.6 在此基准测试中得分 43%。
IFEval
89.8%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Kimi k2.6 在此基准测试中得分 89.8%。
AIME 2025
97.3%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Kimi k2.6 在此基准测试中得分 97.3%。
MATH
98.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Kimi k2.6 在此基准测试中得分 98.2%。
GSM8k
97.3%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Kimi k2.6 在此基准测试中得分 97.3%。
MGSM
91.5%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Kimi k2.6 在此基准测试中得分 91.5%。
MathVista
67.1%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Kimi k2.6 在此基准测试中得分 67.1%。
SWE-Bench
80.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Kimi k2.6 在此基准测试中得分 80.2%。
HumanEval
92%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Kimi k2.6 在此基准测试中得分 92%。
LiveCodeBench
83.1%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Kimi k2.6 在此基准测试中得分 83.1%。
MMMU
77.3%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Kimi k2.6 在此基准测试中得分 77.3%。
MMMU Pro
75.6%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Kimi k2.6 在此基准测试中得分 75.6%。
ChartQA
87.4%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Kimi k2.6 在此基准测试中得分 87.4%。
DocVQA
94.9%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Kimi k2.6 在此基准测试中得分 94.9%。
Terminal-Bench
60.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Kimi k2.6 在此基准测试中得分 60.2%。
ARC-AGI
68.8%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Kimi k2.6 在此基准测试中得分 68.8%。

关于 Kimi k2.6

了解 Kimi k2.6 的功能、特性以及它如何帮助您获得更好的效果。

架构设计与规模

Kimi k2.6 是一款万亿参数级别的多模态混合专家 (MoE) 模型。它每个 token 使用 320 亿个激活参数,在计算效率与高水平认知表现之间取得了平衡。该架构支持内部 chain-of-thought 推理,模型会在输出最终回答前生成隐藏的推理步骤。这种设计使其能够解决常规大型语言模型通常会受阻的复杂多步问题。

Agentic 智能与协调

该模型专门针对自主软件工程和长周期任务进行了优化。它可以管理多达 300 个并行子 agent 的 Agent Swarms,协同重构大型代码库或管理复杂的 DevOps 流水线。通过使用原生工具调用和视觉理解能力,Kimi k2.6 可以作为自主 agent 运行,能够解决跨文件的 GitHub 问题,并根据视觉参考创建运动丰富的网页界面。

多模态能力

对视频和图像输入的本地支持使 Kimi k2.6 在众多 open-weights 模型中脱颖而出。它直接处理视频文件以进行场景分析、bug 复现和结构化数据提取。该模型充当视觉架构师,能够基于视觉描述或上传的设计稿,使用 Three.js 和 GSAP 等库生成 3D 着色器和复杂动画。

Kimi k2.6

Kimi k2.6 的使用案例

发现使用 Kimi k2.6 获得出色效果的不同方式。

自主软件工程

通过在 12 小时的会话中协调多达 300 个并行子 agent 来解决复杂的 GitHub 问题。

运动丰富型前端生成

仅通过简单的文本或图像 prompt,即可利用 WebGL 和 GSAP 着色器创建现代网页界面。

深度视频分析

分析录像以进行视觉 bug 复现、场景描述或结构化数据提取。

Agentic 市场调研

执行多步网页搜索和工具调用,从数百个来源综合分析并生成竞争分析报告。

遗留代码优化

通过分析 CPU 火焰图和分配数据,识别旧代码库中的性能瓶颈。

科学问题解决

利用 Python 辅助推理和工具验证来回答研究生水平的科学和数学问题。

优势

局限性

卓越的 Agentic 编码能力: 在 SWE-Bench Verified 上获得 80.2% 的得分,使其成为最强大的自主工程模型之一。
极高的本地 VRAM 要求: 本地运行完整模型需要 600GB 的 VRAM,这限制了自托管仅能在高端专业工作站上进行。
大规模协调能力: 可管理 300 个并行子 agent,使其能够在单次任务中处理企业级的重构工作。
区域 API latency: 基础设施针对亚洲进行了优化,这可能导致西方地区用户的响应时间较长。
原生多模态通用性: 支持原生视频和图像输入,为 UI/UX 任务实现先进的视觉-语言 agent 工作流。
长 context 中的召回缺口: 模型在 256,000 token buffer 的极端边缘处可能难以实现完美召回。
激进的定价优势: 每 100 万输入 tokens 仅需 0.95 美元,比 Claude 3.7 或 GPT-4o 等专有模型便宜得多。
受限的商业许可: 其 open-weights 发布采用了修改后的许可协议,要求大规模企业部署必须遵守特定合规要求。

API快速入门

moonshotai/kimi-k2.6

查看文档
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 Kimi k2.6 的评价

看看社区对 Kimi k2.6 的看法

遇见 Kimi K2.6:推动 open-source 编码新高度。一个 prompt,100+ 个文件,12 小时内执行超过 4000 次工具调用。
@Kimi_Moonshot
twitter
Kimi 2.6 打败了 Opus 4.7,是目前世界上最棒的 open-source 模型。它非常出色,且成本仅为原来的十分之一。
@bindureddy
twitter
大家都没意识到定价差额有多大。Kimi K2.6 比 Sonnet 4.6 便宜 5 倍。benchmark 的差距已经正式逆转了。
@aakashgupta
twitter
我用它处理了一个 bug。它花了不到 1 美元就成功解决了,而之前 Sonnet 在处理这个复杂问题时一直很吃力。
@uworldhits1391
youtube
Kimi K2.6 具有变革意义,尽管在超长任务的召回上还有提升空间。不过,300 个并行 agent 真的很疯狂。
@Radiant-Act4707
reddit
Kimi K2 系列标志着 open-source 前沿实验室终于开始与闭源巨头抗衡甚至超越它们的时刻。
@zxytim
twitter

关于 Kimi k2.6 的视频

观看关于 Kimi k2.6 的教程、评测和讨论

Kimi K2.6 不会摧毁 Claude,但它确实会终结那些闭源实验室的高昂定价。

这种 300 个 agent 并行的 agent swarm 能力,在 open-source 领域还是首次见到。

54.0 的 HLE 分数是我们见过的 open-weights 模型中的最高分。

一个 prompt 就能驱动 12 小时的持续执行,这对 agent 来说是一个新的前沿。

它在多步工具调用中所展现出的稳定性,完全媲美顶级专有模型。

该视觉模型支持原生视频输入,即使在 2026 年这都是一个罕见的功能。

它拥有稳定的 thinking 模式,在多步工具调用方面足以挑战 OpenAI 的 o 系列。

对于前端开发而言,其生成的运动效果比 K2.5 显著更好。

256K 的 context window 允许一次性解析整套文档。

它是首批在终端环境中展示出真正自主性的模型之一。

将 K2.6 与 Kimi Code CLI 配合使用,可以实现超过 12 小时的自主编码会话。

它自主重构了一个 8 年历史的金融引擎,并获得了 185% 的吞吐量提升。

这是一个万亿参数模型,但激活参数仅为 32B,因此速度非常快。

从 Claude 迁移到 Kimi 的开发者所节省的成本是巨大的。

它解决了一个复杂的 Rust 库中悬挂了三个月的 bug。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Kimi k2.6专业提示

专家提示助您充分利用Kimi k2.6。

为推理启用工具使用

benchmark 显示,当模型允许使用外部搜索和计算工具时,其 HLE 得分会从 23.9 跃升至 54.0。

监控 context buffer 边缘

在 256,000 token buffer 的前 200,000 token 中,信息的召回最为准确。

谨慎使用 Thinking 模式

对于简单的聊天任务,建议禁用 thinking 参数以降低 latency 并减少 token 总消耗。

使用 XML 标签标准化

当 context 和任务被 XML 标签包裹时,模型遵循指令的准确性更高。

利用本地视频上传

对于超过 100MB 的视频,请使用文件上传方法而非 base64 编码,以避免触发请求大小限制。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

关于Kimi k2.6的常见问题

查找关于Kimi k2.6的常见问题答案