moonshot

Kimi K2.7 Code

Kimi K2.7 Code 是由 Moonshot AI 开发的一款 1T 参数的 MoE 模型。它拥有 262k 的 context window,并为软件工程优化了 30% 的 reasoning 效率。

Coding FlagshipOpen WeightsMoE ArchitectureMultimodal AIReasoning Model
moonshot logomoonshotKimiJune 12, 2026
上下文
262Ktokens
最大输出
262Ktokens
输入价格
$0.95/ 1M
输出价格
$4.00/ 1M
模态:TextImageVideo
能力:视觉工具流式传输推理
基准测试
GPQA
65.8%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Kimi K2.7 Code 在此基准测试中得分 65.8%。
HLE
38.2%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Kimi K2.7 Code 在此基准测试中得分 38.2%。
MMLU
87.2%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Kimi K2.7 Code 在此基准测试中得分 87.2%。
MMLU Pro
71.4%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Kimi K2.7 Code 在此基准测试中得分 71.4%。
SimpleQA
52.4%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Kimi K2.7 Code 在此基准测试中得分 52.4%。
IFEval
88.5%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Kimi K2.7 Code 在此基准测试中得分 88.5%。
AIME 2025
91.5%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Kimi K2.7 Code 在此基准测试中得分 91.5%。
MATH
81.3%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Kimi K2.7 Code 在此基准测试中得分 81.3%。
GSM8k
97.2%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Kimi K2.7 Code 在此基准测试中得分 97.2%。
MGSM
92.4%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Kimi K2.7 Code 在此基准测试中得分 92.4%。
MathVista
65.5%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Kimi K2.7 Code 在此基准测试中得分 65.5%。
SWE-Bench
78.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Kimi K2.7 Code 在此基准测试中得分 78.2%。
HumanEval
94.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Kimi K2.7 Code 在此基准测试中得分 94.2%。
LiveCodeBench
68.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Kimi K2.7 Code 在此基准测试中得分 68.5%。
MMMU
72.4%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Kimi K2.7 Code 在此基准测试中得分 72.4%。
MMMU Pro
48.2%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Kimi K2.7 Code 在此基准测试中得分 48.2%。
ChartQA
84.2%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Kimi K2.7 Code 在此基准测试中得分 84.2%。
DocVQA
90.1%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Kimi K2.7 Code 在此基准测试中得分 90.1%。
Terminal-Bench
67%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Kimi K2.7 Code 在此基准测试中得分 67%。
ARC-AGI
12.5%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Kimi K2.7 Code 在此基准测试中得分 12.5%。

关于 Kimi K2.7 Code

了解 Kimi K2.7 Code 的功能、特性以及它如何帮助您获得更好的效果。

万亿参数的 Mixture of Experts

Kimi K2.7 Code 是 Moonshot AI 万亿参数 Mixture of Experts (MoE) 模型的最新迭代版本,专为软件工程和 agentic 自动化而优化。该模型在单次 inference 步骤中激活 320 亿个参数,平衡了高智能与运行速度。它引入了精炼的 reasoning 机制,与之前的版本相比,thinking tokens 的使用量减少了 30%。对于多轮对话,其技术问题解决速度更快且更具成本效益。

原生多模态与视觉 Context

该模型是原生的 multimodal 模型,可处理文本、图像和视频输入。其 262,144 个 tokens 的 context window 可以处理大型代码库和复杂的堆栈跟踪。通过将模型作为 open-weights 发布,Moonshot AI 为构建自主 AI agent 的开发者提供了 Frontier model 的替代方案。它在长周期的编程任务中保持了一致性,并能直接将视觉设计转换为功能性代码,而无需中间文本描述。

Kimi K2.7 Code

Kimi K2.7 Code 的使用案例

发现使用 Kimi K2.7 Code 获得出色效果的不同方式。

自主 Agentic 编程

驱动多步骤 agent,使其能够导航复杂的文件结构,并通过终端访问执行跨文件重构。

视觉转代码翻译

将复杂的 UI 设计或架构图直接转换为功能性的前端代码或系统代码。

长周期调试

利用 262k 的 context window 分析整个项目历史和堆栈跟踪,从而识别架构级 Bug。

3D 场景合成

根据自然语言描述,使用 Three.js 或 C++ 生成高保真的交互式 3D 环境。

基于视频的质量保证 (QA)

分析录制的屏幕会话或视频演示,以识别视觉 Bug 和不一致的 UI 过渡。

遗留系统现代化

通过保持一致的 chain-of-thought,自动化完成老旧代码库向现代框架的迁移。

优势

局限性

顶级 Coding Benchmark 表现: 在 SWE-bench Verified 上得分 78.2%,在 HumanEval 上得分 94.2%,表现优于大多数 open-weight 模型。
C++ 格式化不一致: 在重写大型 C++ 文件时,可能需要多次尝试才能避免引入微小的语法或格式错误。
Reasoning 效率: 相比前代产品,将 thinking-token 的开销减少了 30%,加快了复杂任务的处理周期。
Context Window 相对较小: 尽管 262k 已经很大,但仍落后于 Google Gemini 2.0 提供的百万级 context window。
原生视频支持: 为数不多能够处理直接视频输入以进行 UI 测试和视觉调试的模型之一。
无头浏览器稳定性: 在使用无头 Chrome 进行自动 QA 流程时,在漫长的验证步骤中可能会偶尔出现挂起情况。
性价比优势: 以每百万输入 tokens 0.95 美元的低成本,提供了 GPT-5.5 级别的编程能力。
3D 物理精度: 在生成的物理模拟中,处理逼真的重力或复杂的摩擦力时可能会遇到困难,需要手动调整。

API快速入门

moonshot/kimi-k2.7-code

查看文档
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

安装SDK并在几分钟内开始进行API调用。

人们对 Kimi K2.7 Code 的评价

看看社区对 Kimi K2.7 Code 的看法

Kimi 2.7 排名第二,仅次于 Fable 5,优于 GPT-5 xhigh……Kimi 2.7 确实非常棒。
Przemek Chojecki
twitter
Kimi K2.7 Code 让 Kimi K2.6 显得有些过时了……它给出了最逼真的水波纹渲染效果!
GMI Cloud
twitter
它是 SWE-bench (78.2%) 和 Terminal-Bench 2.1 上排名第一的 open-weight 模型。
Vals AI
twitter
Kimi-K2.7-Code 现已发布并开源!相比 K2.6,编程和 agent 性能都有所提升。
Kimi.ai
twitter
它一次性处理了 50 份法律 PDF 文档,表现十分轻松。
ThePromptEngineer
youtube
通过 API,价格从每月 20 美元降到了 1.5 美元。不错的用户体验。
LocalLLaMA-User
reddit

关于 Kimi K2.7 Code 的视频

观看关于 Kimi K2.7 Code 的教程、评测和讨论

它的思考时间变得更长,也更深入。

2.7 版本交付了更快、更好的结果,但就总 tokens 使用量而言,成本略高一些。

它会深入思考更长的项目实现,直到真正成功。

它不仅仅是输出代码,还在 reasoning tokens 中预先规划了架构。

与之前的 2.6 版本相比,这个 Python 脚本的逻辑非常完美。

它提升了 token 使用效率,与 Kimi K2.6 相比,thinking tokens 的用量减少了约 30%。

Reasoning 过程更加直接,同时保持了该模型的高成功率。

考虑到该模型比 Claude Fable 便宜 12.5 倍,两者之间的差距并没有那么夸张。

按照目前的 API 定价,该模型比 Claude Fable 便宜 12.5 倍。

在 SWE-bench Verified 上的表现属于 open-weight 模型中的顶级水平。

256k 的 context window 在多文件项目生成中非常稳定。

它处理 C++ 逻辑时无需额外的库文档支持。

Reasoning 过程现在更加线性,没有多余的循环。

它在 15 分钟内构建了整个项目结构,包括后端组件。

它是目前市面上最好的 open-weight 编程模型。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Kimi K2.7 Code专业提示

专家提示助您充分利用Kimi K2.7 Code。

保留 Thinking Mode

在 API 调用中务必启用 preserve_thinking,以确保模型利用其优化的 reasoning 链进行逻辑处理。

Multimodal Prompting

提供当前 Bug 的截图或 UI 原型,并配合文本指令,以提高代码生成的成功率。

管理 Context Budget

将对性能至关重要的指令放在 prompt 的开头或结尾,以获得最可靠的指令遵循效果。

CLI 集成

在本地开发中使用官方的 Kimi Code CLI,以利用模型与本地环境交互的原生能力。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

关于Kimi K2.7 Code的常见问题

查找关于Kimi K2.7 Code的常见问题答案