moonshot

Kimi K2.7 Code

Kimi K2.7 Codeは、Moonshot AIによる1兆parametersのMoEモデルです。262kのcontext windowを備え、ソフトウェアエンジニアリングのためのreasoningが30%効率化されました。

コーディング向けフラッグシップOpen WeightsMoEアーキテクチャMultimodal AIReasoningモデル
moonshot logomoonshotKimi2026年6月12日
コンテキスト
262Kトークン
最大出力
262Kトークン
入力価格
$0.95/ 1M
出力価格
$4.00/ 1M
モダリティ:TextImageVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
65.8%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Kimi K2.7 Codeはこのベンチマークで65.8%を記録しました。
HLE
38.2%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Kimi K2.7 Codeはこのベンチマークで38.2%を記録しました。
MMLU
87.2%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Kimi K2.7 Codeはこのベンチマークで87.2%を記録しました。
MMLU Pro
71.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Kimi K2.7 Codeはこのベンチマークで71.4%を記録しました。
SimpleQA
52.4%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Kimi K2.7 Codeはこのベンチマークで52.4%を記録しました。
IFEval
88.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Kimi K2.7 Codeはこのベンチマークで88.5%を記録しました。
AIME 2025
91.5%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Kimi K2.7 Codeはこのベンチマークで91.5%を記録しました。
MATH
81.3%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Kimi K2.7 Codeはこのベンチマークで81.3%を記録しました。
GSM8k
97.2%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Kimi K2.7 Codeはこのベンチマークで97.2%を記録しました。
MGSM
92.4%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Kimi K2.7 Codeはこのベンチマークで92.4%を記録しました。
MathVista
65.5%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Kimi K2.7 Codeはこのベンチマークで65.5%を記録しました。
SWE-Bench
78.2%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Kimi K2.7 Codeはこのベンチマークで78.2%を記録しました。
HumanEval
94.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Kimi K2.7 Codeはこのベンチマークで94.2%を記録しました。
LiveCodeBench
68.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Kimi K2.7 Codeはこのベンチマークで68.5%を記録しました。
MMMU
72.4%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Kimi K2.7 Codeはこのベンチマークで72.4%を記録しました。
MMMU Pro
48.2%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Kimi K2.7 Codeはこのベンチマークで48.2%を記録しました。
ChartQA
84.2%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Kimi K2.7 Codeはこのベンチマークで84.2%を記録しました。
DocVQA
90.1%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Kimi K2.7 Codeはこのベンチマークで90.1%を記録しました。
Terminal-Bench
67%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Kimi K2.7 Codeはこのベンチマークで67%を記録しました。
ARC-AGI
12.5%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Kimi K2.7 Codeはこのベンチマークで12.5%を記録しました。

Kimi K2.7 Codeについて

Kimi K2.7 Codeの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

1兆parametersのMixture of Experts

Kimi K2.7 Codeは、Moonshot AIの1兆parametersのMixture of Experts (MoE) モデルの最新版です。ソフトウェアエンジニアリングとエージェントの自動化に最適化されています。このモデルは1回のinferenceステップで320億parametersをアクティブ化し、高い知能と実行速度のバランスをとっています。前バージョンと比較して、思考に必要なtokenを30%削減する洗練されたreasoningメカニズムを導入しました。技術的な問題解決がより高速になり、マルチターンの会話においても費用対効果が高まりました。

ネイティブなmultimodal対応と視覚的コンテキスト

本モデルはネイティブにmultimodal対応しており、テキスト、画像、動画入力を処理します。262,144 tokenのcontext windowが大規模なコードベースや複雑なスタックトレースを処理します。Moonshot AIはモデルをopen-weightsとして公開することで、自律AIエージェントを構築する開発者向けに、既存のfrontier modelに代わる選択肢を提供します。長期的なコーディングタスク全体で一貫性を維持し、中間のテキスト記述を必要とせずに、視覚的なデザインを機能的なコードへ変換します。

Kimi K2.7 Code

Kimi K2.7 Codeのユースケース

Kimi K2.7 Codeを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なagenticコーディング

複雑なファイル構造をナビゲートし、ターミナル経由で複数ファイルのリファクタリングを実行するマルチステップエージェントを動かします。

Visual-to-Code変換

複雑なUIデザインやアーキテクチャ図を、機能的なフロントエンドまたはシステムコードに直接変換します。

長期的なデバッグ

262kのcontext window内でプロジェクト全体の履歴やスタックトレースを分析し、アーキテクチャ上のバグを特定します。

3Dシーン合成

自然言語での記述から、Three.jsやC++を用いて高精細なインタラクティブ3D環境を生成します。

動画ベースの品質保証(QA)

録画された画面セッションや動画デモを分析し、視覚的なバグや不整合なUI遷移を特定します。

レガシーシステムのモダナイゼーション

一貫したchain-of-thoughtを維持することで、古いコードベースからモダンなフレームワークへの移行を自動化します。

強み

制限

トップレベルのコーディングベンチマーク: SWE-bench Verifiedで78.2%、HumanEvalで94.2%のスコアを記録し、ほとんどのopen-weightモデルを凌駕しています。
C++フォーマットの不安定さ: 大規模なC++ファイルを書き換える際に、軽微な構文エラーやフォーマットエラーを発生させずに書き換えるために、複数回の試行が必要になる場合があります。
Reasoningの効率性: 前世代と比較してthinking-tokenのオーバーヘッドを30%削減し、複雑な処理サイクルを高速化しました。
競合他社とのcontext windowの差: 262kは大きいですが、Google Gemini 2.0が提供する100万tokenのcontext windowには及びません。
ネイティブな動画サポート: UIテストや視覚的なデバッグのために、直接動画入力を処理できる数少ないモデルの一つです。
ヘッドレスブラウザの安定性: ヘッドレスChromeを使用した自律的なQAパイプラインが、長い検証ステップ中に停止することがあります。
コストパフォーマンス: 100万入力tokenあたり0.95ドルという低コストで、コーディングタスクにおいてGPT-5.5クラスのパフォーマンスを発揮します。
3D物理演算の精度: 生成された物理シミュレーションにおいて、現実的な重力や複雑な摩擦の再現が困難な場合があり、手動の調整が必要になることがあります。

APIクイックスタート

moonshot/kimi-k2.7-code

ドキュメントを見る
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

const response = await client.chat.completions.create({
  model: 'kimi-k2.7-code',
  messages: [{ role: 'user', content: 'Generate a 3D WebGL pendulum sim.' }],
  stream: true,
  extra_body: { preserve_thinking: true }
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

SDKをインストールして、数分でAPIコールを開始しましょう。

Kimi K2.7 Codeについてのユーザーの声

Kimi K2.7 Codeについてコミュニティがどう思っているか見てください

Kimi 2.7はFable 5に次いで2位、GPT-5 xhighより上にランクイン... Kimi 2.7は驚くほど優れている。
Przemek Chojecki
twitter
Kimi K2.7 CodeによってKimi K2.6がひどく時代遅れに見える... 水面のレンダリングが最もリアルだった!
GMI Cloud
twitter
SWE-bench (78.2%) と Terminal-Bench 2.1で#1のopen-weightモデルだ。
Vals AI
twitter
Kimi-K2.7-Codeがリリースされ、オープンソース化された!K2.6よりもコーディングとエージェントのパフォーマンスが向上している。
Kimi.ai
twitter
50件の法的PDFを一度に処理したが、全く問題なかった。
ThePromptEngineer
youtube
APIを使えば月額20ドルから月額1.5ドルまでコストを抑えられる。UI/UXもまとも。
LocalLLaMA-User
reddit

Kimi K2.7 Codeについての動画

Kimi K2.7 Codeについてのチュートリアル、レビュー、ディスカッションを見る

以前より思考時間が長く、より深く考えるようになった

2.7はより速く、より良い結果を出したが、トータルのtoken使用量で見ると少し高価だ

実際に成功するまで、プロジェクトの実装をより深く検討していた

単にコードを出力するだけでなく、まずthinking token内でアーキテクチャを計画している

Pythonスクリプトのロジックは、以前の2.6バージョンと比較して完璧だった

Kimi K2.6と比較してtoken効率が改善されており、thinking tokenの使用量が約30%削減された

モデルの高い成功率を維持しながら、reasoningのプロセスがより直接的になっている

このモデルがClaude Fableより12.5倍安いことを考慮すれば、その差は驚くほどではない

現在のAPI価格では、Claude Fableより12.5倍安価だ

SWE-bench Verifiedにおけるパフォーマンスは、open-weightモデルとして最高クラス

256kのcontext windowは、複数ファイルのプロジェクト生成において非常に安定している

外部ライブラリのドキュメントなしでC++のロジックを処理した

reasoningのプロセスが、冗長なループなしでより直線的になった

バックエンドのコンポーネントを含め、プロジェクト構造全体を15分で構築した

現時点で市場で利用可能なコーディングタスク向けopen-weightモデルの中で最高だ

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Kimi K2.7 Codeのプロのヒント

Kimi K2.7 Codeを最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Modeの保持

APIコールで常に preserve_thinking を有効にし、モデルが最適化されたreasoning chainを利用して論理的な推論を行えるようにしてください。

Multimodalなpromptの活用

バグのスクリーンショットやUIモックアップをテキスト指示と一緒に提供することで、コード生成の成功率を向上させることができます。

Context budgetの管理

パフォーマンスに重要な指示は、promptの最初か最後に配置することで、より確実に指示に従わせることができます。

CLI連携

ローカル開発時には公式のKimi Code CLIを使用することで、モデルのネイティブな環境操作能力を活用できます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3.5 Flash

Google

Gemini 3.5 Flash is Google's high-speed multimodal model with a 1M context window, optimized for sub-second agentic loops and complex coding tasks.

1M context
$1.50/$9.00/1M
other

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context
$1.00/$3.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context
$10.00/$50.00/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M

Kimi K2.7 Codeについてのよくある質問

Kimi K2.7 Codeに関するよくある質問への回答を見つけてください