moonshot

Kimi k2.6

Kimi k2.6は、256Kのcontext window、ネイティブな動画入力、そして自律的なエージェントコーディングにおける卓越したパフォーマンスを特徴とするMoonshot AIの1TパラメータMoE modelです。

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi2026年4月20日
コンテキスト
256Kトークン
最大出力
33Kトークン
入力価格
$0.95/ 1M
出力価格
$4.00/ 1M
モダリティ:TextImageVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
90.5%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Kimi k2.6はこのベンチマークで90.5%を記録しました。
HLE
54%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Kimi k2.6はこのベンチマークで54%を記録しました。
MMLU
86.4%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Kimi k2.6はこのベンチマークで86.4%を記録しました。
MMLU Pro
84.6%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Kimi k2.6はこのベンチマークで84.6%を記録しました。
SimpleQA
43%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Kimi k2.6はこのベンチマークで43%を記録しました。
IFEval
89.8%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Kimi k2.6はこのベンチマークで89.8%を記録しました。
AIME 2025
97.3%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Kimi k2.6はこのベンチマークで97.3%を記録しました。
MATH
98.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Kimi k2.6はこのベンチマークで98.2%を記録しました。
GSM8k
97.3%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Kimi k2.6はこのベンチマークで97.3%を記録しました。
MGSM
91.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Kimi k2.6はこのベンチマークで91.5%を記録しました。
MathVista
67.1%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Kimi k2.6はこのベンチマークで67.1%を記録しました。
SWE-Bench
80.2%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Kimi k2.6はこのベンチマークで80.2%を記録しました。
HumanEval
92%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Kimi k2.6はこのベンチマークで92%を記録しました。
LiveCodeBench
83.1%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Kimi k2.6はこのベンチマークで83.1%を記録しました。
MMMU
77.3%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Kimi k2.6はこのベンチマークで77.3%を記録しました。
MMMU Pro
75.6%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Kimi k2.6はこのベンチマークで75.6%を記録しました。
ChartQA
87.4%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Kimi k2.6はこのベンチマークで87.4%を記録しました。
DocVQA
94.9%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Kimi k2.6はこのベンチマークで94.9%を記録しました。
Terminal-Bench
60.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Kimi k2.6はこのベンチマークで60.2%を記録しました。
ARC-AGI
68.8%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Kimi k2.6はこのベンチマークで68.8%を記録しました。

Kimi k2.6について

Kimi k2.6の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

アーキテクチャ設計とスケール

Kimi k2.6は、1兆パラメータ規模のマルチモーダルなMoE(Mixture-of-Experts)modelです。tokenあたりのアクティブなパラメータ数は320億で、計算効率と高度な認知パフォーマンスのバランスを取っています。アーキテクチャは内部でのchain-of-thought推論をサポートしており、最終的な回答を出力する前に隠れた推論ステップを生成します。この設計により、従来の一般的な大規模言語modelでは行き詰まってしまうような、複雑で複数ステップにわたる問題を解決可能です。

Agenticな知能と調整

本modelは、自律的なソフトウェアエンジニアリングと長期的なタスクに特化して最適化されています。最大300の並列サブエージェントで構成される「Agent Swarms」を管理し、大規模なコードベースのリファクタリングや複雑なDevOpsパイプラインの管理を調整します。ネイティブなツール呼び出しと視覚的理解を利用することで、Kimi k2.6はGitHubの複数ファイルにまたがる問題を解決し、視覚的なリファレンスから動きのあるWebインターフェースを作成できる自律型エージェントとして機能します。

マルチモーダル機能

動画と画像の入力に対するネイティブなサポートは、他の多くのopen-weights modelとKimi k2.6を差別化する特徴です。動画ファイルを直接処理してシーンの解析、バグの再現、構造化データの抽出を行います。また、視覚的なアーキテクトとしても機能し、視覚的な説明やアップロードされたモックアップに基づき、Three.jsやGSAPなどのライブラリを使用して3Dシェーダーや複雑なアニメーションを生成します。

Kimi k2.6

Kimi k2.6のユースケース

Kimi k2.6を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

最大300の並列サブエージェントを調整し、最大12時間のセッションを通じて複雑なGitHubのissueを解決します。

動きのあるフロントエンド生成

テキストや画像のpromptから、WebGLやGSAPシェーダーを用いたモダンなWebインターフェースを作成します。

詳細な動画解析

録画データを解析し、視覚的なバグの再現、シーンの描写、構造化データの抽出を行います。

Agenticな市場調査

複数ステップのWeb検索やツール呼び出しを実行し、数百のソースから競合分析レポートを統合します。

レガシーコードの最適化

CPUのflame graphやアロケーションデータを解析し、古いコードベースにおけるパフォーマンスのボトルネックを特定します。

科学的な問題解決

Pythonを活用した推論とツールの検証を用いて、大学院レベルの科学や数学の質問に回答します。

強み

制限

優れたAgenticなコーディング能力: SWE-Bench Verifiedで80.2%のスコアを達成し、自律的なエンジニアリングにおいて最も有能なmodelの一つとなりました。
高いローカルVRAM要件: フルmodelをローカルで実行するには600GBのVRAMが必要となり、セルフホスティングはハイエンドのワークステーションに限定されます。
大規模な調整能力: 300の並列サブエージェントを管理でき、企業レベルのリファクタリングタスクを一度の実行で処理できます。
地域的なAPI latency: インフラがアジア向けに最適化されているため、欧米のユーザーにとっては応答時間が長くなる可能性があります。
ネイティブなMultimodalの汎用性: 動画や画像の入力をネイティブでサポートし、UI/UXタスク向けの高度なvisual-languageエージェントのワークフローを実現します。
長いcontextにおけるrecallの欠落: 256,000 tokenのバッファの極端な端の部分では、完璧なrecallが困難な場合があります。
強力なコスト競争力: 入力100万tokenあたり$0.95という価格設定は、Claude 3.7やGPT-4oといった独自のライバルと比較して大幅に安価です。
商用ライセンスの制限: open-weightsのリリースには修正版ライセンスが適用されており、大規模な企業導入には特定のコンプライアンス要件を満たす必要があります。

APIクイックスタート

moonshotai/kimi-k2.6

ドキュメントを見る
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

Kimi k2.6についてのユーザーの声

Kimi k2.6についてコミュニティがどう思っているか見てください

Kimi K2.6登場:Open-sourceコーディングの進化。一つのpromptで100以上のファイル。12時間の連続実行で4,000回以上のツール呼び出し。
@Kimi_Moonshot
twitter
Kimi 2.6はOpus 4.7を打ち負かし、世界最高のopen-source modelとなった。10分の1のコストで非常に優れたmodelだ。
@bindureddy
twitter
価格差が最大のポイントだ。Kimi K2.6はSonnet 4.6より5倍も安い。benchmarkの格差は公式に逆転した。
@aakashgupta
twitter
自分のバグで試してみた。わずか1ドル強で解決した。Sonnetでも苦戦した難しいバグだったのに。
@uworldhits1391
youtube
Kimi K2.6は変革的だ。超長時間のタスクにおけるrecallには改善の余地があるものの、300の並列エージェントは驚異的。
@Radiant-Act4707
reddit
Kimi K2シリーズは、open-sourceのfrontier labsがついに閉鎖的な巨大企業に匹敵し、追い越す瞬間を象徴している。
@zxytim
twitter

Kimi k2.6についての動画

Kimi k2.6についてのチュートリアル、レビュー、ディスカッションを見る

Kimi K2.6はClaudeを破壊するわけではありませんが、クローズドな研究所のプレミアムな価格設定を破壊するでしょう。

300のエージェントを並列で動かすAgent swarm機能は、open-sourceではこれまで見たことがありません。

54.0というHLEスコアは、open-weightsのmodelとしては過去最高です。

一つのpromptが12時間の連続実行につながるというのは、エージェントにとって新しいフロンティアです。

最高の商用modelに匹敵する安定性で、複数ステップのツール起動を処理します。

vision modelはネイティブな動画入力をサポートしており、これは2026年時点でも希少な機能です。

OpenAIのoシリーズに匹敵する安定したThinking modeで、複数ステップのツール起動を処理します。

フロントエンド開発において、動きのある生成物はK2.5から大幅に向上しています。

256Kのcontext windowにより、ドキュメントセット全体を一度に解析できます。

ターミナル環境で真の自律性を示す最初のmodelの一つです。

K2.6とKimi Code CLIを組み合わせることで、12時間以上の自律的なコーディングセッションが可能になります。

8年前の金融エンジンをリファクタリングし、自律的に185%のスループット向上を達成しました。

1兆パラメータのmodelですが、アクティブなparametersは32Bに抑えられており、高速な動作を維持しています。

ClaudeからKimiへ移行する開発者にとってのコスト削減は計り知れません。

3ヶ月間未解決だった複雑なRustライブラリのバグを解決しました。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Kimi k2.6のプロのヒント

Kimi k2.6を最大限に活用し、より良い結果を得るための専門家のヒント。

ReasoningのためのTool Useを有効にする

benchmarkの結果、modelに外部検索や計算ツールを許可すると、HLEスコアが23.9から54.0に跳ね上がることがわかっています。

contextバッファの端を監視する

recall(想起)の精度は、256,000 tokenのバッファのうち、最初の200,000 tokenで最も高くなります。

Thinking modeは控えめに使用する

シンプルなチャットタスクではThinkingパラメータを無効にすることで、latencyを抑え、総token消費量を削減できます。

XMLタグで標準化する

contextやタスクをXMLタグで囲むと、modelはより正確に指示に従います。

ネイティブな動画アップロードを活用する

リクエストサイズの制限を避けるため、100MBを超える動画ではbase64エンコーディングではなく、ファイルアップロードメソッドを使用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Kimi k2.6についてのよくある質問

Kimi k2.6に関するよくある質問への回答を見つけてください