moonshot

Kimi K2.5

Moonshot AIのKimi K2.5を紹介します。1Tパラメータのopen-sourceエージェントモデルで、ネイティブなmultimodal機能、262K context window、SOTAなreasoning能力を備えています。

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi2026年1月27日
コンテキスト
256Kトークン
最大出力
66Kトークン
入力価格
$0.60/ 1M
出力価格
$3.00/ 1M
モダリティ:TextImageVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
87.6%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Kimi K2.5はこのベンチマークで87.6%を記録しました。
HLE
50.2%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Kimi K2.5はこのベンチマークで50.2%を記録しました。
MMLU
91.5%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Kimi K2.5はこのベンチマークで91.5%を記録しました。
MMLU Pro
87.1%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Kimi K2.5はこのベンチマークで87.1%を記録しました。
SimpleQA
48%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Kimi K2.5はこのベンチマークで48%を記録しました。
IFEval
85%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Kimi K2.5はこのベンチマークで85%を記録しました。
AIME 2025
96.1%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Kimi K2.5はこのベンチマークで96.1%を記録しました。
MATH
90.1%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Kimi K2.5はこのベンチマークで90.1%を記録しました。
GSM8k
97.1%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Kimi K2.5はこのベンチマークで97.1%を記録しました。
MGSM
95%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Kimi K2.5はこのベンチマークで95%を記録しました。
MathVista
90.1%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Kimi K2.5はこのベンチマークで90.1%を記録しました。
SWE-Bench
76.8%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Kimi K2.5はこのベンチマークで76.8%を記録しました。
HumanEval
88%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Kimi K2.5はこのベンチマークで88%を記録しました。
LiveCodeBench
85%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Kimi K2.5はこのベンチマークで85%を記録しました。
MMMU
78.5%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Kimi K2.5はこのベンチマークで78.5%を記録しました。
MMMU Pro
78.5%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Kimi K2.5はこのベンチマークで78.5%を記録しました。
ChartQA
77.5%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Kimi K2.5はこのベンチマークで77.5%を記録しました。
DocVQA
88.8%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Kimi K2.5はこのベンチマークで88.8%を記録しました。
Terminal-Bench
50.8%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Kimi K2.5はこのベンチマークで50.8%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Kimi K2.5はこのベンチマークで12%を記録しました。

Kimi K2.5について

Kimi K2.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Kimi K2.5は、Moonshot AIによるopen-sourceのmultimodalモデルです。1兆パラメータのMixture-of-Expertsアーキテクチャを採用しており、各tokenあたり320億パラメータがアクティブになります。このシステムは、モードごとに別々の外部エンコーダーを使用するのではなく、単一のreasoningフレームワークを通じてテキスト、画像、動画の処理を統合しています。このアーキテクチャにより、256,000 tokenのcontextを維持しながら、非常に長いシーケンス全体で高い検索精度と論理的一貫性を保つことが可能です。

このモデルの最大の特徴は、Agent Swarm機能です。この機能により、システムは最大100個の並列サブエージェントを調整し、複雑なリサーチやエンジニアリングタスクを同時に実行できます。400MパラメータのMoonViT-3Dエンコーダーを統合することで、K2.5は数時間の動画コンテンツを時間的精度を持って解析可能です。これは自律的な実行のために特別に設計されており、SWE-BenchやBrowseCompのようなエージェント系benchmarkにおいて、多くの独自モデルを上回る性能を発揮します。

Kimi K2.5は、深い論理を必要とするタスクのために専用のThinking modeを提供しています。有効にすると、モデルは内部で推論チェーンを生成し、最終的な回答を出す前にステップを自己修正および検証します。これにより、競技レベルの数学や大規模なソフトウェア開発において非常に効果的です。また、そのtoken経済性はエンタープライズ導入に最適化されており、競合するclosed-sourceシステムよりもはるかに低いコストでfrontier-levelのインテリジェンスを提供します。

Kimi K2.5

Kimi K2.5のユースケース

Kimi K2.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

SWE-Benchで最適化されたロジックを使用して、複雑なGitHub issueの解決や複数ファイルのプロジェクトアーキテクチャ構築を行います。

ビジュアルWeb開発

既存のWebサイト操作の画面録画から、機能的なフロントエンドコードやUIデザインを直接生成します。

マルチスレッド・リサーチ

Agent Swarmを使用して、1つの並列ワークフロー内で100以上のソースから情報をクロールし、統合します。

長時間動画解析

外部のフレーム抽出ツールを使わずに、セキュリティカメラや講義映像の数時間分から特定のイベントや時系列データを抽出します。

数学的証明の生成

Deep thinking modeを適用し、オリンピックレベルの数学問題を96%の精度で解きます。

エンタープライズ文書自動化

非構造化ビジネスデータから、複数ページのPDFレポートや複雑な財務スプレッドシートを生成します。

強み

制限

卓越したエージェント性能: SWE-Bench Verifiedで76.8を記録し、ソフトウェアエンジニアリングタスクにおいて多くの独自frontier modelを凌駕します。
極めて高いローカルVRAM要件: 量子化されていないフルモデルには632GBのVRAMが必要であり、ほとんどのコンシューマー環境でのローカル展開は不可能です。
比類なきコスト効率: 1TパラメータのMoEインテリジェンスを100万入力tokenあたり0.60ドルで提供しており、これはClaude Opusの約10分の1のコストです。
reasoningのレイテンシ: Thinking modeでは、応答を生成する前にモデルが内部で論理チェーンを構築するため、大きな遅延が発生する場合があります。
ネイティブな動画理解: 外部のフレーム抽出なしで複雑な動画ファイルを処理でき、長時間の録画に対する正確な時系列分析が可能です。
形式の繰り返し: 特定の段落構造を使用するよう厳密にpromptで指定しない場合、非常に長いテキストの壁を出力する可能性があります。
並列Swarmオーケストレーション: 大規模でマルチスレッドなリサーチワークフローのために、最大100個のサブエージェントを調整できるよう訓練された唯一のopen modelです。
データ所在地に関する懸念: 主要なインフラが中国にあるため、一部の欧米企業にとってはコンプライアンス上の問題となる可能性があります。

APIクイックスタート

fireworks/kimi-k2p5

ドキュメントを見る
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDKをインストールして、数分でAPIコールを開始しましょう。

Kimi K2.5についてのユーザーの声

Kimi K2.5についてコミュニティがどう思っているか見てください

Kimi K2.5は同等の性能を持つOpusの約10分の1のコストで利用できます。
Odd_Tumbleweed574
reddit
中国の研究機関が重要な技術をopen-source化した際、Nvidiaが6000億ドルの時価総額を失ったことを皆忘れています。Kimiはfrontier intelligenceで再びそれをやろうとしています。
chetaslua
twitter
K2.5のAttention Residualsコンセプトは、LLMの忘却問題を実際に解決する、ここ数年で初めてのアーキテクチャ変更です。
logic_king
hackernews
Workers AIでビッグモデルが動くようになりました。最初はKimi K2.5。現時点で最高のopen-sourceモデルの一つで、コーディングにも非常に向いています。
dok2001
twitter
Kimi K2.5は別格です。賢くて信じられないようなRP(ロールプレイ)モデルですが、コミュニティのプリセットを使わないと神経質になることがあります。
dptgreg
reddit
GPT-4のワークフローをKimi K2.5に置き換えました。Thinking modeがより透明であり、context windowがリポジトリ全体を扱えるからです。
Dev_Max
reddit

Kimi K2.5についての動画

Kimi K2.5についてのチュートリアル、レビュー、ディスカッションを見る

Kimi K2.5は強力なthinking能力でGPT 5.2を凌駕し、他のfrontier modelを完全に圧倒しています。

SWE Verifiedで76.8を記録した、現時点で最強のopen-sourceコーディングモデルです。

Agent swarmは、単一エージェントから最大1500の協調ステップにわたる並列ワークフローを実行するマルチエージェントへのシフトです。

256k tokenのcontext windowは、ほとんどのプロジェクトにとって十分な容量です。

Moonshotは2026年初頭、open weightsで可能な限界を押し広げています。

Appleのようなデザインの美学を見事に捉え、ビデオから直接アニメーション付きの素晴らしいWebサイトを作成しました。

Swarm機能は非常にクールで、各サブエージェントにIDバッジを割り当てるなど、使っていて間違いなく楽しいです。

K2.5は100万入力tokenあたり60セント、出力tokenあたり3ドルと、はるかに安価です。

ネイティブな動画処理により、フレームを処理するために高価な外部ツールを使用する必要がありません。

予算内で自律型エージェントを必要とする開発者にとって、このモデルはゲームチェンジャーです。

Moonshotは、シリアルな崩壊を防ぐために、各重要なステップ段階で各サブエージェントに報酬を与えることでこれを実現しました。

このモデルは、クリティカルパスを短縮できる場合にのみ並列化を選択することを学習しており、これは非常に賢いイノベーションです。

Kimi K2.5は、GGUFを使用してコンシューマーハードウェア上でギリギリ動作可能なラインにあります。

Thinking modeは、Pythonの複雑な論理エラーを解決するために非常に堅牢です。

1兆パラメータのモデルがこのようにリリースされるのを見るのは、open-sourceコミュニティにとって非常に大きな出来事です。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Kimi K2.5のプロのヒント

Kimi K2.5を最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Modeを有効化する

APIリクエストにthinkingパラメータを渡すことで、数学やコーディングタスクで最大限の精度を引き出せます。

Agent Swarmをトリガーする

リサーチタスクにおいてAgent Swarmを展開するよう指示し、サブエージェント間での並列オーケストレーションを強制的に実行させます。

Temperatureを最適化する

Thinking modeでは多様な推論を許可するためにtemperatureを1.0に設定し、標準的なチャットでは0.6に下げて利用してください。

テキストと画像を統合したprompt

コードスニペットと一緒にエラーのスクリーンショットをアップロードし、モデルの統合されたtext-visionトレーニングを活用しましょう。

Context Cachingの活用

繰り返し使用する長大なドキュメントにはContext Cachingを活用することで、入力コストを最大90%削減できます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Kimi K2.5についてのよくある質問

Kimi K2.5に関するよくある質問への回答を見つけてください

Kimi K2.5: 1TパラメータAgent Swarmモデル、100万tokenあたり0.60ドル