Berapa ukuran context window untuk Kimi K2 Thinking?

Model ini mendukung hingga 256.000 token. Ini memungkinkan pemrosesan seluruh buku atau repositori kode yang besar dalam satu prompt.

Berapa biaya API-nya?

Biaya model ini adalah $0,60 per 1 juta token input dan $2,50 per 1 juta token output. Harga ini jauh lebih murah dibandingkan model reasoning closed-source pesaing.

Bisakah saya menjalankan Kimi K2 Thinking secara lokal?

Ya, bobot model tersedia di HuggingFace untuk diunduh publik. Anda akan memerlukan sekitar 245GB VRAM untuk menjalankan versi kuantisasi 1-bit secara efektif.

Apa keunikan kemampuan tool use model ini?

Model ini dapat menangani 200 hingga 300 pemanggilan tool secara berurutan dalam satu giliran. Hal ini menjadikannya ahli dalam browsing otonom dan tugas agentic multi-langkah.

Apakah model ini mendukung input multimodal seperti gambar?

Varian Thinking ini khusus untuk teks saja. Untuk tugas visi (vision), Moonshot menawarkan seri Kimi-VL yang dioptimalkan untuk pemahaman multimodal.

Bagaimana perbandingannya dengan OpenAI o1?

K2 Thinking menyamai o1 dalam benchmark reasoning seperti AIME dan MATH. Model ini secara khusus mengungguli o1 dalam tugas browsing agentic dan benchmark HLE.

Apakah streaming didukung dalam API?

Ya, API mendukung streaming token-demi-token. Hal ini berguna untuk memantau proses reasoning model secara real-time.

Arsitektur apa yang digunakan?

Model ini menggunakan arsitektur Mixture-of-Experts dengan total 1 triliun parameter. Hanya 32 miliar parameter yang diaktifkan selama setiap langkah inference.

Kimi K2 Thinking

Kimi K2 Thinking adalah model reasoning satu triliun parameter dari Moonshot AI. Model ini mengungguli GPT-5 pada benchmark HLE dan mendukung 300 tool calls...

moonshotKimi K26 November 2025

Konteks

256Ktoken

Output maks.

16Ktoken

Harga input

$0.15/ 1M

Harga output

$0.15/ 1M

Modalitas:Text

Kemampuan:AlatStreamingPenalaran

Benchmarks

GPQA

93%

HLE

44.9%

MMLU

90%

MMLU Pro

78%

SimpleQA

55%

IFEval

92%

AIME 2025

99.1%

MATH

99.1%

GSM8k

99%

MGSM

95%

MathVista

75%

SWE-Bench

71.3%

HumanEval

83%

LiveCodeBench

83.1%

MMMU

80%

MMMU Pro

60%

ChartQA

88%

DocVQA

94%

Terminal-Bench

55%

ARC-AGI

12%

Lihat dokumentasi API

Tentang Kimi K2 Thinking

Pelajari tentang kemampuan, fitur, dan cara menggunakan Kimi K2 Thinking.

Mixture of Experts Satu Triliun Parameter

Kimi K2 Thinking adalah model reasoning satu triliun parameter yang menggunakan arsitektur Mixture-of-Experts (MoE). Dikembangkan oleh Moonshot AI dan dirilis pada akhir 2025, model ini hanya mengaktifkan 32B parameter untuk inference, yang menyeimbangkan kapasitas pengetahuan yang masif dengan efisiensi komputasi. Model ini dirancang khusus sebagai agen berpikir yang menskalakan komputasinya selama fase inference untuk memecahkan masalah logis yang kompleks. Pendekatan ini memungkinkan model untuk merefleksikan reasoning-nya sendiri dan mengoreksi kesalahan sebelum memberikan jawaban akhir.

Penggunaan Tool Agentic dan Perencanaan

Model ini membedakan dirinya melalui kemampuannya untuk menangani hingga 300 pemanggilan tool sekuensial secara otonom. Sementara sebagian besar model bahasa standar kesulitan dengan perencanaan jangka panjang, K2 Thinking dirancang untuk alur kerja agentic seperti browsing web otonom dan rekayasa perangkat lunak multi-langkah. Model ini secara native mendukung presisi INT4 melalui Quantization-Aware Training, yang memungkinkan model mempertahankan kinerja tingkat frontier sambil berjalan pada cluster perangkat keras perusahaan standar.

Fokus Pengembang dan Riset

Dengan context window 256K token, model ini dibangun untuk riset mendalam dan tugas teknis yang kompleks. Ia menjembatani kesenjangan kinerja antara sistem closed-source dan model open-weights. Kemampuannya untuk menjawab pertanyaan sains tingkat PhD dan masalah matematika kompetitif menjadikannya pilihan yang cocok untuk riset akademik, asisten coding otomatis, dan aplikasi reasoning fidelitas tinggi di mana konsistensi logis adalah persyaratan utama.

Kasus Penggunaan untuk Kimi K2 Thinking

Temukan berbagai cara menggunakan Kimi K2 Thinking untuk hasil yang luar biasa.

Rekayasa Perangkat Lunak Kompleks

Menyelesaikan issue GitHub nyata dan merancang codebase multi-file menggunakan koreksi diri iteratif.

Agen Riset Otonom

Menjalankan ratusan pemanggilan tool sekuensial untuk mengumpulkan dan menyintesis data teknis yang rumit.

Matematika Tingkat Olimpiade

Menyelesaikan masalah geometri dan aljabar tingkat lanjut dengan verifikasi chain-of-thought yang mendalam.

Inkuiri Sains Tingkat PhD

Menjawab pertanyaan ahli di bidang fisika dan biologi yang memerlukan deduksi logis multi-langkah.

Kontrol Komputer Interaktif

Menavigasi lingkungan terminal dan infrastruktur cloud untuk mengotomatisasi alur kerja devops.

Penulisan Kreatif Berbasis Logika

Menghasilkan konten long-form yang memerlukan kepatuhan ketat terhadap aturan pembangunan dunia yang rumit.

Kelebihan

Keterbatasan

Reasoning State-of-the-Art: Mencetak skor 44,9% pada HLE dengan tools, melampaui model closed-source utama dalam logika tingkat ahli.

Kebutuhan Sumber Daya Masif: Inference lokal memerlukan setidaknya 245GB VRAM bahkan dengan kuantisasi, membatasi penggunaannya pada cluster server kelas atas.

Kedalaman Agentic yang Luar Biasa: Mampu melakukan 300 pemanggilan tool sekuensial, memungkinkan riset web otonom dan tugas browser yang sebenarnya.

Latency Respon Bawaan: Proses deep thinking mengakibatkan waktu tunggu yang signifikan seiring model menskalakan komputasi test-time-nya.

Akurasi Matematika Tingkat Atas: Mencapai 94,5% pada AIME 2025, membuktikan keandalannya untuk pemecahan masalah matematika tingkat tinggi.

Kurangnya Multimodality Bawaan: Varian ini tidak dapat memproses input gambar atau video secara langsung, sehingga memerlukan model visi terpisah untuk tugas multimodal.

Aksesibilitas Open-Weights: Menawarkan kecerdasan frontier-level kepada komunitas pengembang untuk deployment lokal dan fine-tuning.

Overhead Token yang Tinggi: Langkah-langkah reasoning internal mengonsumsi sejumlah besar token output, yang meningkatkan biaya API untuk query sederhana.

Mulai Cepat API

moonshot/kimi-k2-thinking

Lihat Dokumentasi

moonshot SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [{ role: 'user', content: 'Rancang sebuah sistem untuk tinjauan kode otonom menggunakan 300 tool calls.' }],
  });
  console.log(response.choices[0].message.content);
}

main();

Instal SDK dan mulai melakukan panggilan API dalam hitungan menit.

Apa Kata Orang Tentang Kimi K2 Thinking

Lihat apa yang dipikirkan komunitas tentang Kimi K2 Thinking

“Kimi K2.5 adalah model open terbaik untuk coding, mereka benar-benar luar biasa.”

— npc_gooner

“Moonshot AI baru saja merilis Kimi K2 Thinking. 300 pemanggilan tool sekuensial? Itu adalah masa depan AI agentic.”

— @tech_trends

twitter

“Kimi merilis Kimi K2 Thinking, model reasoning open-source satu triliun parameter. Ini adalah hal yang nyata.”

— nekofneko

“Fakta bahwa model ini dapat menangani 300 pemanggilan tool secara sekuensial membuka alur kerja agen yang sepenuhnya baru.”

— AI Explained

youtube

“Mengesankan melihat model open-source mencapai angka-angka ini. Pendekatan penskalaan test-time jelas membuahkan hasil.”

— jsmith23

hackernews

“Menjalankan model ini secara lokal adalah tantangan, tetapi kedalaman reasoning-nya tidak seperti apa pun di ruang open weights.”

— LocalLlamaEnthusiast

Video Tentang Kimi K2 Thinking

Tonton tutorial, ulasan, dan diskusi tentang Kimi K2 Thinking

“Kimi K2 Thinking adalah model AI terbaik yang pernah saya gunakan.”

“Ini adalah model independen paling agentic yang pernah dibuat. Artinya, ia dapat berjalan selama berjam-jam dengan sendirinya.”

“Model ini mampu berpikir dan merefleksikan setiap langkah yang diambil. Jadi, ia tidak pernah tersesat.”

“Kecepatan reasoning-nya sangat cepat meskipun memiliki satu triliun parameter.”

“Jika Anda membangun agen, inilah arsitektur yang perlu Anda perhatikan.”

“Kimi K2 Thinking... adalah peningkatan thinking pada model Kimi K2, yang sejujurnya dianggap sangat baik.”

“Tentu saja ini adalah model open-source... dengan total ukuran sekitar 1 triliun parameter.”

“Semua hasil benchmark dilaporkan di bawah presisi int4.”

“Model ini menangani masalah matematika yang kompleks dengan tingkat logika yang menyaingi laboratorium milik perusahaan besar.”

“Proses instalasi untuk bobot lokal cukup mudah jika Anda memiliki VRAM yang cukup.”

“Kimi K2.5 adalah model open-source terbaru yang dikembangkan oleh perusahaan Tiongkok bernama Moonshot AI.”

“Model ini mampu menjalankan hingga 100 sub-agen dan 1.500 tool calls serta menjalankannya secara bersamaan.”

“Saya tentu merekomendasikannya jika Anda ingin membuat situs web yang benar-benar indah.”

“Chain-of-thought internal memungkinkannya untuk mengoreksi kesalahan kode sebelum memberikan jawaban akhir.”

“Moonshot benar-benar berfokus pada perencanaan jangka panjang untuk rilis khusus ini.”

Lebih dari sekadar prompt

Tingkatkan alur kerja Anda dengan Otomatisasi AI

Automatio menggabungkan kekuatan agen AI, otomatisasi web, dan integrasi cerdas untuk membantu Anda mencapai lebih banyak dalam waktu lebih singkat.

Agen AI

Otomasi Web

Alur Kerja Cerdas

Mulai Gratis

Tips Pro untuk Kimi K2 Thinking

Tips ahli untuk memaksimalkan Kimi K2 Thinking.

Aktifkan Output Thinking

Gunakan flag special tokens di engine inference Anda untuk melihat langkah-langkah reasoning internal model.

Optimalkan Temperature

Atur sampling temperature ke 1.0 dan min_p ke 0.01 untuk aliran reasoning yang paling konsisten.

Manfaatkan System Prompts

Awali percakapan dengan official identity prompt dari Moonshot AI untuk menstabilkan perilaku model.

Skalakan Test-Time Compute

Izinkan model menghasilkan lebih banyak token internal untuk masalah yang lebih sulit guna meningkatkan akurasi.

Testimoni

Apa Kata Pengguna Kami

Bergabunglah dengan ribuan pengguna puas yang telah mengubah alur kerja mereka

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Terkait AI Models

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context

$0.75/$4.50/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Pertanyaan yang Sering Diajukan tentang Kimi K2 Thinking

Temukan jawaban untuk pertanyaan umum tentang Kimi K2 Thinking