moonshot

Kimi k2.6

Kimi k2.6; 256K context window, yerel video input ve otonom agentic kodlamada üstün performans sunan Moonshot AI'ın 1T-parametre MoE modelidir.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi20 Nisan 2026
Bağlam
256Ktoken
Maks. çıktı
33Ktoken
Giriş fiyatı
$0.95/ 1M
Çıkış fiyatı
$4.00/ 1M
Modalite:TextImageVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
90.5%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Kimi k2.6 bu benchmark'ta 90.5% puan aldı.
HLE
54%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Kimi k2.6 bu benchmark'ta 54% puan aldı.
MMLU
86.4%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Kimi k2.6 bu benchmark'ta 86.4% puan aldı.
MMLU Pro
84.6%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Kimi k2.6 bu benchmark'ta 84.6% puan aldı.
SimpleQA
43%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Kimi k2.6 bu benchmark'ta 43% puan aldı.
IFEval
89.8%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Kimi k2.6 bu benchmark'ta 89.8% puan aldı.
AIME 2025
97.3%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Kimi k2.6 bu benchmark'ta 97.3% puan aldı.
MATH
98.2%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Kimi k2.6 bu benchmark'ta 98.2% puan aldı.
GSM8k
97.3%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Kimi k2.6 bu benchmark'ta 97.3% puan aldı.
MGSM
91.5%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Kimi k2.6 bu benchmark'ta 91.5% puan aldı.
MathVista
67.1%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Kimi k2.6 bu benchmark'ta 67.1% puan aldı.
SWE-Bench
80.2%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Kimi k2.6 bu benchmark'ta 80.2% puan aldı.
HumanEval
92%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Kimi k2.6 bu benchmark'ta 92% puan aldı.
LiveCodeBench
83.1%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Kimi k2.6 bu benchmark'ta 83.1% puan aldı.
MMMU
77.3%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Kimi k2.6 bu benchmark'ta 77.3% puan aldı.
MMMU Pro
75.6%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Kimi k2.6 bu benchmark'ta 75.6% puan aldı.
ChartQA
87.4%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Kimi k2.6 bu benchmark'ta 87.4% puan aldı.
DocVQA
94.9%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Kimi k2.6 bu benchmark'ta 94.9% puan aldı.
Terminal-Bench
60.2%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Kimi k2.6 bu benchmark'ta 60.2% puan aldı.
ARC-AGI
68.8%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Kimi k2.6 bu benchmark'ta 68.8% puan aldı.

Kimi k2.6 Hakkında

Kimi k2.6'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Mimari Tasarım ve Ölçek

Kimi k2.6, trilyon parametre ölçeğine sahip, frontier bir multimodal Mixture-of-Experts (MoE) modelidir. Token başına 32 milyar aktif parametre kullanarak hesaplama verimliliği ile üst düzey bilişsel performansı dengeler. Mimari, modelin nihai bir yanıt vermeden önce gizli reasoning adımları oluşturduğu dahili chain-of-thought reasoning'i destekler. Bu tasarım, standart LLM'leri zorlayan karmaşık, çok adımlı problemleri çözmesine olanak tanır.

Agentic Zeka ve Koordinasyon

Model, özellikle otonom yazılım mühendisliği ve uzun vadeli görevler için optimize edilmiştir. Büyük kod tabanlarını refactor etmek veya karmaşık DevOps pipeline'larını yönetmek için koordine olan 300'e kadar paralel alt-agent'tan oluşan Agent Swarms'ı yönetebilir. Yerel araç çağırma ve görsel anlama özelliklerini kullanarak Kimi k2.6, çok dosyalı GitHub sorunlarını çözebilen ve görsel referanslardan hareket zengini web arayüzleri oluşturabilen otonom bir agent olarak çalışır.

Multimodal Yetenekler

Video ve görüntü input'ları için yerel destek, Kimi k2.6'yı birçok open-weight modelden ayırır. Sahne analizi, hata tekrarı ve yapılandırılmış veri çıkarımı yapmak için doğrudan video dosyalarını işler. Model, görsel bir mimar görevi görerek Three.js ve GSAP gibi kütüphaneleri kullanarak görsel betimlemelere veya yüklenen mockup'lara dayalı 3D shader'lar ve karmaşık animasyonlar oluşturur.

Kimi k2.6

Kimi k2.6 için Kullanım Alanları

Harika sonuçlar elde etmek için Kimi k2.6'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

12 saatlik oturumlar boyunca 300'e kadar paralel alt-agent koordine ederek karmaşık GitHub sorunlarını çözme.

Hareket Odaklı Frontend Oluşturma

Sadece metin veya görsel prompt'lar kullanarak WebGL ve GSAP shader'ları ile modern web arayüzleri geliştirme.

Derin Video Analizi

Görsel hata tekrarı, sahne betimlemesi veya yapılandırılmış veri çıkarımı yapmak için kayıtları analiz etme.

Agentic Pazar Araştırması

Yüzlerce kaynaktan rekabet analizi raporları sentezlemek için çok adımlı web aramaları ve tool çağrıları yürütme.

Eski Kod Optimizasyonu

CPU flame grafikleri ve tahsis verilerini analiz ederek eski kod tabanlarındaki performans darboğazlarını tespit etme.

Bilimsel Problem Çözme

Python destekli reasoning ve araç doğrulama kullanarak lisansüstü düzeyde bilim ve matematik sorularını yanıtlama.

Güçlü Yönler

Sınırlamalar

Üstün Agentic Kodlama: SWE-Bench Verified'da %80,2 skor alarak otonom mühendislik için en yetenekli modeller arasında yer alır.
Yüksek Yerel VRAM Gereksinimi: Modelin tamamını yerel olarak çalıştırmak 600GB VRAM gerektirir, bu da kendi kendine barındırmayı özel, üst düzey iş istasyonlarıyla sınırlar.
Devasa Koordinasyon Ölçeği: 300 paralel alt-agent'ı yöneterek kurumsal düzeydeki refactoring görevlerini tek geçişte halledebilir.
Bölgesel API Latency: Altyapı Asya için optimize edildiğinden, batı bölgelerindeki kullanıcılar için daha yüksek yanıt sürelerine yol açabilir.
Yerel Multimodal Çok Yönlülük: Yerel video ve görüntü input'larını destekleyerek UI/UX görevleri için gelişmiş görsel-dil agent iş akışlarını mümkün kılar.
Uzun Context'te Geri Çağırma (Recall) Boşlukları: Model, 256.000 tokenlik buffer'ının uç sınırlarında mükemmel bir geri çağırma performansı sergilemekte zorlanabilir.
Agresif Fiyatlandırma Avantajı: Milyon input token başına 0,95 dolar ile Claude 3.7 veya GPT-4o gibi tescilli rakiplerden önemli ölçüde daha ucuzdur.
Kısıtlı Ticari Lisans: Open-weights sürümü, büyük ölçekli kurumsal dağıtımlar için belirli uyumluluklar gerektiren değiştirilmiş bir lisans kullanır.

API Hızlı Başlangıç

moonshotai/kimi-k2.6

Belgeleri Görüntüle
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Kimi k2.6 Hakkında Ne Diyor

Topluluğun Kimi k2.6 hakkında ne düşündüğünü görün

Kimi K2.6 ile tanışın: Open-Source Kodlamayı İlerletiyor. Tek prompt, 100+ dosya. 12 saatlik sürekli yürütme boyunca 4.000'den fazla araç çağrısı.
@Kimi_Moonshot
twitter
Kimi 2.6, Opus 4.7'yi YENİYOR ve Dünyadaki EN İYİ Open-Source Model. 10 kat daha düşük maliyetle çok iyi bir model.
@bindureddy
twitter
Fiyat farkı, kimsenin hesaba katmadığı kısım. Kimi K2.6, Sonnet 4.6'dan 5 kat daha ucuz. Benchmark farkı resmen tersine döndü.
@aakashgupta
twitter
Sahip olduğum bir hata üzerinde denedim. 1 doların biraz üzerinde bir maliyetle başarıyla çözdü. Sonnet'in zorlandığı zorlu bir hataydı.
@uworldhits1391
youtube
Kimi K2.6 dönüştürücü bir model, ancak ultra uzun görevlerde geri çağırma (recall) iyileştirmeleri için hala yer var. Yine de 300 paralel agent çılgınca.
@Radiant-Act4707
reddit
Kimi K2 serisi, open-source frontier laboratuvarların nihayet tescilli devlere rakip olduğu ve onları geçtiği anı işaret ediyor.
@zxytim
twitter

Kimi k2.6 Hakkında Videolar

Kimi k2.6 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Kimi K2.6 Claude'u yok etmeyecek ama kapalı laboratuvarların premium fiyatlandırmasını kesinlikle bitirecek.

Agent swarm yeteneği, yani paralel olarak 300 agent, open-source dünyasında daha önce görmediğimiz bir şey.

54,0'lık HLE skoru, open-weights bir model için gördüğümüz en yüksek değer.

Tek bir prompt, 12 saatlik sürekli yürütmeye yol açabiliyor, bu agent'lar için yeni bir sınır.

Çok adımlı araç çağırma işlemlerini, en iyi tescilli modellerle eşleşen bir kararlılıkla gerçekleştiriyor.

Vision modeli, 2026'da bile nadir bulunan bir özellik olan yerel video input desteğine sahip.

Çok adımlı araç çağırma işlemlerini, OpenAI'ın o-serisine rakip, kararlı bir thinking modu ile hallediyor.

Frontend geliştirme için, hareket zengini nesiller K2.5'ten önemli ölçüde daha iyi.

256K context window, tüm dokümantasyon setlerinin bir kerede taranmasına olanak tanıyor.

Terminal ortamlarında gerçek özerklik gösteren ilk modellerden biri.

K2.6'yı Kimi Code CLI ile eşleştirmek, 12+ saatlik otonom kodlama oturumlarına izin veriyor.

8 yıllık bir finansal motoru refactor etti ve otonom olarak %185 throughput artışı sağladı.

Bu bir trilyon parametreli bir model, ancak aktif parametreler sadece 32B, bu da onu hızlı kılıyor.

Claude'dan Kimi'ye geçen geliştiriciler için maliyet tasarrufu astronomik.

Üç aydır açık olan karmaşık bir Rust kütüphanesindeki hatayı çözdü.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Kimi k2.6 için Pro İpuçları

Kimi k2.6'den en iyi şekilde yararlanmak için uzman ipuçları.

Reasoning için Tool Use'u Etkinleştirin

Benchmark sonuçları, modele harici arama ve hesaplama araçları sağlandığında HLE skorunun 23,9'dan 54,0'a yükseldiğini göstermektedir.

Context Buffer Sınırlarını İzleyin

Geri çağırma (recall) başarımı, 256.000 tokenlik buffer'ın ilk 200.000 tokeninde en yüksek doğruluğa sahiptir.

Thinking Modunu İdareli Kullanın

Latency'i ve toplam token tüketimini azaltmak için basit sohbet görevlerinde thinking parametresini devre dışı bırakın.

XML Etiketleri ile Standartlaştırın

Model, context ve görevler XML etiketleri içine alındığında talimatları daha doğru bir şekilde takip eder.

Yerel Video Yüklemelerinden Yararlanın

Request boyutu limitlerine takılmamak için 100MB üzerindeki videolarda base64 kodlaması yerine dosya yükleme yöntemlerini kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Kimi k2.6 Hakkında Sık Sorulan Sorular

Kimi k2.6 hakkında sık sorulan soruların cevaplarını bulun