moonshot

Kimi K2.5

Moonshot AI'nın yerel multimodal yeteneklere, 262K context window'una ve SOTA reasoning'e sahip 1T parametreli open-source agentic modeli Kimi K2.5'i keşfedin.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi27 Ocak 2026
Bağlam
256Ktoken
Maks. çıktı
66Ktoken
Giriş fiyatı
$0.60/ 1M
Çıkış fiyatı
$3.00/ 1M
Modalite:TextImageVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
87.6%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Kimi K2.5 bu benchmark'ta 87.6% puan aldı.
HLE
50.2%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Kimi K2.5 bu benchmark'ta 50.2% puan aldı.
MMLU
91.5%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Kimi K2.5 bu benchmark'ta 91.5% puan aldı.
MMLU Pro
87.1%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Kimi K2.5 bu benchmark'ta 87.1% puan aldı.
SimpleQA
48%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Kimi K2.5 bu benchmark'ta 48% puan aldı.
IFEval
85%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Kimi K2.5 bu benchmark'ta 85% puan aldı.
AIME 2025
96.1%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Kimi K2.5 bu benchmark'ta 96.1% puan aldı.
MATH
90.1%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Kimi K2.5 bu benchmark'ta 90.1% puan aldı.
GSM8k
97.1%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Kimi K2.5 bu benchmark'ta 97.1% puan aldı.
MGSM
95%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Kimi K2.5 bu benchmark'ta 95% puan aldı.
MathVista
90.1%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Kimi K2.5 bu benchmark'ta 90.1% puan aldı.
SWE-Bench
76.8%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Kimi K2.5 bu benchmark'ta 76.8% puan aldı.
HumanEval
88%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Kimi K2.5 bu benchmark'ta 88% puan aldı.
LiveCodeBench
85%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Kimi K2.5 bu benchmark'ta 85% puan aldı.
MMMU
78.5%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Kimi K2.5 bu benchmark'ta 78.5% puan aldı.
MMMU Pro
78.5%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Kimi K2.5 bu benchmark'ta 78.5% puan aldı.
ChartQA
77.5%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Kimi K2.5 bu benchmark'ta 77.5% puan aldı.
DocVQA
88.8%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Kimi K2.5 bu benchmark'ta 88.8% puan aldı.
Terminal-Bench
50.8%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Kimi K2.5 bu benchmark'ta 50.8% puan aldı.
ARC-AGI
12%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Kimi K2.5 bu benchmark'ta 12% puan aldı.

Kimi K2.5 Hakkında

Kimi K2.5'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Kimi K2.5, Moonshot AI'dan open-source bir multimodal modeldir. Token başına 32 milyar parametrenin aktif olduğu 1 trilyon parametreli bir Mixture-of-Experts mimarisi kullanır. Sistem, her modalite için ayrı harici encoder'lar kullanmak yerine, metin, görüntü ve video işlemeyi tek bir reasoning çerçevesi üzerinden birleştirir. Bu mimari, modelin çok uzun diziler boyunca yüksek geri alma doğruluğunu ve mantıksal tutarlılığı korurken 256.000 token'lık bir context'i işlemesine olanak tanır.

Model, Agent Swarm yeteneği ile öne çıkar. Bu özellik, sistemin karmaşık araştırma veya mühendislik görevlerini eşzamanlı olarak yürütmek için 100'e kadar paralel sub-agent'ı koordine etmesine olanak tanır. 400M parametreli bir MoonViT-3D encoder entegre eden K2.5, birkaç saatlik video içeriğini zamansal hassasiyetle analiz edebilir. Özellikle otonom yürütme için tasarlanmış olup, SWE-Bench ve BrowseComp gibi agentic benchmark'larında birçok özel modeli geride bırakmaktadır.

Kimi K2.5, derin mantık gerektiren görevler için özel bir Thinking modu sunar. Bu mod etkinleştirildiğinde, model nihai bir cevap üretmeden önce adımları doğrulamak ve kendi kendini düzeltmek için dahili bir reasoning zinciri oluşturur. Bu, onu yarışma seviyesindeki matematik ve büyük ölçekli yazılım geliştirme için oldukça etkili kılar. Token ekonomisi, rakip closed-source sistemlerin maliyetinin çok altında bir fiyatla frontier seviyesinde zeka sunarak kurumsal dağıtım için optimize edilmiştir.

Kimi K2.5

Kimi K2.5 için Kullanım Alanları

Harika sonuçlar elde etmek için Kimi K2.5'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

SWE-Bench optimize edilmiş mantığı kullanarak karmaşık GitHub sorunlarını çözme ve çok dosyalı proje mimarileri oluşturma.

Görsel Web Geliştirme

Mevcut web sitesi etkileşimlerinin ekran kayıtlarından doğrudan işlevsel frontend kodu ve UI tasarımları oluşturma.

Çok Kanallı Araştırma

Tek bir paralel iş akışında 100'den fazla kaynaktan bilgi toplamak ve sentezlemek için Agent Swarm kullanımı.

Uzun Video Analizi

Frame ayıklama araçlarına ihtiyaç duymadan saatlerce süren güvenlik veya ders kayıtlarından belirli olayları ve zamansal verileri çıkarma.

Matematiksel İspat Oluşturma

Olimpiyat seviyesindeki matematik problemlerini yüzde 96 başarı oranıyla çözmek için deep thinking modunu uygulama.

Kurumsal Belge Otomasyonu

Yapılandırılmamış iş verisi kaynaklarından çok sayfalı PDF raporları ve karmaşık finansal tablolar oluşturma.

Güçlü Yönler

Sınırlamalar

Üst Düzey Agentic Performans: SWE-Bench Verified üzerinde 76.8 puan alarak, yazılım mühendisliği görevlerinde birçok özel frontier model'i geride bırakmaktadır.
Aşırı Yerel VRAM İhtiyaçları: Quantized olmayan tam model için 632GB VRAM gerektirir, bu da yerel dağıtımı çoğu tüketici için imkansız kılar.
Eşsiz Token Ekonomisi: 1T parametreli MoE zekasını, Claude Opus'un maliyetinin yaklaşık yüzde 10'u olan milyon girdi token'ı başına 0,60 dolara sunar.
Daha Yüksek Reasoning Latency: Thinking modu, model yanıt vermeden önce dahili mantık zincirleri oluşturduğundan önemli gecikmelere neden olabilir.
Yerel Video Anlama: Karmaşık video dosyalarını harici frame ayıklama olmadan işleyerek, uzun kayıtların hassas zamansal analizini mümkün kılar.
Biçimlendirme Tekrarı: Belirli paragraf yapılarını kullanması için kesin bir şekilde yönlendirilmediği sürece aşırı uzun metin blokları üretebilir.
Paralel Swarm Orkestrasyonu: Büyük ölçekli, çok kanallı araştırma iş akışları için 100'e kadar sub-agent'ı koordine etmek üzere eğitilmiş tek open model.
Veri Konumlandırma Endişeleri: Birincil altyapı Çin'de bulunmaktadır, bu da bazı Batılı işletmeler için uyumluluk sorunları yaratabilir.

API Hızlı Başlangıç

fireworks/kimi-k2p5

Belgeleri Görüntüle
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Kimi K2.5 Hakkında Ne Diyor

Topluluğun Kimi K2.5 hakkında ne düşündüğünü görün

Kimi K2.5, benzer performans seviyesindeki Opus'un maliyetinin neredeyse yüzde 10'una mal oluyor.
Odd_Tumbleweed574
reddit
İnsanlar, bir Çinli laboratuvar önemli bir şeyi open-source yaptığında Nvidia'nın 600 milyar dolar kaybettiğini unutuyor. Kimi, frontier zekasıyla bunu tekrar yapıyor.
chetaslua
twitter
K2.5'teki Attention Residuals kavramı, LLM'in unutma sorununu gerçekten çözen yıllardır yapılmış ilk mimari değişiklik.
logic_king
hackernews
Workers AI artık büyük modelleri çalıştırıyor. Kimi K2.5 ilk sırada. Piyasadaki en iyi open-source modellerden biri, ayrıca coding için de çok iyi.
dok2001
twitter
Kimi K2.5 bambaşka bir canavar. Çok zeki ve inanılmaz bir RP modeli, ancak topluluk ön ayarlarını kullanmazsanız nevrotikleşebilir.
dptgreg
reddit
GPT 4 iş akışımı Kimi K2.5 ile değiştirdim çünkü thinking modu daha şeffaf ve context window tüm repo'mu kaldırabiliyor.
Dev_Max
reddit

Kimi K2.5 Hakkında Videolar

Kimi K2.5 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Kimi K2.5, gelişmiş thinking yeteneğiyle GPT 5.2'yi yeniyor ve diğer frontier model'leri adeta eziyor.

SWE Verified üzerinde 76.8 puanla bugüne kadarki en güçlü open-source coding modeli.

Agent swarm, tekli agent'tan çoklu agent yapısına geçiş yaparak 1500 adede kadar koordineli adımda paralel iş akışları yürütüyor.

Context window, çoğu proje için fazlasıyla yeterli olan 256k token ile devasa seviyede.

Moonshot, 2026'nın başında open weights'in neler yapabileceğinin sınırlarını gerçekten zorluyor.

Apple'ın tasarım estetiğini gerçekten yakaladı ve sadece bir videodan animasyonlu, güzel görünen bir web sitesi çıkardı.

Swarm özelliği çok havalı görünüyor ve her sub-agent'a kimlik rozeti ataması kesinlikle çok eğlenceli.

K2.5, milyon girdi token'ı başına 60 cent ve milyon çıktı token'ı başına 3 dolar ile çok daha ucuz.

Yerel video işleme yeteneği, frame'leri işlemek için pahalı harici araçlar kullanmanıza gerek olmadığı anlamına geliyor.

Bu model, bütçe dostu otonom agent'lara ihtiyaç duyan geliştiriciler için oyunun kurallarını değiştiriyor.

Moonshot bunu, seri çöküşü önlemek için her sub-agent'a kritik aşamalarda ayrı ödüller vererek başardı.

Model, paralelliği yalnızca kritik yolu kısalttığında seçmeyi öğreniyor; bu çok zekice bir yenilik.

Kimi K2.5, GGUF kullanarak bunu tüketici donanımında çalıştırma sınırına oldukça yakın.

Thinking modu, Python'daki karmaşık mantıksal hataları çözmek için inanılmaz derecede sağlam.

Böyle 1 trilyon parametreli bir modelin yayınlandığını görmek, open-source topluluğu için büyük bir olay.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Kimi K2.5 için Pro İpuçları

Kimi K2.5'den en iyi şekilde yararlanmak için uzman ipuçları.

Thinking Modunu Etkinleştirin

Matematik ve coding görevlerinde maksimum doğruluğa ulaşmak için API isteğinizde thinking parametresini geçin.

Agent Swarm'ı Tetikleyin

Araştırma görevleri için alt agent'lar arasında paralel orkestrasyonu zorlamak üzere modeli bir swarm dağıtmaya yönlendirin.

Temperature'ı Optimize Edin

Çeşitli reasoning çıktıları almak için thinking modunda 1.0, standart sohbet için ise 0.6 temperature değerini kullanın.

Bütünleşik Vision Prompt'ları

Modelin birleşik text-vision eğitiminden yararlanmak için kod parçacıklarının yanına hata ekran görüntülerini yükleyin.

Context Caching Kullanın

Tekrarlanan uzun belgeler için context caching kullanarak girdi maliyetlerini yüzde 90'a kadar düşürün.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Kimi K2.5 Hakkında Sık Sorulan Sorular

Kimi K2.5 hakkında sık sorulan soruların cevaplarını bulun