Kimi K2.5 kullanmanın maliyeti nedir?

Girdi token'ları milyon başına 0,60 dolar, çıktı token'ları ise milyon başına 3,00 dolardır. Bu fiyatlandırma, onu mevcut en uygun fiyatlı frontier model'lerden biri yapmaktadır.

Kimi K2.5 için maksimum context uzunluğu nedir?

Kimi K2.5, 256.000 token'lık bir context window'u destekler. Bu, kullanıcıların tek bir prompt ile kitapların tamamını veya büyük kod tabanlarını işlemesine olanak tanır.

Kimi K2.5 video dosyalarını işleyebilir mi?

Evet, uzun video içeriklerini işlemek için yerel bir MoonViT-3D encoder'a sahiptir. Olaylar, özetler ve görsel detaylar için saatlerce süren görüntüleri analiz edebilir.

Kimi K2.5 open-source mu?

Moonshot AI, model ağırlıklarını değiştirilmiş bir MIT Lisansı altında yayınladı. Bu, geliştiricilerin modeli kendi altyapılarında barındırmalarına olanak tanır.

Agent Swarm özelliği nedir?

Bu, modelin 100'e kadar paralel sub-agent'ı yönettiği bir orkestrasyon modudur. Yüksek eşzamanlılık gerektiren araştırmalar veya çoklu dosya düzenleme gibi görevler için kullanılır.

Kimi K2.5, Claude 3.7 Sonnet ile nasıl kıyaslanır?

Kimi K2.5 benzer reasoning yetenekleri sunar ancak yerel video desteği ve önemli ölçüde daha düşük fiyatlandırma içerir. Ayrıca benzersiz bir paralel swarm mimarisine sahiptir.

Kimi K2.5'i yerel olarak çalıştırmak için hangi donanım gereklidir?

Quantized olmayan tam model yaklaşık 632GB VRAM gerektirir. Çoğu yerel kullanıcı, yüksek kaliteli tüketici donanımlarında quantized versiyonları kullanmak zorunda kalacaktır.

API aracılığıyla Thinking moduna nasıl erişirim?

API çağrınızın extra_body kısmında type değerini enabled olarak ayarlayarak bir thinking nesnesi ekleyebilir ve bu modu etkinleştirebilirsiniz. Bu, mantık ağırlıklı görevlerde performansı artırır.

Kimi K2.5

Moonshot AI'nın yerel multimodal yeteneklere, 262K context window'una ve SOTA reasoning'e sahip 1T parametreli open-source agentic modeli Kimi K2.5'i keşfedin.

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi27 Ocak 2026

Bağlam

256Ktoken

Maks. çıktı

66Ktoken

Giriş fiyatı

$0.60/ 1M

Çıkış fiyatı

$3.00/ 1M

Modalite:TextImageVideo

Yetenekler:GörüntüAraçlarAkışAkıl Yürütme

Benchmarks

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

API belgelerini görüntüle

Kimi K2.5 Hakkında

Kimi K2.5'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Kimi K2.5, Moonshot AI'dan open-source bir multimodal modeldir. Token başına 32 milyar parametrenin aktif olduğu 1 trilyon parametreli bir Mixture-of-Experts mimarisi kullanır. Sistem, her modalite için ayrı harici encoder'lar kullanmak yerine, metin, görüntü ve video işlemeyi tek bir reasoning çerçevesi üzerinden birleştirir. Bu mimari, modelin çok uzun diziler boyunca yüksek geri alma doğruluğunu ve mantıksal tutarlılığı korurken 256.000 token'lık bir context'i işlemesine olanak tanır.

Model, Agent Swarm yeteneği ile öne çıkar. Bu özellik, sistemin karmaşık araştırma veya mühendislik görevlerini eşzamanlı olarak yürütmek için 100'e kadar paralel sub-agent'ı koordine etmesine olanak tanır. 400M parametreli bir MoonViT-3D encoder entegre eden K2.5, birkaç saatlik video içeriğini zamansal hassasiyetle analiz edebilir. Özellikle otonom yürütme için tasarlanmış olup, SWE-Bench ve BrowseComp gibi agentic benchmark'larında birçok özel modeli geride bırakmaktadır.

Kimi K2.5, derin mantık gerektiren görevler için özel bir Thinking modu sunar. Bu mod etkinleştirildiğinde, model nihai bir cevap üretmeden önce adımları doğrulamak ve kendi kendini düzeltmek için dahili bir reasoning zinciri oluşturur. Bu, onu yarışma seviyesindeki matematik ve büyük ölçekli yazılım geliştirme için oldukça etkili kılar. Token ekonomisi, rakip closed-source sistemlerin maliyetinin çok altında bir fiyatla frontier seviyesinde zeka sunarak kurumsal dağıtım için optimize edilmiştir.

Kimi K2.5 için Kullanım Alanları

Harika sonuçlar elde etmek için Kimi K2.5'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

SWE-Bench optimize edilmiş mantığı kullanarak karmaşık GitHub sorunlarını çözme ve çok dosyalı proje mimarileri oluşturma.

Görsel Web Geliştirme

Mevcut web sitesi etkileşimlerinin ekran kayıtlarından doğrudan işlevsel frontend kodu ve UI tasarımları oluşturma.

Çok Kanallı Araştırma

Tek bir paralel iş akışında 100'den fazla kaynaktan bilgi toplamak ve sentezlemek için Agent Swarm kullanımı.

Uzun Video Analizi

Frame ayıklama araçlarına ihtiyaç duymadan saatlerce süren güvenlik veya ders kayıtlarından belirli olayları ve zamansal verileri çıkarma.

Matematiksel İspat Oluşturma

Olimpiyat seviyesindeki matematik problemlerini yüzde 96 başarı oranıyla çözmek için deep thinking modunu uygulama.

Kurumsal Belge Otomasyonu

Yapılandırılmamış iş verisi kaynaklarından çok sayfalı PDF raporları ve karmaşık finansal tablolar oluşturma.

Güçlü Yönler

Sınırlamalar

Üst Düzey Agentic Performans: SWE-Bench Verified üzerinde 76.8 puan alarak, yazılım mühendisliği görevlerinde birçok özel frontier model'i geride bırakmaktadır.

Aşırı Yerel VRAM İhtiyaçları: Quantized olmayan tam model için 632GB VRAM gerektirir, bu da yerel dağıtımı çoğu tüketici için imkansız kılar.

Eşsiz Token Ekonomisi: 1T parametreli MoE zekasını, Claude Opus'un maliyetinin yaklaşık yüzde 10'u olan milyon girdi token'ı başına 0,60 dolara sunar.

Daha Yüksek Reasoning Latency: Thinking modu, model yanıt vermeden önce dahili mantık zincirleri oluşturduğundan önemli gecikmelere neden olabilir.

Yerel Video Anlama: Karmaşık video dosyalarını harici frame ayıklama olmadan işleyerek, uzun kayıtların hassas zamansal analizini mümkün kılar.

Biçimlendirme Tekrarı: Belirli paragraf yapılarını kullanması için kesin bir şekilde yönlendirilmediği sürece aşırı uzun metin blokları üretebilir.

Paralel Swarm Orkestrasyonu: Büyük ölçekli, çok kanallı araştırma iş akışları için 100'e kadar sub-agent'ı koordine etmek üzere eğitilmiş tek open model.

Veri Konumlandırma Endişeleri: Birincil altyapı Çin'de bulunmaktadır, bu da bazı Batılı işletmeler için uyumluluk sorunları yaratabilir.

API Hızlı Başlangıç

fireworks/kimi-k2p5

Belgeleri Görüntüle

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Kimi K2.5 Hakkında Ne Diyor

Topluluğun Kimi K2.5 hakkında ne düşündüğünü görün

“Kimi K2.5, benzer performans seviyesindeki Opus'un maliyetinin neredeyse yüzde 10'una mal oluyor.”

— Odd_Tumbleweed574

“İnsanlar, bir Çinli laboratuvar önemli bir şeyi open-source yaptığında Nvidia'nın 600 milyar dolar kaybettiğini unutuyor. Kimi, frontier zekasıyla bunu tekrar yapıyor.”

— chetaslua

twitter

“K2.5'teki Attention Residuals kavramı, LLM'in unutma sorununu gerçekten çözen yıllardır yapılmış ilk mimari değişiklik.”

— logic_king

hackernews

“Workers AI artık büyük modelleri çalıştırıyor. Kimi K2.5 ilk sırada. Piyasadaki en iyi open-source modellerden biri, ayrıca coding için de çok iyi.”

— dok2001

twitter

“Kimi K2.5 bambaşka bir canavar. Çok zeki ve inanılmaz bir RP modeli, ancak topluluk ön ayarlarını kullanmazsanız nevrotikleşebilir.”

— dptgreg

“GPT 4 iş akışımı Kimi K2.5 ile değiştirdim çünkü thinking modu daha şeffaf ve context window tüm repo'mu kaldırabiliyor.”

— Dev_Max

Kimi K2.5 Hakkında Videolar

Kimi K2.5 hakkında eğitimler, incelemeler ve tartışmalar izleyin

“Kimi K2.5, gelişmiş thinking yeteneğiyle GPT 5.2'yi yeniyor ve diğer frontier model'leri adeta eziyor.”

“SWE Verified üzerinde 76.8 puanla bugüne kadarki en güçlü open-source coding modeli.”

“Agent swarm, tekli agent'tan çoklu agent yapısına geçiş yaparak 1500 adede kadar koordineli adımda paralel iş akışları yürütüyor.”

“Context window, çoğu proje için fazlasıyla yeterli olan 256k token ile devasa seviyede.”

“Moonshot, 2026'nın başında open weights'in neler yapabileceğinin sınırlarını gerçekten zorluyor.”

“Apple'ın tasarım estetiğini gerçekten yakaladı ve sadece bir videodan animasyonlu, güzel görünen bir web sitesi çıkardı.”

“Swarm özelliği çok havalı görünüyor ve her sub-agent'a kimlik rozeti ataması kesinlikle çok eğlenceli.”

“K2.5, milyon girdi token'ı başına 60 cent ve milyon çıktı token'ı başına 3 dolar ile çok daha ucuz.”

“Yerel video işleme yeteneği, frame'leri işlemek için pahalı harici araçlar kullanmanıza gerek olmadığı anlamına geliyor.”

“Bu model, bütçe dostu otonom agent'lara ihtiyaç duyan geliştiriciler için oyunun kurallarını değiştiriyor.”

“Moonshot bunu, seri çöküşü önlemek için her sub-agent'a kritik aşamalarda ayrı ödüller vererek başardı.”

“Model, paralelliği yalnızca kritik yolu kısalttığında seçmeyi öğreniyor; bu çok zekice bir yenilik.”

“Kimi K2.5, GGUF kullanarak bunu tüketici donanımında çalıştırma sınırına oldukça yakın.”

“Thinking modu, Python'daki karmaşık mantıksal hataları çözmek için inanılmaz derecede sağlam.”

“Böyle 1 trilyon parametreli bir modelin yayınlandığını görmek, open-source topluluğu için büyük bir olay.”

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları

Web Otomasyonu

Akıllı İş Akışları

Ucretsiz Basla

Kimi K2.5 için Pro İpuçları

Kimi K2.5'den en iyi şekilde yararlanmak için uzman ipuçları.

Thinking Modunu Etkinleştirin

Matematik ve coding görevlerinde maksimum doğruluğa ulaşmak için API isteğinizde thinking parametresini geçin.

Agent Swarm'ı Tetikleyin

Araştırma görevleri için alt agent'lar arasında paralel orkestrasyonu zorlamak üzere modeli bir swarm dağıtmaya yönlendirin.

Temperature'ı Optimize Edin

Çeşitli reasoning çıktıları almak için thinking modunda 1.0, standart sohbet için ise 0.6 temperature değerini kullanın.

Bütünleşik Vision Prompt'ları

Modelin birleşik text-vision eğitiminden yararlanmak için kod parçacıklarının yanına hata ekran görüntülerini yükleyin.

Context Caching Kullanın

Tekrarlanan uzun belgeler için context caching kullanarak girdi maliyetlerini yüzde 90'a kadar düşürün.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

Kimi K2.5 Hakkında Sık Sorulan Sorular

Kimi K2.5 hakkında sık sorulan soruların cevaplarını bulun