هزینه استفاده از Kimi K2.5 چقدر است؟

هزینه هر یک میلیون token ورودی ۰.۶۰ دلار و هزینه هر یک میلیون token خروجی ۳.۰۰ دلار است. این قیمتگذاری، آن را به یکی از مقرونبهصرفهترین مدلهای کلاس frontier موجود تبدیل کرده است.

حداکثر طول context برای Kimi K2.5 چقدر است؟

مدل Kimi K2.5 از یک context window با ظرفیت ۲۵۶,۰۰۰ token پشتیبانی میکند. این ویژگی به کاربران اجازه میدهد تا کتابهای کامل یا کدهای منبع حجیم را در یک prompt پردازش کنند.

آیا Kimi K2.5 میتواند فایلهای ویدیویی را پردازش کند؟

بله، این مدل دارای یک encoder بومی MoonViT-3D برای پردازش محتوای ویدیویی طولانی است. این مدل میتواند ساعتها فیلم را برای یافتن رویدادها، خلاصهسازی و تحلیل جزئیات بصری بررسی کند.

آیا Kimi K2.5 یک مدل open-source است؟

شرکت Moonshot AI وزنهای (weights) این مدل را تحت نسخه اصلاحشده مجوز MIT منتشر کرده است. این امر به توسعهدهندگان اجازه میدهد تا مدل را روی زیرساختهای خود میزبانی کنند.

قابلیت Agent Swarm چیست؟

این یک حالت ارکستراسیون است که در آن مدل تا ۱۰۰ sub-agent موازی را مدیریت میکند. از این قابلیت برای وظایفی که نیاز به تحقیق با concurrency بالا یا ویرایش چندفایلی دارند، استفاده میشود.

Kimi K2.5 در مقایسه با Claude 3.7 Sonnet چگونه است؟

مدل Kimi K2.5 قابلیتهای reasoning مشابهی ارائه میدهد اما شامل پشتیبانی بومی از ویدیو و قیمتگذاری بهمراتب پایینتر است. همچنین دارای معماری منحصربهفرد parallel swarm است.

برای اجرای محلی Kimi K2.5 چه سختافزاری مورد نیاز است؟

نسخه کامل و فشردهنشده مدل به حدود ۶۳۲ گیگابایت VRAM نیاز دارد. اکثر کاربران محلی برای اجرای آن باید از نسخههای کوانتیزه (quantized) روی سختافزارهای ردهبالای خانگی استفاده کنند.

چگونه از طریق API به حالت Thinking دسترسی پیدا کنم؟

شما میتوانید با افزودن یک شیء thinking با نوع تنظیمشده روی enabled در بخش extra_body در فراخوانی API خود، آن را فعال کنید. این کار عملکرد را در وظایف منطقمحور بهبود میبخشد.

Kimi K2.5

مدل Kimi K2.5 از Moonshot AI را کشف کنید؛ یک مدل agentic با یک تریلیون پارامتر که دارای قابلیت‌های multimodal بومی، context window ۲۶۲ هزارتایی و reasoning در...

Agentic AIMultimodalOpen SourceReasoningMoE

moonshotKimi۲۷ ژانویه ۲۰۲۶

پنجره زمینه

256Kتوکن

حداکثر خروجی

66Kتوکن

قیمت ورودی

$0.60/ 1M

قیمت خروجی

$3.00/ 1M

حالت:TextImageVideo

قابلیت‌ها:بیناییابزارهااستریمینگاستدلال

معیارها

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

مشاهده مستندات API

درباره Kimi K2.5

درباره قابلیت‌های Kimi K2.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

مدل Kimi K2.5 یک مدل multimodal با کد‌باز (open-source) از شرکت Moonshot AI است. این مدل از معماری Mixture-of-Experts با یک تریلیون پارامتر استفاده می‌کند که در آن ۳۲ میلیارد پارامتر به ازای هر token فعال هستند. این سیستم، پردازش متن، تصویر و ویدیو را از طریق یک چارچوب reasoning واحد یکپارچه می‌کند و به جای استفاده از encoderهای خارجی جداگانه برای هر modality، عمل می‌کند. این معماری به مدل اجازه می‌دهد تا ۲۵۶,۰۰۰ token از context را مدیریت کرده و در عین حال دقت بازیابی و ثبات منطقی را در توالی‌های بسیار طولانی حفظ کند.

این مدل با قابلیت Agent Swarm متمایز می‌شود. این ویژگی به سیستم اجازه می‌دهد تا تا ۱۰۰ sub-agent موازی را برای اجرای وظایف تحقیق یا مهندسی پیچیده به طور همزمان هماهنگ کند. با ادغام یک encoder MoonViT-3D با ۴۰۰ میلیون پارامتر، K2.5 می‌تواند ساعت‌ها محتوای ویدیویی را با دقت زمانی تحلیل کند. این مدل به‌طور خاص برای اجرای خودکار طراحی شده و در benchmarkهای agentic مانند SWE-Bench و BrowseComp از بسیاری از مدل‌های اختصاصی پیشی گرفته است.

Kimi K2.5 یک حالت Thinking اختصاصی برای وظایفی که نیاز به منطق عمیق دارند ارائه می‌دهد. هنگامی که این حالت فعال می‌شود، مدل یک زنجیره استدلالی داخلی تولید می‌کند تا قبل از ارائه پاسخ نهایی، مراحل را اصلاح و تأیید کند. این ویژگی آن را برای ریاضیات در سطح مسابقات و توسعه نرم‌افزار در مقیاس بزرگ بسیار مؤثر می‌کند. اقتصاد توکن آن برای پیاده‌سازی‌های سازمانی بهینه شده است و هوشی در سطح frontier را با کسری از هزینه سیستم‌های رقیب closed-source ارائه می‌دهد.

موارد استفاده برای Kimi K2.5

روش‌های مختلف استفاده از Kimi K2.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودکار

حل مسائل پیچیده در GitHub و ساخت معماری پروژه‌های چند‌فایلی با استفاده از منطق بهینه‌شده بر اساس SWE-Bench.

توسعه وب بصری

ایجاد کدهای کاربردی برای فرانت‌اند و طراحی رابط کاربری مستقیماً از روی ضبط صفحه نمایشِ تعاملات وب‌سایت‌های موجود.

تحقیقات چند‌رشته‌ای

استفاده از Agent Swarm برای جستجو و سنتز اطلاعات از بیش از ۱۰۰ منبع در یک گردش کار موازی واحد.

تحلیل ویدیوهای طولانی

استخراج رویدادهای خاص و داده‌های زمانی از ساعت‌ها فیلم امنیتی یا سخنرانی بدون نیاز به ابزارهای استخراج فریم.

تولید اثبات‌های ریاضی

به‌کارگیری حالت deep thinking برای حل مسائل ریاضی در سطح المپیاد با نرخ دقت ۹۶ درصد.

اتوماسیون اسناد سازمانی

تولید گزارش‌های PDF چند‌صفحه‌ای و صفحات گسترده مالی پیچیده از منابع داده‌های کسب‌وکار غیرساختاریافته.

نقاط قوت

محدودیت‌ها

عملکرد ممتاز Agentic: کسب امتیاز ۷۶.۸ در SWE-Bench Verified، که در وظایف مهندسی نرم‌افزار از بسیاری از مدل‌های اختصاصی و frontier پیشی می‌گیرد.

نیاز شدید به VRAM برای اجرای محلی: نیاز به ۶۳۲ گیگابایت VRAM برای مدل کامل و فشرده‌نشده، که پیاده‌سازی محلی را برای اکثر کاربران خانگی غیرممکن می‌کند.

اقتصاد توکن بی‌رقیب: ارائه هوش MoE با یک تریلیون پارامتر با قیمت ۰.۶۰ دلار به ازای هر میلیون token ورودی، که حدود ۱۰ درصد هزینه Claude Opus است.

تأخیر بالاتر در reasoning: حالت Thinking می‌تواند تأخیر قابل توجهی ایجاد کند، چرا که مدل قبل از پاسخ‌دهی، زنجیره‌های منطقی داخلی تولید می‌کند.

درک بومی ویدیو: پردازش فایل‌های ویدیویی پیچیده بدون نیاز به استخراج فریم خارجی، که امکان تحلیل زمانی دقیق از فیلم‌های طولانی را فراهم می‌کند.

تکرار در قالب‌بندی: ممکن است دیواره‌های متنی بیش از حد طولانی ایجاد کند، مگر اینکه به طور جدی برای استفاده از ساختارهای پاراگراف خاص هدایت شود.

ارکستراسیون موازی Swarm: تنها مدل open که برای هماهنگی تا ۱۰۰ sub-agent جهت گردش‌های کاری عظیم و چند‌رشته‌ای آموزش دیده است.

نگرانی‌های مربوط به محل ذخیره‌سازی داده‌ها: زیرساخت اصلی در چین مستقر است که ممکن است برای برخی از شرکت‌های غربی مسائل مربوط به تطبیق‌پذیری (compliance) ایجاد کند.

شروع سریع API

fireworks/kimi-k2p5

مشاهده مستندات

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Kimi K2.5 چه می‌گویند

ببینید جامعه درباره Kimi K2.5 چه فکر می‌کند

“هزینه Kimi K2.5 تقریباً ۱۰ درصد هزینه Opus است، در حالی که عملکرد مشابهی دارد.”

— Odd_Tumbleweed574

“مردم فراموش کرده‌اند که Nvidia ۶۰۰ میلیارد دلار ارزش خود را از دست داد وقتی یک آزمایشگاه چینی چیزی بزرگ را open source کرد. Kimi با هوش frontier دوباره این کار را انجام می‌دهد.”

— chetaslua

twitter

“مفهوم Attention Residuals در K2.5 اولین تغییر معماری در سال‌های اخیر است که واقعاً مشکل فراموشی را در LLM برطرف می‌کند.”

— logic_king

hackernews

“Workers AI اکنون مدل‌های بزرگ را اجرا می‌کند. Kimi K2.5 اولین است. این یکی از بهترین مدل‌های open source موجود است که برای برنامه‌نویسی هم بسیار عالی است.”

— dok2001

twitter

“Kimi K2.5 یک هیولای متفاوت است. یک مدل RP فوق‌العاده باهوش است، اما اگر از پیش‌تنظیم‌های (presets) جامعه استفاده نکنید، ممکن است رفتارهای عصبی نشان دهد.”

— dptgreg

“من گردش کار GPT 4 خود را با Kimi K2.5 جایگزین کردم زیرا حالت thinking شفاف‌تر است و context window کل مخزن (repo) من را پوشش می‌دهد.”

— Dev_Max

ویدیوهای درباره Kimi K2.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Kimi K2.5 را تماشا کنید

“مدل Kimi K2.5 با قدرت thinking بالا، GPT 5.2 را شکست داده و عملاً سایر مدل‌های Frontier را کنار زده است.”

“این قوی‌ترین مدل برنامه‌نویسی open-source تا به امروز با امتیاز ۷۶.۸ در SWE verified است.”

“قابلیت Agent swarm تغییری از مدل تک‌عامله به مدل چند‌عامله است که گردش‌های کاری موازی را در ۱۵۰۰ مرحله هماهنگ‌شده اجرا می‌کند.”

“ظرفیت context window در این مدل با ۲۵۶ هزار token بسیار عظیم است که برای اکثر پروژه‌ها کافی است.”

“شرکت Moonshot در اوایل سال ۲۰۲۶ واقعاً در حال جابه‌جا کردن مرزهای کارهای قابل انجام با open weights است.”

“این مدل به‌خوبی زیبایی‌شناسی طراحی اپل را درک کرد و تنها از روی یک ویدیو، وب‌سایتی زیبا با انیمیشن‌های جذاب تولید کرد.”

“قابلیت Swarm بسیار جذاب به نظر می‌رسد و استفاده از آن سرگرم‌کننده است چون به هر sub-agent نشان شناسایی اختصاص می‌دهد.”

“مدل K2.5 با قیمت ۶۰ سنت برای هر میلیون token ورودی و ۳ دلار برای هر میلیون token خروجی، بسیار ارزان‌تر است.”

“پردازش بومی ویدیو به این معناست که نیازی به استفاده از ابزارهای خارجی گران‌قیمت برای پردازش فریم‌ها ندارید.”

“این مدل برای توسعه‌دهندگانی که به مدل‌های agentic با بودجه محدود نیاز دارند، یک تحول اساسی است.”

“تیم Moonshot این کار را با ارائه پاداش به هر sub-agent در مراحل بحرانی جداگانه انجام داده تا از فروپاشی سریالی جلوگیری کند.”

“مدل یاد می‌گیرد که موازی‌سازی را تنها زمانی انتخاب کند که مسیر بحرانی را کوتاه کند، که نوآوری بسیار هوشمندانه‌ای است.”

“Kimi K2.5 تقریباً در مرز اجرای روی سخت‌افزارهای خانگی با استفاده از GGUF قرار دارد.”

“حالت thinking برای حل خطاهای منطقی پیچیده در پایتون فوق‌العاده قوی است.”

“انتشار چنین مدلی با یک تریلیون پارامتر برای جامعه open-source بسیار بزرگ است.”

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI

اتوماسیون وب

گردش‌کارهای هوشمند

شروع رایگان

نکات حرفه‌ای برای Kimi K2.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Kimi K2.5 و دستیابی به نتایج بهتر.

فعال‌سازی حالت Thinking

پارامتر thinking را در درخواست API خود ارسال کنید تا به حداکثر دقت در مسائل ریاضی و برنامه‌نویسی برسید.

راه‌اندازی Agent Swarm

به مدل دستور دهید برای کارهای پژوهشی از یک swarm استفاده کند تا ارکستراسیون موازی بین sub-agentها برقرار شود.

بهینه‌سازی Temperature

برای حالت thinking از temperature برابر با ۱.۰ استفاده کنید تا امکان reasoning متنوع فراهم شود، اما برای چت استاندارد آن را روی ۰.۶ تنظیم کنید.

پرامپت‌های ترکیبی متن-تصویر

اسکرین‌شات‌های خطا را در کنار قطعه‌کدهای خود آپلود کنید تا از آموزش یکپارچه text-vision این مدل بهره‌مند شوید.

Context Caching

برای اسناد طولانی تکراری از context caching استفاده کنید تا هزینه‌های ورودی تا ۹۰ درصد کاهش یابد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

سوالات متداول درباره Kimi K2.5

پاسخ سوالات رایج درباره Kimi K2.5 را بیابید

Kimi K2.5

درباره Kimi K2.5

موارد استفاده برای Kimi K2.5

مهندسی نرم‌افزار خودکار

توسعه وب بصری

تحقیقات چند‌رشته‌ای

تحلیل ویدیوهای طولانی

تولید اثبات‌های ریاضی

اتوماسیون اسناد سازمانی

نقاط قوت

محدودیت‌ها

شروع سریع API

مردم درباره Kimi K2.5 چه می‌گویند

ویدیوهای درباره Kimi K2.5

گردش کار خود را با اتوماسیون AI

نکات حرفه‌ای برای Kimi K2.5

فعال‌سازی حالت Thinking

راه‌اندازی Agent Swarm

بهینه‌سازی Temperature

پرامپت‌های ترکیبی متن-تصویر

Context Caching

کاربران ما چه می‌گویند

مرتبط AI Models

Grok-4

GPT-5.1

Claude Opus 4.5

Gemini 3.1 Flash-Lite

Qwen3.5-397B-A17B

Claude Fable 5

GLM-5.1

Qwen3.6-Max-Preview

سوالات متداول درباره Kimi K2.5

هزینه استفاده از Kimi K2.5 چقدر است؟

حداکثر طول context برای Kimi K2.5 چقدر است؟

آیا Kimi K2.5 می‌تواند فایل‌های ویدیویی را پردازش کند؟

آیا Kimi K2.5 یک مدل open-source است؟

قابلیت Agent Swarm چیست؟

Kimi K2.5 در مقایسه با Claude 3.7 Sonnet چگونه است؟

برای اجرای محلی Kimi K2.5 چه سخت‌افزاری مورد نیاز است؟

چگونه از طریق API به حالت Thinking دسترسی پیدا کنم؟