Kimi K2.5

با Kimi K2.5 از Moonshot AI آشنا شوید؛ یک flagship model عامل‌محور و open-source با ۱ تریلیون parameters، قابلیت‌های multimodal بومی، context window ۲۶۲...

AI عامل‌محورچندوجهی (Multimodal)متن‌باز (Open Source)استدلال (Reasoning)MoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
پنجره زمینه
262Kتوکن
حداکثر خروجی
33Kتوکن
قیمت ورودی
$0.60/ 1M
قیمت خروجی
$2.50/ 1M
حالت:TextImageVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87.6%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Kimi K2.5 امتیاز 87.6% در این معیار کسب کرد.
HLE
50.2%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Kimi K2.5 امتیاز 50.2% در این معیار کسب کرد.
MMLU
92%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Kimi K2.5 امتیاز 92% در این معیار کسب کرد.
MMLU Pro
87.1%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Kimi K2.5 امتیاز 87.1% در این معیار کسب کرد.
SimpleQA
54%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Kimi K2.5 امتیاز 54% در این معیار کسب کرد.
IFEval
94%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Kimi K2.5 امتیاز 94% در این معیار کسب کرد.
AIME 2025
96.1%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Kimi K2.5 امتیاز 96.1% در این معیار کسب کرد.
MATH
98%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Kimi K2.5 امتیاز 98% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Kimi K2.5 امتیاز 99% در این معیار کسب کرد.
MGSM
96%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Kimi K2.5 امتیاز 96% در این معیار کسب کرد.
MathVista
84.2%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Kimi K2.5 امتیاز 84.2% در این معیار کسب کرد.
SWE-Bench
76.8%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Kimi K2.5 امتیاز 76.8% در این معیار کسب کرد.
HumanEval
99%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Kimi K2.5 امتیاز 99% در این معیار کسب کرد.
LiveCodeBench
85%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Kimi K2.5 امتیاز 85% در این معیار کسب کرد.
MMMU
84%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Kimi K2.5 امتیاز 84% در این معیار کسب کرد.
MMMU Pro
78.5%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Kimi K2.5 امتیاز 78.5% در این معیار کسب کرد.
ChartQA
77.5%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Kimi K2.5 امتیاز 77.5% در این معیار کسب کرد.
DocVQA
88.8%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Kimi K2.5 امتیاز 88.8% در این معیار کسب کرد.
Terminal-Bench
50.8%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Kimi K2.5 امتیاز 50.8% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Kimi K2.5 امتیاز 12% در این معیار کسب کرد.

درباره Kimi K2.5

درباره قابلیت‌های Kimi K2.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

مرزی نو در هوش عامل‌محور (Agentic Intelligence)

مدل Kimi K2.5 پرچمدار (flagship) مدل‌های عامل‌محور و متن‌باز (open-source) از شرکت Moonshot AI است که جهشی بزرگ در هوش چندوجهی (multimodal) یکپارچه محسوب می‌شود. این model بر پایه معماری عظیم ۱ تریلیون parameters از نوع Mixture-of-Experts (MoE) با ۳۲ میلیارد parameters فعال ساخته شده است و به طور بومی پردازش متن، تصویر و ویدیو را در یک چارچوب استدلالی واحد ادغام می‌کند. برخلاف LLMهای سنتی، K2.5 به طور اختصاصی برای اجرای خودمختار طراحی شده و دارای یک 'Thinking mode' منحصر‌به‌فرد است که به آن اجازه می‌دهد بدون دخالت انسان، اشتباهات خود را اصلاح کرده و مسائل پیچیده و چندمرحله‌ای را با استدلال حل کند.

نوآوری‌های معماری

این مدل ویژگی انقلابی جدیدی به نام 'Agent Swarm' را معرفی می‌کند که سیستم را قادر می‌سازد تا ۱۰۰ زیر-agent موازی را برای حل وظایف عظیم تحقیقاتی یا مهندسی هماهنگ کند. با دستیابی به عملکرد تراز اول در benchmarkهایی نظیر SWE-Bench و AIME 2025، مدل Kimi K2.5 به طور موثری فاصله بین مدل‌های متن‌باز و frontier AIهای تجاری را پر کرده و قابلیت‌های نخبگانی را با کسری از هزینه‌های عملیاتی ارائه می‌دهد. ادغام encoder مدل MoonViT-3D در آن، درک ویدیویی بی‌سابقه‌ای را فراهم می‌کند که چندین ساعت محتوا را با دقت زمانی بالا پوشش می‌دهد.

کارایی بی‌رقیب

فراتر از قدرت خام، K2.5 بر اقتصاد پایدار token تمرکز دارد. با بهره‌گیری از context caching تهاجمی و ساختار بهینه‌سازی شده MoE، این مدل عملکردی هم‌تراز با گران‌ترین مدل‌های تجاری ارائه می‌دهد، در حالی که قیمت بسیار رقابتی ۰.۶۰ دلار به ازای هر میلیون input tokens را حفظ کرده است. این ویژگی، K2.5 را به زیرساختی ایده‌آل برای سازمان‌هایی تبدیل می‌کند که به دنبال پیاده‌سازی agentهای خودمختار پیچیده با context طولانی در مقیاس بالا هستند.

Kimi K2.5

موارد استفاده برای Kimi K2.5

روش‌های مختلف استفاده از Kimi K2.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودمختار

حل مسائل پیچیده GitHub و شبیه‌سازی کامل وب‌سایت‌ها (full-stack) تنها از روی طرح‌های بصری UI.

حل ریاضیات در سطح المپیاد

حل اثبات‌های ریاضی پیشرفته و مسائل سطح مسابقات با دقت بالای ۹۶٪ در آزمون AIME 2025.

Reasoning ویدیوهای طولانی

تحلیل و خلاصه کردن محتوای ویدیوهایی تا دو ساعت بدون از دست دادن context یا افت کیفیت زمانی.

Agentهای تحقیقاتی پویا

استفاده از 'Agent Swarm' برای انجام تحقیقات وب چندرشته‌ای و ترکیب داده‌ها از صدها منبع به صورت موازی.

تولید Frontend زیبا

تبدیل وایرفریم‌های دستی یا اسکرین‌شات‌های UI به کد React کاربردی و صیقل‌خورده با انیمیشن‌های جذاب.

کنترل خودمختار ترمینال

اجرای دستورات پیچیده bash و عملیات سطح سیستم برای مدیریت کلاسترهای سرور و محیط‌های توسعه.

نقاط قوت

محدودیت‌ها

Reasoning ریاضیاتی تراز اول: با کسب امتیاز ۹۶.۱٪ در AIME 2025، تقریباً از تمام مدل‌های تجاری در استنتاج منطقی محض پیشی می‌گیرد.
نیاز شدید به سخت‌افزار: اجرای کامل این model با ۱ تریلیون parameters به صورت محلی، نیازمند کلاستر AI در سطح سازمانی با چندین GPU از نوع H100 یا B200 است.
موازی‌سازی عظیم: قابلیت 'Agent Swarm' اجازه فعالیت همزمان بیش از ۱۰۰ زیر-agent را می‌دهد که زمان انجام پروژه‌های تحقیقاتی را به شدت کاهش می‌دهد.
Latency در حالت تفکر: فعال کردن حالت deep reasoning زمان پاسخ‌دهی (time-to-first-token) را نسبت به پردازش استاندارد به طور قابل توجهی افزایش می‌دهد.
معماری Multimodal یکپارچه: پردازش بومی ویدیوهای ۲ ساعته و تصاویر با رزولوشن بالا بدون نیاز به vision encoders مجزا.
شکاف دانشی در سطح PhD: امتیاز ۵۰.۲٪ در آزمون 'Humanity's Last Exam' نشان می‌دهد که هنوز در تخصص‌های علمی سطح بالا جای بهبود دارد.
اقتصاد Token تهاجمی: با قیمت ۰.۶۰ دلار به ازای هر ۱ میلیون input tokens، حدود ۸ تا ۱۰ برابر ارزان‌تر از frontier modelهای مشابه مانند Claude 4.5 است.
ملاحظات نظارتی: به عنوان یک مدل چینی، استفاده از API و حاکمیت داده‌ها ممکن است برای شرکت‌های غربی تابع چارچوب‌های مقرراتی متفاوتی باشد.

شروع سریع API

fireworks/kimi-k2p5

مشاهده مستندات
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Kimi K2.5 چه می‌گویند

ببینید جامعه درباره Kimi K2.5 چه فکر می‌کند

"قابلیت‌های reasoning در AIME 2025 برای یک open model واقعاً خیره‌کننده است."
LogicLover
reddit
"مدل Kimi K2.5 استانداردهای جدیدی برای درک ویدیوهای طولانی تعیین کرد. بالاخره مدلی آمد که ابتدای کلیپ را فراموش نمی‌کند."
AI_Pioneer
x
"استفاده از K2.5 به عنوان یک coding agent بازی را عوض می‌کند. امتیاز SWE-Bench آن فقط یک عدد نیست، می‌توانید مهارتش را حس کنید."
DevGuru
hackernews
"چین Kimi K2.5 را عرضه کرد و مثل ساعت، عملکردش با frontier modelهای آمریکایی برابری می‌کند."
BasedTorba
x
"مدل Kimi از چین رویای تجاری تریلیون دلاری OpenAI را نابود کرد... ۸ برابر ارزان‌تر."
nrqa__
x
"مدل Kimi K2.5 اولین مدلی است که واقعاً حس یک co-pilot را می‌دهد، نه فقط یک چت‌باکس ساده."
CodeWizard
reddit

ویدیوهای درباره Kimi K2.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Kimi K2.5 را تماشا کنید

در تست مسائل AIME، مدل Kimi K2.5 تقریباً همه چیز را درست حل کرد، حتی مسائلی که GPT-4o در آن‌ها مشکل داشت.

برای وظایف coding، قابلیت‌های agentic جایی است که این model در مقایسه با LLMهای استاندارد می‌درخشد.

ماهیت open-source یک مدل با یک تریلیون parameters مانند این، در بازار فعلی بی‌سابقه است.

در تست‌های اولیه ریاضی من، پردازش منطقی را می‌بینید که با o1 رقابت می‌کند.

قیمت‌گذاری token آنقدر پایین است که عملاً دلیل استفاده از مدل‌های بسته و تجاری برای کارهای پایه را از بین می‌برد.

توانایی پردازش ویدیوهای دو ساعته در یک مرحله بدون از دست دادن context، یک پیشرفت بزرگ است.

این فقط یک مدل چت نیست؛ از ابتدا برای استفاده از ابزارها و ترمینال طراحی شده است.

وقتی حالت Swarm را فعال می‌کنید، موازی‌سازی برای تحقیقات وب اساساً بی‌رقیب است.

این Moonshot AI است که به دنیا اعلام می‌کند قدرت پردازشی و استعداد لازم را در اختیار دارد.

دیدن اینکه چگونه در یک ترمینال زنده برای رفع باگ جستجو می‌کند، آینده مهندسی خودمختار است.

جهش Kimi K2.5 در benchmark آزمون BrowseComp نشان می‌دهد که می‌تواند با سطحی از پشتکار در وب جستجو کند که قبلاً ندیده‌ایم.

اینکه حالت‌های vision و thinking در یک معماری واحد ادغام شده‌اند، داستان اصلی معماری این مدل است.

عملکرد در MMLU و GSM8k ثابت می‌کند که کیفیت داده‌های استفاده شده برای آموزش در بالاترین سطح بوده است.

برخلاف نسخه‌های قبلی، درک ویدیو در اینجا از افت کیفیت زمانی رنج نمی‌برد.

اگر توسعه‌دهنده هستید، سازگاری با OpenAI باعث می‌شود سوئیچ کردن به این model برای تست تقریباً بدون دردسر باشد.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای برای Kimi K2.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Kimi K2.5 و دستیابی به نتایج بهتر.

بهره‌گیری از Thinking Mode

به طور صریح در prompt از عبارت 'Think step-by-step' استفاده کنید تا حالت reasoning مدل برای وظایف سنگین ریاضی یا coding فعال شود.

مزیت Context ویدیویی

از encoder مدل MoonViT-3D برای پردازش ویدیوهای بسیار طولانی استفاده کنید؛ این مدل در یافتن جزئیات خاص در کلیپ‌های ۲ ساعته عالی عمل می‌کند.

هماهنگ‌سازی Agentها

برای پروژه‌های بزرگ، از قابلیت swarm استفاده کنید تا K2.5 وظایف را به زیر-وظایف کوچک‌تر تقسیم کرده و با سرعت بیشتری اجرا کند.

صرفه‌جویی با Cache Hit

ساختار فراخوانی‌های API خود را طوری تنظیم کنید که از سیستم context caching تهاجمی Moonshot بهره ببرید تا هزینه‌های ورودی تا ۷۵٪ کاهش یابد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

سوالات متداول درباره Kimi K2.5

پاسخ سوالات رایج درباره Kimi K2.5 را بیابید