moonshot

Kimi K2.5

مدل Kimi K2.5 از Moonshot AI را کشف کنید؛ یک مدل agentic با یک تریلیون پارامتر که دارای قابلیت‌های multimodal بومی، context window ۲۶۲ هزارتایی و reasoning در...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi۲۷ ژانویه ۲۰۲۶
پنجره زمینه
256Kتوکن
حداکثر خروجی
66Kتوکن
قیمت ورودی
$0.60/ 1M
قیمت خروجی
$3.00/ 1M
حالت:TextImageVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87.6%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Kimi K2.5 امتیاز 87.6% در این معیار کسب کرد.
HLE
50.2%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Kimi K2.5 امتیاز 50.2% در این معیار کسب کرد.
MMLU
91.5%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Kimi K2.5 امتیاز 91.5% در این معیار کسب کرد.
MMLU Pro
87.1%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Kimi K2.5 امتیاز 87.1% در این معیار کسب کرد.
SimpleQA
48%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Kimi K2.5 امتیاز 48% در این معیار کسب کرد.
IFEval
85%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Kimi K2.5 امتیاز 85% در این معیار کسب کرد.
AIME 2025
96.1%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Kimi K2.5 امتیاز 96.1% در این معیار کسب کرد.
MATH
90.1%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Kimi K2.5 امتیاز 90.1% در این معیار کسب کرد.
GSM8k
97.1%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Kimi K2.5 امتیاز 97.1% در این معیار کسب کرد.
MGSM
95%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Kimi K2.5 امتیاز 95% در این معیار کسب کرد.
MathVista
90.1%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Kimi K2.5 امتیاز 90.1% در این معیار کسب کرد.
SWE-Bench
76.8%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Kimi K2.5 امتیاز 76.8% در این معیار کسب کرد.
HumanEval
88%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Kimi K2.5 امتیاز 88% در این معیار کسب کرد.
LiveCodeBench
85%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Kimi K2.5 امتیاز 85% در این معیار کسب کرد.
MMMU
78.5%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Kimi K2.5 امتیاز 78.5% در این معیار کسب کرد.
MMMU Pro
78.5%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Kimi K2.5 امتیاز 78.5% در این معیار کسب کرد.
ChartQA
77.5%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Kimi K2.5 امتیاز 77.5% در این معیار کسب کرد.
DocVQA
88.8%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Kimi K2.5 امتیاز 88.8% در این معیار کسب کرد.
Terminal-Bench
50.8%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Kimi K2.5 امتیاز 50.8% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Kimi K2.5 امتیاز 12% در این معیار کسب کرد.

درباره Kimi K2.5

درباره قابلیت‌های Kimi K2.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

مدل Kimi K2.5 یک مدل multimodal با کد‌باز (open-source) از شرکت Moonshot AI است. این مدل از معماری Mixture-of-Experts با یک تریلیون پارامتر استفاده می‌کند که در آن ۳۲ میلیارد پارامتر به ازای هر token فعال هستند. این سیستم، پردازش متن، تصویر و ویدیو را از طریق یک چارچوب reasoning واحد یکپارچه می‌کند و به جای استفاده از encoderهای خارجی جداگانه برای هر modality، عمل می‌کند. این معماری به مدل اجازه می‌دهد تا ۲۵۶,۰۰۰ token از context را مدیریت کرده و در عین حال دقت بازیابی و ثبات منطقی را در توالی‌های بسیار طولانی حفظ کند.

این مدل با قابلیت Agent Swarm متمایز می‌شود. این ویژگی به سیستم اجازه می‌دهد تا تا ۱۰۰ sub-agent موازی را برای اجرای وظایف تحقیق یا مهندسی پیچیده به طور همزمان هماهنگ کند. با ادغام یک encoder MoonViT-3D با ۴۰۰ میلیون پارامتر، K2.5 می‌تواند ساعت‌ها محتوای ویدیویی را با دقت زمانی تحلیل کند. این مدل به‌طور خاص برای اجرای خودکار طراحی شده و در benchmarkهای agentic مانند SWE-Bench و BrowseComp از بسیاری از مدل‌های اختصاصی پیشی گرفته است.

Kimi K2.5 یک حالت Thinking اختصاصی برای وظایفی که نیاز به منطق عمیق دارند ارائه می‌دهد. هنگامی که این حالت فعال می‌شود، مدل یک زنجیره استدلالی داخلی تولید می‌کند تا قبل از ارائه پاسخ نهایی، مراحل را اصلاح و تأیید کند. این ویژگی آن را برای ریاضیات در سطح مسابقات و توسعه نرم‌افزار در مقیاس بزرگ بسیار مؤثر می‌کند. اقتصاد توکن آن برای پیاده‌سازی‌های سازمانی بهینه شده است و هوشی در سطح frontier را با کسری از هزینه سیستم‌های رقیب closed-source ارائه می‌دهد.

Kimi K2.5

موارد استفاده برای Kimi K2.5

روش‌های مختلف استفاده از Kimi K2.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودکار

حل مسائل پیچیده در GitHub و ساخت معماری پروژه‌های چند‌فایلی با استفاده از منطق بهینه‌شده بر اساس SWE-Bench.

توسعه وب بصری

ایجاد کدهای کاربردی برای فرانت‌اند و طراحی رابط کاربری مستقیماً از روی ضبط صفحه نمایشِ تعاملات وب‌سایت‌های موجود.

تحقیقات چند‌رشته‌ای

استفاده از Agent Swarm برای جستجو و سنتز اطلاعات از بیش از ۱۰۰ منبع در یک گردش کار موازی واحد.

تحلیل ویدیوهای طولانی

استخراج رویدادهای خاص و داده‌های زمانی از ساعت‌ها فیلم امنیتی یا سخنرانی بدون نیاز به ابزارهای استخراج فریم.

تولید اثبات‌های ریاضی

به‌کارگیری حالت deep thinking برای حل مسائل ریاضی در سطح المپیاد با نرخ دقت ۹۶ درصد.

اتوماسیون اسناد سازمانی

تولید گزارش‌های PDF چند‌صفحه‌ای و صفحات گسترده مالی پیچیده از منابع داده‌های کسب‌وکار غیرساختاریافته.

نقاط قوت

محدودیت‌ها

عملکرد ممتاز Agentic: کسب امتیاز ۷۶.۸ در SWE-Bench Verified، که در وظایف مهندسی نرم‌افزار از بسیاری از مدل‌های اختصاصی و frontier پیشی می‌گیرد.
نیاز شدید به VRAM برای اجرای محلی: نیاز به ۶۳۲ گیگابایت VRAM برای مدل کامل و فشرده‌نشده، که پیاده‌سازی محلی را برای اکثر کاربران خانگی غیرممکن می‌کند.
اقتصاد توکن بی‌رقیب: ارائه هوش MoE با یک تریلیون پارامتر با قیمت ۰.۶۰ دلار به ازای هر میلیون token ورودی، که حدود ۱۰ درصد هزینه Claude Opus است.
تأخیر بالاتر در reasoning: حالت Thinking می‌تواند تأخیر قابل توجهی ایجاد کند، چرا که مدل قبل از پاسخ‌دهی، زنجیره‌های منطقی داخلی تولید می‌کند.
درک بومی ویدیو: پردازش فایل‌های ویدیویی پیچیده بدون نیاز به استخراج فریم خارجی، که امکان تحلیل زمانی دقیق از فیلم‌های طولانی را فراهم می‌کند.
تکرار در قالب‌بندی: ممکن است دیواره‌های متنی بیش از حد طولانی ایجاد کند، مگر اینکه به طور جدی برای استفاده از ساختارهای پاراگراف خاص هدایت شود.
ارکستراسیون موازی Swarm: تنها مدل open که برای هماهنگی تا ۱۰۰ sub-agent جهت گردش‌های کاری عظیم و چند‌رشته‌ای آموزش دیده است.
نگرانی‌های مربوط به محل ذخیره‌سازی داده‌ها: زیرساخت اصلی در چین مستقر است که ممکن است برای برخی از شرکت‌های غربی مسائل مربوط به تطبیق‌پذیری (compliance) ایجاد کند.

شروع سریع API

fireworks/kimi-k2p5

مشاهده مستندات
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Kimi K2.5 چه می‌گویند

ببینید جامعه درباره Kimi K2.5 چه فکر می‌کند

هزینه Kimi K2.5 تقریباً ۱۰ درصد هزینه Opus است، در حالی که عملکرد مشابهی دارد.
Odd_Tumbleweed574
reddit
مردم فراموش کرده‌اند که Nvidia ۶۰۰ میلیارد دلار ارزش خود را از دست داد وقتی یک آزمایشگاه چینی چیزی بزرگ را open source کرد. Kimi با هوش frontier دوباره این کار را انجام می‌دهد.
chetaslua
twitter
مفهوم Attention Residuals در K2.5 اولین تغییر معماری در سال‌های اخیر است که واقعاً مشکل فراموشی را در LLM برطرف می‌کند.
logic_king
hackernews
Workers AI اکنون مدل‌های بزرگ را اجرا می‌کند. Kimi K2.5 اولین است. این یکی از بهترین مدل‌های open source موجود است که برای برنامه‌نویسی هم بسیار عالی است.
dok2001
twitter
Kimi K2.5 یک هیولای متفاوت است. یک مدل RP فوق‌العاده باهوش است، اما اگر از پیش‌تنظیم‌های (presets) جامعه استفاده نکنید، ممکن است رفتارهای عصبی نشان دهد.
dptgreg
reddit
من گردش کار GPT 4 خود را با Kimi K2.5 جایگزین کردم زیرا حالت thinking شفاف‌تر است و context window کل مخزن (repo) من را پوشش می‌دهد.
Dev_Max
reddit

ویدیوهای درباره Kimi K2.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Kimi K2.5 را تماشا کنید

مدل Kimi K2.5 با قدرت thinking بالا، GPT 5.2 را شکست داده و عملاً سایر مدل‌های Frontier را کنار زده است.

این قوی‌ترین مدل برنامه‌نویسی open-source تا به امروز با امتیاز ۷۶.۸ در SWE verified است.

قابلیت Agent swarm تغییری از مدل تک‌عامله به مدل چند‌عامله است که گردش‌های کاری موازی را در ۱۵۰۰ مرحله هماهنگ‌شده اجرا می‌کند.

ظرفیت context window در این مدل با ۲۵۶ هزار token بسیار عظیم است که برای اکثر پروژه‌ها کافی است.

شرکت Moonshot در اوایل سال ۲۰۲۶ واقعاً در حال جابه‌جا کردن مرزهای کارهای قابل انجام با open weights است.

این مدل به‌خوبی زیبایی‌شناسی طراحی اپل را درک کرد و تنها از روی یک ویدیو، وب‌سایتی زیبا با انیمیشن‌های جذاب تولید کرد.

قابلیت Swarm بسیار جذاب به نظر می‌رسد و استفاده از آن سرگرم‌کننده است چون به هر sub-agent نشان شناسایی اختصاص می‌دهد.

مدل K2.5 با قیمت ۶۰ سنت برای هر میلیون token ورودی و ۳ دلار برای هر میلیون token خروجی، بسیار ارزان‌تر است.

پردازش بومی ویدیو به این معناست که نیازی به استفاده از ابزارهای خارجی گران‌قیمت برای پردازش فریم‌ها ندارید.

این مدل برای توسعه‌دهندگانی که به مدل‌های agentic با بودجه محدود نیاز دارند، یک تحول اساسی است.

تیم Moonshot این کار را با ارائه پاداش به هر sub-agent در مراحل بحرانی جداگانه انجام داده تا از فروپاشی سریالی جلوگیری کند.

مدل یاد می‌گیرد که موازی‌سازی را تنها زمانی انتخاب کند که مسیر بحرانی را کوتاه کند، که نوآوری بسیار هوشمندانه‌ای است.

Kimi K2.5 تقریباً در مرز اجرای روی سخت‌افزارهای خانگی با استفاده از GGUF قرار دارد.

حالت thinking برای حل خطاهای منطقی پیچیده در پایتون فوق‌العاده قوی است.

انتشار چنین مدلی با یک تریلیون پارامتر برای جامعه open-source بسیار بزرگ است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Kimi K2.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Kimi K2.5 و دستیابی به نتایج بهتر.

فعال‌سازی حالت Thinking

پارامتر thinking را در درخواست API خود ارسال کنید تا به حداکثر دقت در مسائل ریاضی و برنامه‌نویسی برسید.

راه‌اندازی Agent Swarm

به مدل دستور دهید برای کارهای پژوهشی از یک swarm استفاده کند تا ارکستراسیون موازی بین sub-agentها برقرار شود.

بهینه‌سازی Temperature

برای حالت thinking از temperature برابر با ۱.۰ استفاده کنید تا امکان reasoning متنوع فراهم شود، اما برای چت استاندارد آن را روی ۰.۶ تنظیم کنید.

پرامپت‌های ترکیبی متن-تصویر

اسکرین‌شات‌های خطا را در کنار قطعه‌کدهای خود آپلود کنید تا از آموزش یکپارچه text-vision این مدل بهره‌مند شوید.

Context Caching

برای اسناد طولانی تکراری از context caching استفاده کنید تا هزینه‌های ورودی تا ۹۰ درصد کاهش یابد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

سوالات متداول درباره Kimi K2.5

پاسخ سوالات رایج درباره Kimi K2.5 را بیابید

Kimi K2.5: مدل Agent Swarm با یک تریلیون پارامتر و هزینه ۰.۶۰ دلار برای هر میلیون token ورودی