moonshot

Kimi K2 Thinking

Kimi K2 Thinking مدل reasoning یک تریلیون پارامتری Moonshot AI است. این مدل با عملکرد بهتر از GPT-5 در HLE، به صورت خودکار ۳۰۰ فراخوانی ابزار متوالی را...

moonshot logomoonshotKimi K2۶ نوامبر ۲۰۲۵
پنجره زمینه
256Kتوکن
حداکثر خروجی
16Kتوکن
قیمت ورودی
$0.15/ 1M
قیمت خروجی
$0.15/ 1M
حالت:Text
قابلیت‌ها:ابزارهااستریمینگاستدلال
معیارها
GPQA
93%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Kimi K2 Thinking امتیاز 93% در این معیار کسب کرد.
HLE
44.9%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Kimi K2 Thinking امتیاز 44.9% در این معیار کسب کرد.
MMLU
90%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Kimi K2 Thinking امتیاز 90% در این معیار کسب کرد.
MMLU Pro
78%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Kimi K2 Thinking امتیاز 78% در این معیار کسب کرد.
SimpleQA
55%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Kimi K2 Thinking امتیاز 55% در این معیار کسب کرد.
IFEval
92%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Kimi K2 Thinking امتیاز 92% در این معیار کسب کرد.
AIME 2025
99.1%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Kimi K2 Thinking امتیاز 99.1% در این معیار کسب کرد.
MATH
99.1%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Kimi K2 Thinking امتیاز 99.1% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Kimi K2 Thinking امتیاز 99% در این معیار کسب کرد.
MGSM
95%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Kimi K2 Thinking امتیاز 95% در این معیار کسب کرد.
MathVista
75%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Kimi K2 Thinking امتیاز 75% در این معیار کسب کرد.
SWE-Bench
71.3%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Kimi K2 Thinking امتیاز 71.3% در این معیار کسب کرد.
HumanEval
83%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Kimi K2 Thinking امتیاز 83% در این معیار کسب کرد.
LiveCodeBench
83.1%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Kimi K2 Thinking امتیاز 83.1% در این معیار کسب کرد.
MMMU
80%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Kimi K2 Thinking امتیاز 80% در این معیار کسب کرد.
MMMU Pro
60%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Kimi K2 Thinking امتیاز 60% در این معیار کسب کرد.
ChartQA
88%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Kimi K2 Thinking امتیاز 88% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Kimi K2 Thinking امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Kimi K2 Thinking امتیاز 55% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Kimi K2 Thinking امتیاز 12% در این معیار کسب کرد.

درباره Kimi K2 Thinking

درباره قابلیت‌های Kimi K2 Thinking، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Mixture of Experts با یک تریلیون پارامتر

Kimi K2 Thinking یک مدل reasoning با یک تریلیون parameters است که از معماری Mixture-of-Experts (MoE) استفاده می‌کند. این مدل که توسط Moonshot AI توسعه یافته و در اواخر سال ۲۰۲۵ منتشر شد، تنها ۳۲ میلیارد parameters را برای inference فعال می‌کند که ظرفیت دانش عظیم را با بهره‌وری محاسباتی متعادل می‌سازد. این مدل به‌طور خاص به عنوان یک agent فکری طراحی شده است که محاسبات خود را در فاز inference برای حل مسائل منطقی پیچیده مقیاس‌بندی می‌کند. این رویکرد به مدل اجازه می‌دهد تا قبل از ارائه پاسخ نهایی، بر reasoning خود تامل کرده و اشتباهات را اصلاح کند.

استفاده از ابزار و برنامه‌ریزی Agentic

این مدل با قابلیت انجام خودکار ۳۰۰ فراخوانی ابزار متوالی، خود را متمایز می‌کند. در حالی که اکثر مدل‌های زبانی استاندارد در برنامه‌ریزی‌های طولانی‌مدت مشکل دارند، K2 Thinking برای جریان‌های کاری agentic مانند مرور خودکار وب و مهندسی نرم‌افزار چندمرحله‌ای مهندسی شده است. این مدل به‌صورت بومی از دقت INT4 از طریق Quantization-Aware Training پشتیبانی می‌کند و به آن اجازه می‌دهد عملکرد سطح frontier را ضمن اجرا بر روی خوشه‌های سخت‌افزاری استاندارد حفظ کند.

تمرکز بر توسعه‌دهنده و تحقیق

با کانتکست ویندو ۲۵۶ هزار توکنی، این مدل برای تحقیقات عمیق و وظایف فنی پیچیده ساخته شده است. این مدل شکاف عملکردی بین سیستم‌های بسته و مدل‌های open-weights را پر می‌کند. توانایی آن در پاسخ به سوالات علمی در سطح دکتری و مسائل ریاضی رقابتی، آن را به انتخابی مناسب برای تحقیقات آکادمیک، دستیاران کدنویسی خودکار و برنامه‌های reasoning با وفاداری بالا که در آن‌ها ثبات منطقی نیاز اصلی است، تبدیل می‌کند.

Kimi K2 Thinking

موارد استفاده برای Kimi K2 Thinking

روش‌های مختلف استفاده از Kimi K2 Thinking برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار پیچیده

حل مسائل واقعی GitHub و طراحی ساختار کدبیس‌های چند فایلی با استفاده از خوداصلاحی تکرار شونده.

Agentهای تحقیقاتی خودکار

اجرای صدها فراخوانی ابزار متوالی برای گردآوری و ترکیب داده‌های فنی پیچیده.

ریاضیات در سطح المپیاد

حل مسائل پیشرفته هندسه و جبر با استفاده از تأیید عمیق chain-of-thought.

تحقیقات علمی در سطح دکتری

پاسخ به سوالات تخصصی در فیزیک و زیست‌شناسی که نیازمند استنتاج منطقی چندمرحله‌ای است.

کنترل تعاملی کامپیوتر

هدایت محیط‌های ترمینال و زیرساخت‌های ابری برای خودکارسازی جریان‌های کاری devops.

نویسندگی خلاقانه مبتنی بر منطق

تولید محتوای طولانی که نیازمند رعایت دقیق قوانین پیچیده دنیای داستانی است.

نقاط قوت

محدودیت‌ها

Reasoning در سطح state-of-the-art: کسب امتیاز ۴۴.۹٪ در HLE با استفاده از ابزارها، که از مدل‌های بزرگ بسته در منطق تخصصی پیشی می‌گیرد.
نیازمندی‌های سخت‌افزاری عظیم: inference محلی حتی با کوانتایزیشن، به حداقل ۲۴۵ گیگابایت VRAM نیاز دارد که استفاده از آن را محدود به خوشه‌های سرور سطح بالا می‌کند.
عمق Agentic استثنایی: توانایی انجام ۳۰۰ فراخوانی ابزار متوالی که امکان تحقیقات وب و وظایف مرورگر کاملاً خودمختار را فراهم می‌کند.
تاخیر ذاتی در پاسخ‌دهی: فرآیند تفکر عمیق باعث ایجاد زمان‌های انتظار قابل توجهی می‌شود زیرا مدل مقیاس محاسبات test-time خود را افزایش می‌دهد.
دقت ریاضی تراز اول: دستیابی به ۹۴.۵٪ در AIME 2025 که قابلیت اطمینان آن را برای حل مسائل ریاضی سطح بالا ثابت می‌کند.
عدم وجود قابلیت Multimodal بومی: این نسخه نمی‌تواند ورودی‌های تصویر یا ویدیو را مستقیماً پردازش کند و برای وظایف multimodal به یک مدل vision جداگانه نیاز دارد.
دسترسی به وزن‌های باز (Open-Weights): ارائه هوشمندی در سطح frontier به جامعه توسعه‌دهندگان برای استقرار محلی و fine-tuning.
هزینه توکن بالا: مراحل reasoning داخلی تعداد زیادی توکن خروجی مصرف می‌کنند که باعث افزایش هزینه‌های API برای پرسش‌های ساده می‌شود.

شروع سریع API

moonshot/kimi-k2-thinking

مشاهده مستندات
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [{ role: 'user', content: 'Design a system for autonomous code review using 300 tool calls.' }],
  });
  console.log(response.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Kimi K2 Thinking چه می‌گویند

ببینید جامعه درباره Kimi K2 Thinking چه فکر می‌کند

Kimi K2.5 بهترین مدل باز برای کدنویسی است، واقعاً شاهکار کرده‌اند.
npc_gooner
reddit
Moonshot AI همین الان Kimi K2 Thinking را منتشر کرد. ۳۰۰ فراخوانی ابزار متوالی؟ این آینده هوش مصنوعی agentic است.
@tech_trends
twitter
Kimi مدل Kimi K2 Thinking را منتشر کرد، یک مدل reasoning تریلیون پارامتری open-source. این یک معامله واقعی است.
nekofneko
reddit
این واقعیت که می‌تواند ۳۰۰ فراخوانی ابزار را به صورت متوالی انجام دهد، جریان‌های کاری جدیدی برای agentها ایجاد می‌کند.
AI Explained
youtube
دیدن یک مدل open-source که به این اعداد می‌رسد تأثیرگذار است. رویکرد مقیاس‌بندی test-time به وضوح در حال نتیجه دادن است.
jsmith23
hackernews
اجرای این مدل به صورت محلی یک چالش است، اما عمق reasoning آن شبیه هیچ‌چیز دیگری در فضای open-weights نیست.
LocalLlamaEnthusiast
reddit

ویدیوهای درباره Kimi K2 Thinking

آموزش‌ها، بررسی‌ها و بحث‌های درباره Kimi K2 Thinking را تماشا کنید

Kimi K2 Thinking بهترین مدل AI است که تا به حال استفاده کرده‌ام.

این مستقل‌ترین مدل agentic ساخته شده تا به امروز است. به این معنی که می‌تواند ساعت‌ها به تنهایی کار کند.

این مدل قادر است در هر مرحله فکر و تامل کند. بنابراین هرگز مسیر را گم نمی‌کند.

سرعت reasoning با وجود پارامترهای تریلیونی، به طرز شگفت‌آوری سریع است.

اگر در حال ساخت agentها هستید، این همان معماری‌ای است که باید به آن توجه کنید.

Kimi K2 Thinking... یک ارتقاء تفکری برای مدل Kimi K2 است که در واقع بسیار مورد توجه قرار گرفته است.

این البته یک مدل open-source است... با حجم کلی حدود ۱ تریلیون parameters.

تمام نتایج benchmark تحت دقت int4 گزارش شده‌اند.

این مدل مسائل ریاضی پیچیده را با سطحی از منطق حل می‌کند که با آزمایشگاه‌های برتر صاحب امتیاز رقابت می‌کند.

اگر VRAM کافی داشته باشید، فرآیند نصب وزن‌های محلی کاملاً سرراست است.

Kimi K2.5 جدیدترین مدل open-source توسعه‌یافته توسط یک شرکت چینی به نام Moonshot AI است.

این مدل قادر است تا ۱۰۰ زیر-agent و ۱۵۰۰ فراخوانی ابزار را به صورت همزمان اجرا کند.

اگر می‌خواهید یک وب‌سایت واقعاً زیبا بسازید، قطعاً آن را توصیه می‌کنم.

زنجیره تفکر (chain-of-thought) داخلی به آن اجازه می‌دهد قبل از ارائه پاسخ نهایی، خطاهای کد را اصلاح کند.

Moonshot در این نسخه خاص واقعاً بر برنامه‌ریزی بلندمدت تمرکز کرده است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Kimi K2 Thinking

نکات تخصصی برای کمک به شما در استفاده حداکثری از Kimi K2 Thinking و دستیابی به نتایج بهتر.

فعال‌سازی خروجی Thinking

از پرچم توکن‌های ویژه در موتور inference خود استفاده کنید تا مراحل reasoning داخلی مدل را مشاهده کنید.

بهینه‌سازی Temperature

برای داشتن یک جریان reasoning ثابت، temperature نمونه‌برداری را روی ۱.۰ و min_p را روی ۰.۰۱ تنظیم کنید.

استفاده از System Prompts

مکالمات را با prompt رسمی هویت Moonshot AI شروع کنید تا رفتار مدل تثبیت شود.

مقیاس‌بندی Test-Time Compute

به مدل اجازه دهید برای مسائل دشوارتر، توکن‌های داخلی بیشتری تولید کند تا دقت افزایش یابد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

سوالات متداول درباره Kimi K2 Thinking

پاسخ سوالات رایج درباره Kimi K2 Thinking را بیابید