moonshot

Kimi K2 Thinking

مدل Kimi K2 Thinking یک مدل reasoning با یک تریلیون پارامتر از شرکت Moonshot AI است. این مدل در benchmark اختصاصی HLE از GPT-5 پیشی گرفته و قادر است ۳۰۰...

moonshot logomoonshotKimi2025-11-06
پنجره زمینه
256Kتوکن
حداکثر خروجی
16Kتوکن
قیمت ورودی
$0.15/ 1M
قیمت خروجی
$0.15/ 1M
حالت:Text
قابلیت‌ها:ابزارهااستریمینگاستدلال
معیارها
GPQA
93%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Kimi K2 Thinking امتیاز 93% در این معیار کسب کرد.
HLE
44.9%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Kimi K2 Thinking امتیاز 44.9% در این معیار کسب کرد.
MMLU
90%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Kimi K2 Thinking امتیاز 90% در این معیار کسب کرد.
MMLU Pro
78%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Kimi K2 Thinking امتیاز 78% در این معیار کسب کرد.
SimpleQA
55%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Kimi K2 Thinking امتیاز 55% در این معیار کسب کرد.
IFEval
92%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Kimi K2 Thinking امتیاز 92% در این معیار کسب کرد.
AIME 2025
99.1%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Kimi K2 Thinking امتیاز 99.1% در این معیار کسب کرد.
MATH
99.1%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Kimi K2 Thinking امتیاز 99.1% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Kimi K2 Thinking امتیاز 99% در این معیار کسب کرد.
MGSM
95%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Kimi K2 Thinking امتیاز 95% در این معیار کسب کرد.
MathVista
75%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Kimi K2 Thinking امتیاز 75% در این معیار کسب کرد.
SWE-Bench
71.3%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Kimi K2 Thinking امتیاز 71.3% در این معیار کسب کرد.
HumanEval
83%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Kimi K2 Thinking امتیاز 83% در این معیار کسب کرد.
LiveCodeBench
83.1%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Kimi K2 Thinking امتیاز 83.1% در این معیار کسب کرد.
MMMU
80%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Kimi K2 Thinking امتیاز 80% در این معیار کسب کرد.
MMMU Pro
60%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Kimi K2 Thinking امتیاز 60% در این معیار کسب کرد.
ChartQA
88%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Kimi K2 Thinking امتیاز 88% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Kimi K2 Thinking امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Kimi K2 Thinking امتیاز 55% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Kimi K2 Thinking امتیاز 12% در این معیار کسب کرد.

درباره Kimi K2 Thinking

درباره قابلیت‌های Kimi K2 Thinking، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

هوش Open با یک تریلیون پارامتر

Kimi K2 Thinking یک مدل reasoning پیشگام با یک تریلیون parameters از شرکت Moonshot AI است که مرزهای هوش open-source را بازتعریف کرده است. این مدل که در نوامبر 2025 منتشر شد، از یک معماری پیشرفته Mixture-of-Experts (MoE) با مجموع 1T parameters استفاده می‌کند که تنها 32B آن برای inference فعال می‌شود؛ این ویژگی آن را همزمان بسیار قدرتمند و از نظر محاسباتی کارآمد می‌سازد. برخلاف مدل‌های زبانی استاندارد، K2 Thinking به عنوان یک "thinking agent" مهندسی شده است که محاسبات زمان تست را برای انجام reasoning منطقی عمیق، برنامه‌ریزی و استفاده خودمختار از ابزارها مقیاس‌بندی می‌کند.

توانمندی Agentic و مقیاس‌پذیری

این مدل به ویژه برای قابلیت‌های agentic خود مشهور است و با موفقیت تا 300 مورد tool calls متوالی را بدون دخالت انسان اجرا می‌کند. این امر آن را به گزینه‌ای ایده‌آل برای تحقیقات پیچیده، برنامه‌نویسی رقابتی و جریان‌های کاری فنی چندمرحله‌ای تبدیل می‌کند. با استفاده نیتیو از دقت INT4 از طریق Quantization-Aware Training، شرکت Moonshot AI امکان اجرای این مدل عظیم را روی کلاسترهای سخت‌افزاری در دسترس فراهم کرده، در حالی که در بنچمارک‌های حیاتی reasoning و جستجو، از غول‌های closed-source مانند GPT-5 و Claude 4.5 پیشی می‌گیرد.

معماری توسعه‌دهنده-محور

مدل Kimi K2-Thinking که برای جامعه جهانی توسعه‌دهندگان طراحی شده، شاخص‌های هزینه به عملکرد بی‌رقیبی را ارائه می‌دهد. با یک context window عظیم 256K و پشتیبانی از پردازش گسترده chain-of-thought، این مدل فاصله بین مدل‌های تخصصی محلی و APIهای ابری در سطح سازمانی را پر می‌کند. متدولوژی آموزش آن بر برنامه‌ریزی long-horizon تمرکز دارد که به مدل اجازه می‌دهد خروجی‌های خود را به صورت iterative بازتاب داده، اصلاح و بهینه‌سازی کند.

Kimi K2 Thinking

موارد استفاده برای Kimi K2 Thinking

روش‌های مختلف استفاده از Kimi K2 Thinking برای دستیابی به نتایج عالی را کشف کنید.

Autonomous Research

اجرای تحقیقات عمیق وب که نیازمند صدها tool calls متوالی و تایید اطلاعات به صورت iterative هستند.

حل مسائل علمی

پاسخگویی به پرسش‌های ریاضی و فیزیک در سطح دکتری با استفاده از اجرای ابزار Python و پردازش chain-of-thought.

برنامه‌نویسی رقابتی

حل چالش‌های الگوریتمی دشوار در پلتفرم‌هایی مانند Codeforces و LeetCode با دقت در سطح دکتری.

دیباگ کدهای پیچیده

شناسایی و رفع خطاهای منطقی در پایگاه‌های کد چندفایلی عظیم از طریق گام‌های reasoning طولانی و جامع.

تحلیل حقوقی و انطباق

بررسی اسناد فنی یا حقوقی طولانی در یک context window با ظرفیت 256K برای شناسایی ریسک‌ها یا تناقض‌های ظریف.

اتوماسیون Agentic AI

قدرت‌بخشی به agentهای خودمختار که می‌توانند برای ساعت‌ها بدون دخالت انسان برنامه‌ریزی کنند، عمل کنند، بازتاب دهند و خروجی‌های خود را اصلاح کنند.

نقاط قوت

محدودیت‌ها

عمق Agentic: تنها مدل open-weights که قادر به مدیریت 200 تا 300 مورد tool calls متوالی بدون افت عملکرد است.
ورودی فقط متنی: در حال حاضر فاقد پشتیبانی نیتیو multimodal برای پردازش مستقیم فایل‌های تصویری، ویدیویی یا صوتی است.
Reasoning پیشرو (State-of-the-Art): عملکردی فراتر از GPT-5 و Claude 4.5 در آزمون‌های Humanity's Last Exam (HLE) و BrowseComp از طریق مقیاس‌بندی فشرده در زمان تست.
نیاز به RAM بسیار بالا: استقرار local معماری کامل 1T به بیش از 500 گیگابایت RAM یا کلاسترهای توزیع‌شده Mac نیاز دارد.
به‌صرفه بودن بی‌رقیب: با قیمت ثابت 0.15 دلار به ازای هر 1M tokens، هوش سطح بالا را با کسری از هزینه APIهای اختصاصی ارائه می‌دهد.
Latency در اولین Token: فاز فشرده reasoning داخلی منجر به زمان طولانی‌تر برای تولید اولین token در مقایسه با LLMهای غیر reasoning می‌شود.
بهینه‌سازی نیتیو INT4: quantization نیتیو از طریق Quantization-Aware Training، سرعت inference محلی را در سخت‌افزارهای در دسترس تا 2 برابر افزایش می‌دهد.
اطناب در Reasoning: مدل ممکن است حتی برای پرسش‌های نسبتاً ساده، توالی‌های chain-of-thought بیش از حد طولانی ایجاد کند.

شروع سریع API

moonshot/kimi-k2-thinking

مشاهده مستندات
moonshot SDK
import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.ai/v1',
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning AI by Moonshot AI.' },
      { role: 'user', content: 'Solve the Riemann Hypothesis proof verification task.' }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Kimi K2 Thinking چه می‌گویند

ببینید جامعه درباره Kimi K2 Thinking چه فکر می‌کند

"Kimi K2 Thinking بهترین مدل هوش مصنوعی است که تا به حال استفاده کرده‌ام... بدون توهم و با صدها tool calls."
Alex Finn
youtube
"شکاف بین مدل‌های closed و open همچنان در حال کاهش است، حتی در حالی که هزینه tokens در حال فروپاشی است."
Emad Mostaque
x
"مدل Moonshot K2-Thinking با 300 مورد tool calls، مفهوم agentهای هوشمند محلی را دوباره تعریف می‌کند."
Brian Roemmele
x
"بالاخره مدلی که قبل از پاسخ دادن، واقعاً روی منطق prompt فکر می‌کند!"
ai_user_2025
reddit
"چین با سری Kimi واقعاً در حال جابجا کردن مرزهای open-source و open weights است."
Nathan Lambert
x
"عملکرد کاملاً خیره‌کننده در مسائل ریاضی رقابتی."
MathWizard
hackernews

ویدیوهای درباره Kimi K2 Thinking

آموزش‌ها، بررسی‌ها و بحث‌های درباره Kimi K2 Thinking را تماشا کنید

این مستقل‌ترین مدل agentic است که تا به حال ساخته شده.

این مدل قادر است در هر مرحله فکر کرده و بازتاب دهد، بنابراین هرگز مسیر را گم نمی‌کند.

بسیار مقرون‌به‌صرفه است... نصف قیمت ChatGPT-5 و حدود یک‌دهم قیمت Sonnet 4.5.

موفق می‌شود از تله‌های منطقی رایج در LLMهای استاندارد دوری کند.

Moonshot واقعاً بازی را در زمینه دسترسی به مدل‌های open-weight تغییر داده است.

می‌تواند تا 200 الی 300 مورد tool calls متوالی را بدون دخالت انسان اجرا کند.

K2 thinking به امتیاز 60.2% دست یافت که به طور قابل توجهی از خط پایه انسانی 29.2% در BrowseComp فراتر رفت.

چین واقعاً در حال پیشبرد مرزهای open-source و open weights است.

پیاده‌سازی Mixture-of-Experts در اینجا برای 1 تریلیون parameters فوق‌العاده کارآمد است.

شما عملاً با هزینه‌ای ناچیز به سطح اول از قدرت reasoning دسترسی پیدا می‌کنید.

من آن را اینجا روی یک Mac Studio با استفاده از محدودیت سیمی کنترل pseudo cis اجرا کرده‌ام.

ما در حال استفاده از 500 گیگابایت RAM هستیم. سرعت پردازش ما به حدود 6.9 tokens در ثانیه کاهش یافته است.

در واقع این کد را نوشت، اما متوقف نشد و دوباره شروع به فکر کردن کرد.

حتی با quantization، انسجام منطقی این مدل همچنان در سطح نخبگان باقی می‌ماند.

مونولوگ داخلی آن دقیقاً نشان می‌دهد که در کجا خطاهای کدنویسی خودش را اصلاح می‌کند.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای برای Kimi K2 Thinking

نکات تخصصی برای کمک به شما در استفاده حداکثری از Kimi K2 Thinking و دستیابی به نتایج بهتر.

فعال‌سازی Thinking Tags

هنگام اجرا به صورت local از طریق ابزارهایی مانند llama.cpp، حتماً از فلگ --special استفاده کنید تا <think> tokens داخلی به درستی رندر شوند.

بهینه‌سازی Temperature

برای دستیابی به پایدارترین و دقیق‌ترین نتایج reasoning، مقدار temperature را روی 1.0 و min_p را روی 0.01 تنظیم کنید.

کلاسترینگ سخت‌افزاری

برای تجربه local بدون افت کیفیت مدل 1T، نسخه INT4 quantized را روی کلاستری متشکل از دو Mac Studio M3 Ultra با قابلیت RDMA مستقر کنید.

برنامه‌ریزی Long-Horizon

promptها را به‌گونه‌ای ساختاردهی کنید که صراحتاً در ابتدا یک 'برنامه گام‌به‌گام' بخواهید تا نقاط قوت مدل در یادگیری تطبیقی و جستجو فعال شود.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

سوالات متداول درباره Kimi K2 Thinking

پاسخ سوالات رایج درباره Kimi K2 Thinking را بیابید